• 카테고리

    질문 & 답변
  • 세부 분야

    알고리즘 · 자료구조

  • 해결 여부

    미해결

split() 질문입니다.

24.05.07 21:44 작성 조회수 61

0

#include <bits/stdc++.h>
using namespace std;

vector<string> split(string input, string delimiter){
	vector<string> ret;
	long long pos = 0;
	string token = "";
	
	while((pos = input.find(delimiter)) != string::npos){
		token = input.substr(0,pos);
		ret.push_back(token);
		input.erase(0,pos+delimiter.length());
	}
	ret.push_back(input);
	
	return ret;
}

int main(){
	string s = "abcddabcddabcdabcabcdd", d = "d";
	vector<string> a = split(s,d);
	for (string b : a)
		cout << b << endl;
}

안녕하세요 선생님 수업 재밌게 듣고있습니다.
split함수도 잘 이해가 됐습니다. 그런데 질문 있습니다.
만약 제가 만든 문장으로 split을 하면 제 생각에 결과는
선생님이 알려주신 코드로 돌리면 {abc,"",abc,"",abc,abcabc} 가 나올것입니다.

왜냐면 코드상에서 빈 문자열이 되더라도 token을 ret에 삽입하고 있기 때문입니다.


그렇지만 제 생각에 올바르게 나오는것은 {abc,abc,abc,abcabc} 가 나와야 올바를것 같습니다.
split이라는 함수가 token이 빈 string이 되더라도 무조건 vector에 삽입하는게 옳지 않다고 생각하는데
어떻게 생각하시나요?

 

다음은 위 코드의 출력입니다.



이상입니다. 감사합니다.

답변 1

답변을 작성해보세요.

0

안녕하세요 현성님 ㅎㅎ

그렇지만 제 생각에 올바르게 나오는것은 {abc,abc,abc,abcabc} 가 나와야 올바를것 같습니다.
split이라는 함수가 token이 빈 string이 되더라도 무조건 vector에 삽입하는게 옳지 않다고 생각하는데
어떻게 생각하시나요?

>>

abcddabcddabcdabcabcdd

d

이걸 넣었을 때

{abc,abc,abc,abcabc}

이렇게 나와야 정상이라는 것이죠?

 

그렇게 생각할 수도 있습니다.

하지만 저런 split()과 같은 다른 언어에서도 많이 사용되는 공통 함수의 경우 로직 자체를 다른 언어 - split()함수와 동일한 결과값을 가지게 구축을 해야 합니다.

예를 들어 C++ 로 두 수를 비교해서 더 큰 결과값을 출력하는 max를 만든다면 다른 언어의 max()를 참고해서 만들 수 있겠죠?

저 또한 해당 함수를 만들 때 해당부분을 고려하면서 비교해가고 틀린점이 있나를 확인하며 만들었습니다.

 

자바스크립트의 경우 해당과 같이 split를 하면

const str = 'abcddabcddabcdabcabcdd';

const words = str.split('d');
console.log(words); 

[ 'abc', '', 'abc', '', 'abc', 'abcabc', '', '' ]

다음과 같이 되며 이는 다른 언어의 split()함수의 결과값도 동일합니다.

따라서 저렇게 빈문자열 등이 나오는게 맞습니다.



또 질문 있으시면 언제든지 질문 부탁드립니다.

좋은 수강평과 별점 5점은 제게 큰 힘이 됩니다. :)

감사합니다.

강사 큰돌 올림.


박갓님의 프로필

박갓

질문자

2024.05.07

아!! 그렇군요 선생님!!
빠른 답변 정말 감사드립니다!
그렇다면 split()을 이용할 때 빈 문자열이 포함될 수 있으니 그건 제가 따로 처리를 해야되겠군요!
완전 이해가 잘 됐습니다!
유튜브도 너무 재밌게 보고있습니다!
앞으로 학습 열심히해서 좋은 실력 갖춰보겠습니다. 감사합니다.