교안에 제시된 string - split()의 효율성 관련 질문드립니다.
302
작성한 질문수 4
안녕하세요, 큰돌님!
교안에서 제시된 내용을 기반으로 알고리즘 문제를 풀다가 궁금한 부분이 생겨 질문드렸습니다.
교안에서 제시된 문자열 - split 함수는 아래와 같습니다.
vector<string> split(string input, string delimiter)
{
vector<string> ret;
long long pos = 0;
string token = "";
while((pos = input.find(delimiter)) != string::npos)
{
token = input.substr(0, pos);
ret.push_back(token);
input.erase(0, pos + delimiter.length());
}
ret.push_back(input);
return ret;
}저는 위 함수를 응용하거나 문제를 해결하는데, 오늘 백준의 5430번 문제를 해결할 때도 위와 같은 로직의 코드를 작성하여 문자열 split을 시도하였습니다.
// I-2. 각 테스트 케이스의 첫째 줄에는 수행할 함수 p가 주어진다.
cin >> _p;
// I-3. 다음 줄에는 배열에 들어있는 수의 개수 n이 주어진다.
cin >> _n;
// I-4. 다음 줄에는 [x1, ... xn]과 같은 형태로 배열에 들어있는 정수가 주어진다.
cin >> _x;
string origin = _x.substr(1, _x.size() - 2);
vector<string> vs_x(_n);
if(origin.empty())
{
}
else
{
int pos = 0;
int cycle = 0;
while((pos = origin.find(',')) != string::npos)
{
string tmp = origin.substr(0, pos);
vs_x[cycle++] = tmp;
origin.erase(0, pos + 1);
}
vs_x[cycle] = origin;
} 코드에 대해 부연설명을 드리자면, 입력을 통해 문자열을 받게 되면, 해당 문자열의 첫번째와 마지막 인덱스를 제외한 문자열을 origin에 저장한 후, 이 문자열 origin을 컴마(,)를 기준으로 split 하였습니다. 예를 들어, [1, 2, 3]이라는 문자열을 입력(_x)으로 받았다면, 변수 origin에 1,2,3을 저장한 후 컴마를 기준으로 문자열을 split할 수 있습니다.
하지만, 위 코드와 함께 문제를 해결하고자 할 때, 지속적으로 시간 초과 문제가 발생하였습니다. 따라서 split 함수를 다음과 같은 로직으로 변경한 후 답안을 다시 제출하였으며, 그 결과 시간 초과가 발생하지 않고 문제를 해결할 수 있었습니다.
// I-2. 각 테스트 케이스의 첫째 줄에는 수행할 함수 p가 주어진다.
cin >> _p;
// I-3. 다음 줄에는 배열에 들어있는 수의 개수 n이 주어진다.
cin >> _n;
// I-4. 다음 줄에는 [x1, ... xn]과 같은 형태로 배열에 들어있는 정수가 주어진다.
cin >> _x;
string token = "";
vector<string> vs_x(_n);
int cycle = 0;
for(int j = 0; j < _x.length(); ++j)
{
if(isdigit(_x[j]))
{
token += _x[j];
}
else
{
if(!token.empty())
{
vs_x[cycle++] = token;
token = "";
}
}
} 제가 궁금한 것은 위에 제시된 split에 대한 두 개의 로직이 왜 효율성 차이가 나는지 잘 모르겠습니다.. origin.erase(0, pos + 1)이 O(n)의 시간 복잡도를 요구하면서, 첫 번째 로직은 O(n^2)의 시간 복잡도와 두 번째 로직은 O(n)의 시간 복잡도를 필요로 할 수도 있겠다는 생각이 들기도 하지만, 정확하게 어떤 부분이 큰 차이를 불러 일으키는지 잘 모르겠습니다. 감사합니다!
답변 2
1
안녕하세요 승훈님 ㅎㅎ 확인했습니다.
혹시 교안내의 더 빠른 split함수로 시도해보시겠어요?
앞서 설명한 split의 경우 매번 erase()를 하는 단점이 있습니다. 이를 제거해 좀 더 빠른 split() 코드는 다음과 같습니다. 만약 앞의 split()이 시간초과가 난다면 이 코드를 사용하시는게 좋습니다.
더 빠른 split
vector<string> split(const string& input, string delimiter) {
vector<string> result;
auto start = 0;
auto end = input.find(delimiter);
while (end != string::npos) {
result.push_back(input.substr(start, end - start));
start = end + delimiter.size();
end = input.find(delimiter, start);
}
result.push_back(input.substr(start));
return result;
}
제가 궁금한 것은 위에 제시된 split에 대한 두 개의 로직이 왜 효율성 차이가 나는지 잘 모르겠습니다..
>> erase()는 O(N)의 시간복잡도를 가기게 됩니다. 이부분 때문에 효율성 차이가 나는게 맞습니다.
감사합니다.
0
안녕하세요 승훈님 ㅎㅎ
split 사용하신 전체코드 부탁드립니다. ㅎ
감사합니다.
코딩살구클럽 입장이 안됩니다
0
12
1
4-F 경우의 수 질문입니다.
0
26
2
코딩살구클럽 가입이 안됩니다.
0
52
2
살구 클럽에 대한 질문있습ㄴ디ㅏ
0
40
1
교안 158페이지 문의드립니다
0
37
2
코딩살구클럽 관련 건의사항
0
97
1
코살에 19942 다이어트 문제에 N의 범위가 빠져있슴니다
0
40
1
진행 방법 질문드립니다!
0
72
2
2-I) 왜 이 문제가 그래프이론 카테고리에 있는지 잘 모르겠습니다.
0
61
2
2주차 개념#12 트리 순회
0
32
2
백준사이트가 종료된다고 합니다.
0
301
2
백준 서비스 종료
9
919
1
sk 하이닉스 코테 대비
0
378
2
3-G 최댓값 질문
0
52
1
모듈러 연산 값이 10이 아닌 경우도 있지 않나요?
0
84
2
3-I 코드 질문드립니다.
0
63
2
3-N 질문 있습니다.
0
68
2
학습방법
0
104
2
4-H 질문 있습니다 (코드 리뷰)
0
67
2
코딩테스트 어디까지 준비해야 하는지 질문이 있습니다.
0
178
2
2-O 반례가 무엇일지 어떤 부분이 틀렸는지 잘 모르겠습니다.
0
70
2
2주차 개념 #4-2. 인접행렬 질문있습니다.
0
65
2
1-A 문제풀이 후 궁금한 점이 생겨서 질문드립니다.
0
52
2
조합 재귀 풀이 확인 해주시면 감사하겠습니다.
0
70
2





