-
카테고리
-
세부 분야
보안
-
해결 여부
미해결
5분 초반대 즈음에
20.12.16 02:48 작성 조회수 178
0
uniq 는 연속된 중복되는 값들을 제거 라고 하셨는데
뒤에 -c를 붙이면 좌측에 중복 횟수가 나오잖아요
중복값을 제거했는데 왜 중복횟수가 나오는지 궁금합니다
제가 이해한거는
가령 값들이 a,b,c,d가 있는데
cat ./data.txt | sort | uniq 입력하면
aabbaaccddaaccddbb 이렇게 되있던거를
cat ./data.txt | sort | uniq -c를 입력함으로써
abacdacdb 이런식으로 연속중복을 날려버린다는 말씀인가요? 재밌지만 너무 어렵네요 ㅜ
답변을 작성해보세요.
0
장용하
지식공유자2020.12.16
안녕하세요.
정렬(sort)과 중복 제거(uniq)는 파일의 행 단위로 진행됩니다.
예를 들어, 어떤 파일에 아래와 같은 내용이 있다고 가정해보겠습니다.
< tmp.txt>
abcd
abcd
cdff
cdcd
cdff
이때 아래의 명령어를 사용하면 다음과 같이 표기됩니다.
$ cat tmp.txt | uniq -c
2 abcd
1 cdff
1 cdcd
1 cdff
abcd는 인접해있으면서 중복이기에 2회 존재한다고 표현되면서 한 줄만 출력되고,
cdff는 중복이지만 인접하지 않기에 각자 1회 존재한다고 출력됩니다.
참고가 되셨으면 좋겠습니다.
* 추가로, 가능하시다면 다음 번에는 네이버 카페 "취미로 해킹(bit.ly/취미로해킹)"의 질문 게시판을 이용하여 주시면 감사하겠습니다.
답변 1