키워드출력이 이상합니다..
55
작성한 질문수 2
키워드는 강의해주신 것처럼 아래와 같이 처리가 되어 있음에도 불구하고, 결과값이 ['NFT', 'cryptocurrency', 'collateral', 'personal property', 'AI', 'NFT', '물건', '동산', '가상화폐', '인공지능'] 으로 나옵니다. 이유가 뭘까요..
keywords = soup.select_one(".infoDetailL>ul>li:nth-of-type(7)>div").text.split(';')
keywords = [keyword.strip() for keyword in keywords]
답변 2
0
안녕하세요, 인프런 AI 인턴입니다. 규식님.
여러 키워드를 나누고 정리하는 과정에서 예상과 다른 결과를 얻고 계시군요. 데이터 크롤링에서 이렇게 다양한 키워드가 나타나는 문제는 크게 두 가지 요인에서 발생할 수 있습니다.
1. HTML 구조 문제
먼저, soup.select_one(".infoDetailL>ul>li:nth-of-type(7)>div") 이 CSS 선택자가 정확한 위치에서 데이터를 읽어오고 있는지 확인해야 합니다. 웹 페이지의 HTML 구조가 강의 당시와 달라졌거나, 위치가 변동되었을 수 있습니다. 해당 위치가 아닌 다른 곳에서 데이터가 읽혀오는 경우도 발생할 수 있기 때문에, HTML 페이지의 구조를 다시 확인해 주시기 바랍니다.
2. 데이터 처리 문제
코드에서 text.split(';') 로 문자열을 처리하고 계십니다. 여기서 데이터를 나누는 구분자가 올바른지 확인해 보세요. 예를 들어, 웹 페이지에서 키워드가 쉼표나 다른 문자를 기준으로 나뉘어 있을 수 있습니다. 다양하게 실험해보시고, 실제 나누고자 하는 기준을 재확인해 수정해 보세요.
유사한 질문과 해결을 참고하세요:
- 크롤링한 데이터가 변동된 경우 해결하는 방법: 크롤링 후 예상과 다른 형식의 데이터가 출력될 때, 선택자와 데이터 구조를 다시 확인하는 방법에 대해 다룹니다.
- 데이터 정리 및 처리 과정에 대한 질문: 데이터 처리에서 발생하는 문제를 해결하는 방법에 대한 유사한 질문입니다.
이러한 과정을 통해 문제를 해결하실 수 있기를 바랍니다. 추가적으로 HTML 페이지가 어떻게 구성되어 있는지(특히 키워드가 포함된 부분)의 세부사항을 확인하시면 문제 해결에 크게 도움이 될 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
셀레니움 환경설정 오류
0
52
2
네이버 로그인 관련
0
282
2
안녕하세요 셀레니움에 대해서 질문
0
89
1
크롤링 연습사이트 문의
0
102
2
선택자 질문
0
74
2
'특정 요소가 나타날 때까지 스크롤' 부분 에러
0
78
2
자동 로그인 질문
0
90
2
44강 제목, 링크
0
107
1
원하는 값이 없을 때
0
91
2
크롤링한 링크가 엑셀로 들어가면 작동이 안되요
0
230
2
셀레니움 PDF자료는 받을 수 있나요
0
100
2
글목록 추출하기
0
100
2
메일 자동화 로그인 중복방지문자해결 오류 및 명시적 대기 질문
0
91
2
강의 노트가 어디에 있는건가요?
0
80
2
강의 커리큘럼 질문
0
102
1
조건문 else 사용하지 않는 이유
0
77
2
셀레니움으로 접근할 수 없는 경우
0
97
2
웹페이지 변경
0
75
2
자바스크립트로 태그 선택 시 질문입니다.
1
65
2
수료증은 어떻게 받나요?
0
122
2
class명을 활용하여 선택자를 만들지 않는 경우..?
0
61
2
드라이버가 안 열려요
0
79
2
이거 해결방법 아시는 분?
0
121
2
네이버 지식인 크롤링..
0
202
2





