작성
·
322
답변 2
0
0
안녕하십니까, 인사이저입니다.
질문에 답변드리겠습니다.
해당 숫자는 저희가 임의로 넣은 값들로, 제공해드렸던 약 29000개의 데이터에서 5개를 추려낸 것입니다.
즉 데이터의 인덱스 번호를 임의로 지정한 것이지요.
강의를 보시면 아시겠지만, 각각의 뉴스를 기준으로 TFIDFVectorizer와 워드클라우드를 구축하여,
각 뉴스의 주요한 키워드가 강조되는 것을 확인할 수 있습니다.
어떤 뉴스를 사용했는 지는 아래의 코드를 통해 알아볼 수 있습니다.
아래 news.loc[] 부분에 위의 숫자를 하나 씩 입력해보면 어떤 뉴스로 워드클라우드를 만들었는 지 확인할 수 있습니다.
저 값은 임의로 들어간 것이므로,
다른 뉴스에 대해 키워드를 추출해보고 싶다면
[29010, 25676, 25763, 26410, 25503] 대신에
다른 뉴스의 인덱스 번호를 입력해보면 되겠습니다.
감사합니다.