• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

5.1 업종 테마주 수집 질문 - pd.concat(result.tolist())

22.10.02 14:13 작성 조회수 326

1

스크린샷 2022-10-02 오후 2.09.26.png스크린샷 2022-10-02 오후 2.09.46.png스크린샷 2022-10-02 오후 2.09.59.png스크린샷 2022-10-02 오후 2.10.14.png안녕하세요? 좋은 강의 잘 듣고 있습니다.

해당 에러 메시지로 구글링하여 여러 시도를 하였는데

제 실력으로는 해결이 안되는 상황이라서 마침 질문드립니다.

to_list(), tolist() 로도 사용해보았고

reset_index의 옵션들도 바꿔봤는데 이 단계에서 넘어가지가 않네요.

미리 감사드립니다.

 

답변 9

·

답변을 작성해보세요.

1

image

안녕하세요? 스터디에서 이런 방식으로 해결하였습니다.

https://drive.google.com/file/d/1QihdsDuX6tkCS4Ek-Buf-uAV2uHgRC8U/view?usp=sharing

살펴보시고 의견주시면 감사하겠습니다.

안녕하세요. concat 을 사용하지 않고도 공유해 주신 방법대로 해도 됩니다.

가장 주의할 점이 컬럼명이 가져오는 데이터마다 다르다는 점인데 loc를 사용해서 값을 넣어주고 없는 값은 결측치로 들어갈 수 있게 처리해 준 점이 좋습니다.

df_result 에 있는 컬럼명으로 순회를 하다보면 새로 등장하는 컬럼명은 추가할 수 없는 문제도 있을텐데요. 이런 문제도 어떻게 해결하면 좋을지 고민해 보세요!

concat을 사용하게 되면 없는 컬럼에 대해 한 번에 처리해 준다는 점이 장점인데 이번 버전에서 어떤 점이 달라졌는지 시간 될 때 확인해 보고 답변드리겠습니다.

1

안녕하세요.

판다스 버전이 1.3.5 로 저도 같은 버전으로 답변을 했는데요.

colab 으로 실습하고 있다면 colab 링크를 공유해 주세요.

이 때 보기권한이 있는 링크로 공유해 주셔야 답변이 가능하니 링크 공유시 권한 확인을 해주세요.

https://drive.google.com/file/d/1QihdsDuX6tkCS4Ek-Buf-uAV2uHgRC8U/view?usp=sharing

관심에 진심으로 감사드립니다.

참고로 실습은 mac 로컬에서 쭉 진행중인데, 버전 등 말씀 있으셔서 colab으로 한번 체크해본것입니다.

연휴에 고생 많으세요.

안녕하세요.

공유해 주신 자료에서 계속 오류가 나는데 기존 실습자료와 차이점이 보이지 않아 원래 공유했던 실습파일에 설치 문구만 추가해서 공유합니다.

colab 에서 먼저 동작하는지 확인해 보는데 우선 런타임 > 재시작을 하고 아래의 코드를 전체 실행해 보세요. 잘 동작한다면 다운로드 받아 실습해 보세요.

그리고 동작을 빠르게 확인하기 위해 세부페이지를 가져오는 apply_progress 부분에 데이터를 10개만 가져와서 우선 확인해 보도록 했어요. 그 부분도 주의해서 봐주세요!

https://colab.research.google.com/drive/1PQRSLQh94BBcz_9nTHalgA2JyjcksZxe?usp=sharing

안녕하세요? 실행해본 결과 colab에서는 무사히 진행, 로컬 jupyter lab에서는 에러가 발생합니다.

image- colab

image- jupyter lab

제가 공부해야 할 문제인것 같습니다. 더 열심히 진행해보겠습니다. 감사합니다.

 

image

실습은 덕분에 잘 해보겠습니다. 감사합니다 :)

발생한 에러는 제가 좀더 공부해야할것같네요.

1

안녕하세요.

아마도 파이썬, 판다스 버전 호환성 문제로 보여지는데 아래의 방법이 안 된다면 다음의 시도를 해보세요.

image

업종별 수집 부분에서 인덱스값이 겹치지 않도록 종목코드를 인덱스로 지정하고 concat 을 해보세요.

아래 함수에 한 줄을 추가해서 인덱스 값을 변경하는 내용으로요.

df_item.index = [item_code]

image

안녕하세요? 말씀하신대로 실행했는데 계속 문제가 반복되고 있으며

환경을 바꿔 다시 했는데 (맥os+주피터랩 -> 윈도우+colab) 에러는 동일하며 해결이 어렵네요.

피드백 정말 감사드리오며, 이건 제가 해결할수 있는 부분이 아닐듯싶습니다.

살펴보시고 의견 주시면 정말 감사하겠습니다.

imageimageimageimageimageimageimage

1

안녕하세요.

올려주신 오류 메시지를 보니 이전에 수집한 데이터의 인덱스 값이 같아서 발생하는 문제로 보여집니다.

강의 이후 판다스의 concat 옵션이 변경되며 발생한 문제로 보여져요.

아래 concat의 문서를 보면 ignore_index=False 라는 기능이 있습니다. 이 값을 True로 변경해 주세요.

 

pd.concat(result.tolist(), ignore_index=False) 이렇게요!
아래 문서도 함께 참고해 보세요!


[pandas.concat — pandas 1.5.0 documentation](https://pandas.pydata.org/docs/reference/api/pandas.concat.html?highlight=concat#pandas.concat)

1

안녕하세요.

최신버전의 판다스에서 concat 사용시 인덱스 값이 중복되면 올려주신 내용처럼 오류가 발생합니다.

reset_index(drop=True) 방법을 잘 사용해 주셨는데 result 변수에 다시 할당해 주지 않아 오류가 났네요.

pd.concat(result.reset_index(drop=True).tolist()) 방법으로 사용해 보세요!

감사합니다 :)

0

imageimageimageimageimageimageimageimageimageimageimage

오늘은 여기까지인것같습니다. 스택오버플로우에서도 해답을 찾기 어렵네요.

최근 판다스에 뭔가 변화가 있었기 때문이 아닌가 싶긴 합니다.

좋은 강의 감사합니다. 환경이 바뀌면 잘되던게 안되는건 늘 있는 일입니다.

 

안녕하세요.

실습에 불편함이 많았을텐데 버전 이슈로 실습이 원활하지 못했던 점에 대해 사과드립니다.

일단 이전 실습 내용에서 필요한 파일은 어제 알려드린 colab 에서 csv파일을 생성해서 다운로드 받아 사용해 보세요. 해당 내용은 저도 좀 더 찾아보고 답변드리겠습니다.

감사합니다.

0

image안녕하세요? 코랩과 주피터(윈도우/맥)에서 계속 에러가 나고 있는데 단기간에 해결하기는 어려울듯합니다.

시간을 두고 꼼꼼히 다시 보면서 해결해보려고 합니다.

image문제는 위 강의에서 csv 파일을 만들어야 그 다음 수업을 들을수가 있는데

이상의 에러로 csv파일을 만들지 못해 다음 진도를 나가지 못하고 있습니다.

업종 테마주 분석 샘플 csv파일 제공 가능하신지 문의드립니다. 감사합니다.

 

0

안녕하세요? 제가 뭔가 굉장히 잘못하고 있는것 같은데;;

검색으로도 답을 찾기 어려워 다시 질문드릴수밖에 없음을 양해 구합니다.

가능한 경우의 수를 조합했는데 전부 에러가 나오고 있습니다.

혹시 제가 놓친 부분이 있을까요? 미리 감사드립니다.

imageimageimageimageimageimageimage

0

연휴중 답변 감사드립니다.

그런데 주신 답대로 해도 동일한 에러가 계속되고 있어서 다시금 문의드립니다.

image

image

감사합니다.