inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[6/10] folium 으로 MarkerCluster 맵 그리기

프랜차이즈 입점 분석 과정에서 질문입니다.

해결된 질문

309

드가자

작성한 질문수 12

2

안녕하십니까.

언제나 즐겁고 흥미롭게 선생님의 멋진 강의를 수강하는 김영목입니다.

본 강의 수강 도중 코드를 하나하나 복습하면서 이해가 되지 않는 코드가 있어 설명 부탁드리고자 질문 올립니다.

df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskinrobbins"), "브랜드명"] = "배스킨라빈스"

df_31[["상호명", "브랜드명"]]

위의 코드에서 이해가 되지 않는 부분은 loc[] 안에 있는 "브랜드명"입니다. loc 안애는 행과 열을 지정해주도록 되어 있는 것으로 이해하고 있습니다. 하지만  지금 현재 원본파일과 전처리한 파일 어디에도 브랜드명이라는 이름을 가진 열은 존재하지 않습니다. 하지만  신기하게도 실제 저렇게 코드를 작성하고여 실행이 됬으며 추후 표를 확인해보면 브랜드명이 보이게 됩니다. 

어떻게 이러한 일이 가능한 것인지 알려주시길 부탁드립니다.

김영목 드림 

공공빅데이터분석 numpy pandas python

답변 2

1

드가자

항상 우문현답을 주셔서 감사합니다. 

0

박조은

과찬 감사합니다 :)

0

박조은

안녕하세요. 김영목님 즐겁게 수강하고 계시다니 감사합니다!

loc로 데이터를 가져올 때는 아래의 방법으로 가져올 수 가 있습니다.

.loc[행]

.loc[행, 열]

.loc[조건, 열]

그리고 "열"을 써줄 때 없는 "열"을 작성해 줄 수 있습니다.

그래서 "브랜드명"이라는 컬럼을 loc를 통해 새로 만들어준 과정입니다.

.loc[조건, 열]

원래 "브랜드명"이 없기 때문에 아래 코드를 실행하기 전에 

df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskinrobbins"), "브랜드명"] = "배스킨라빈스"

아래 코드를 작성하면 없는 컬럼이라고 키에러 오류가 날거에요.

df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskinrobbins"), "브랜드명"] 

그런데 아래 처럼 "브랜드명"이라는 컬럼은 없지만 "배스킨라빈스"로 일괄적으로 해당 데이터에 브랜드명을 만들어 줄 수 있습니다.

df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskinrobbins"), "브랜드명"] = "배스킨라빈스"

위 과정을 통해 새로운 변수를 생성하는 것은 브랜드명을 일관되게 만들어주면 해당 브랜드명을 통해 빈도수등과 같은 다양한 연산을 할 수 있게 되기 때문입니다.

감사합니다!

패키지 설치 에러 ydata-profiling

0

134

2

자세한 설명 부탁드려요 ㅜ

0

199

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

307

2

value_counts와 count 차이

0

372

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

217

3

scatterplot질문

0

131

1

강의 화면이 안나옵니다

0

171

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

193

2

에러 메시지

1

311

2

그래프 색이 동일하게 나옵니다.

0

328

2

시각화 라이브러리 비교

0

400

2

주피터 노트북 설치

0

399

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

233

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

184

1

group by agg function failed 에러

0

695

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

294

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

372

3

get_string함수에서 문자 'nan'

0

205

1

seaborn X축 시작 지점 조정 질의의 건

0

229

1

14강 distplot 질의

0

299

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

485

1

corr = df.corr() 입력시 오류

1

383

1

keyword grid_b is not recognized

0

342

1

%ls data 매직커맨드 사용시 한글 깨짐

0

304

1