• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

변수 생성

21.12.29 17:55 작성 조회수 102

1

df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskin"), "브랜드명"] = "배스킨라빈스"

df_31[["상호명", "브랜드명"]].head()

 

이 코드에서 df_31["브랜드명"] = 

와 같은 식으로 새로운 변수를 먼저 생성해주는 방법 대신 .loc 함수를 통해서

df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskin"), "브랜드명"] = "배스킨라빈스"

이렇게 위치를 지정하는 것도 변수를 생성하는 방법 중 하나일까요? 이 코드가 조금 헷갈려서, 설명 조금만 더 해주시면 감사하겠습니다! 

답변 1

답변을 작성해보세요.

0

안녕하세요

특정 컬럼에 값을 할당하는 방법으로 값을 생성하고 업데이트 할 수 있습니다.

컬럼명이 있다면 업데이트를 하고 없다면 새로운 파생변수를 생성합니다.

df["컬럼명"] = 값

 

이 방법을 응용하면 아래와 같이 사용할 수도 있습니다.

df.loc[조건, "컬럼명"] = 값

 

그래서 특정 조건에 해당되는 값만 변경하고자 한다면 df.loc[조건, "컬럼명"]  으로 색인을 해서 해당 값을 생성하거나 변경할 수 있습니다.