one_col_df 질문
217
작성한 질문수 3
one_col_df = titanic_df[['Name']]
print(one_col_df.head(3))
print("## type:",type(one_col_df))
해당 부분 이해되지 않습니다. 설명 부탁드리겠습니다.
답변 2
0
안녕하십니까,
어떤 부분이 이해가 안되는지 적어주시지 않아서 명확하진 않지만, 해당 내용이 DataFrame, Series, 2차원, 1차원 얘기를 하고 있으니까, 해당 부분에 대해서 말씀드리겠습니다. 다른 부분이라면 다시 질문을 올려 주십시요.
기본적으로 DataFrame은 2차원 데이터만 다룹니다. 즉 행x열, row x col 형태의 데이터를 담습니다.
그리고 DataFrame 의 [ ] 연산자는 내부에 컬럼명을 지정해주면 해당 컬럼명으로 데이터를 filtering 해줍니다. 그런데 이때 유의해야할 사항이 있습니다. DataFrame[ ] 내에 단일 컬럼명을 입력하느냐, 아니면 리스트로 여러개의 컬럼명을 입력해주느냐에 따라 1차원 데이터(Series)를 반환할 수도, 2차원 데이터(DataFrame)을 반환할 수 있습니다.
만일 DataFrame 인 df [ ] 연산자내부에 df[ ['col_1', 'col_2'] ] 와 같이 컬럼명을 리스트 [ ] 로 입력해 주면 col_1, col_2 컬럼명들로 구성된 2차원 데이터를 반환해 줍니다. 이때 반드시 컬럼명을 리스트[ ] 형태로 입력해 주어야 합니다. 즉 df[ 'col_1', 'col_2'] 와 같이 여러 컬럼명을 리스트로 감싸주지 않으면 오류가 발생합니다. [ ] 연산자 내부에 들어가는 값은 단일 컬럼명, 또는 리스트[ ] 로 여러 컬럼명을 지정해 주어야 합니다.
DataFrame 인 df [ ] 연산자내부에 df['col_1'] 과 같이 단일 컬럼명을 입력하면 이때는 1차원 데이터를 반환합니다. 1차원 데이터라는 것은 컬럼이 없습니다. 굳이 얘기하자면 로우(행)만 있습니다. 이걸 numpy로 얘기하자면 shape이 (100, ) 와 같이 100개의 원소로 되어 있는 데이터 세트를 얘기하는 것입니다. 컬럼이 있다는 것은 2차원이라는 것입니다. 컬럼이 명시적으로 하나만 있어도 2차원 입니다.
즉 df[ ['col_1']] 이라고 한다면 리스트[] 로 단일 컬럼명이 들어가 있지만 이는 명백히 컬럼이 있는 데이터 세트를 요구한 것이므로 2차원 데이터, 즉 DataFrame을 반환합니다. numpy로 얘기하자면 shape이 (100, 1) 과 같이 명확하게 100개의 로우와 1개의 컬럼을 의미하는 데이터 세트입니다.
감사합니다.
안녕하세요 열심히 수강중인 학생입니다
0
60
2
정수 인덱싱
0
68
2
넘파이 오류
0
83
2
11강 numpy의 axis 축 질문 드립니다.
0
85
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
77
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
69
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
75
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
64
2
5강 강의 오류가 있어요.
0
83
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
72
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
69
3
파이썬 다운그레이 후 사이킷런 재설치
0
116
2
좋은 강의 감사합니다.
0
72
2
scoring 함수 음수값
0
67
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
99
2
분류 평가 정확도 예측
0
76
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
98
1
카카오톡 채널 있나요
0
106
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
189
2
pca 스케일링 관련하여 질문드립니다.
0
100
2
주피터 대신 구글 코랩
0
171
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
146
2
실루엣 스코어..
0
84
2
float64 null 값 처리 방법
0
102
2





