데이터 셋 가공 질문입니다.
184
작성한 질문수 192
안녕하세요.
주피터 노트북에서 application test파일불러온 후 EXT_SOURCE_3의 열의 데이터 가공을 할 떄 데이터가 변경이 되는데요.
예를들어 수치값을 --원 이런식으로 나타나게 하고 싶습니다. 만약에 예시와 같은 행동을 취할 시 int->str로 변경되서요,
그래서 생각한게 깊은복사를 하여 데이터셋을 복사한 후 복사한 데이터가지고 가공할려고 하여 아래와 같이 적었습니다.
import copy
b = copy.deepcopy(['EXT_SOURCE_3의 '])
하지만 기본데이터(원래 다운받은 데이터)에서 변경이 됩니다.
혹시 예시와 같은 해동을 했을 때 다시 원형 데이터로 되돌릴 수 있는 방법이 있나요?
아니면 데이터 전체열은 깊은 복사가 안되는 건지 궁금합니다.
답변 1
0
안녕하십니까,
b = copy.deepcopy(['EXT_SOURCE_3'])를 하면 원본 데이터를 변경하는 지는 저도 처음 알았습니다.
dataframe의 copy() 메소드를 사용해보심 어떨지요?
b = train_df['EXT_SOURCE'].copy(deep=True)
혹시 예시와 같은 해동을 했을 때 다시 원형 데이터로 되돌릴 수 있는 방법이 있나요?
=> 원래 DataFrame에 새로운 컬럼으로 데이터를 만드시는 건 어떠신지요
train_df['EXT_SOURCE_NEW'] = train_df['EXT_SOURCE_NEW'] + '--원'
감사합니다.
sql사용
0
45
2
좋은 강의 감사드립니다.
0
73
2
8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문
0
246
2
사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다
0
599
1
안녕하세요 선생님
0
228
1
권철민교수님 진심으로 감사드립니다.
0
319
1
안녕하세요 선생님
0
351
1
# credit_card_balance 데이터셋 피쳐엔지니어링
0
267
1
초거대 데이터셋을 Submission하려면?
0
190
1
Library 관련 질문
0
350
3
최적화 함수 에러
0
588
4
LightGBM Iteration관련
0
422
2
안녕하세요 교수님 vm 관련해서 질문이 있습니다.
0
203
1
코드를 실행했는데 오류가 발생합니다
0
1981
2
bayes_opt 회귀 모델에 적용하려면..
0
267
1
타겟값의 로그변환에 대해서
0
779
1
아나콘다 환경설정
0
459
1
깃허브 주소 문의드립니다.
0
359
1
손실함수에 대한 질문
0
342
1
card_bal 데이터셋 시각화 관련 질문입니다
0
230
1
LGBM null값 처리에 관해 질문있습니다
0
538
1
컬럼 관련 질문
0
280
1
히스토그램 x 값
0
364
1
n_iter 횟수 넘음 질문
0
488
2





