Hyoeun Yun
@redcat6211343
Reviews Written
-
Average Rating
-
Posts
Q&A
ํ์ผ ๋ณํฉ ์ง๋ฌธ ๋๋ฆฝ๋๋ค
def generate_dateframe_by_path(PATH): file_list, csv_list = os.listdir(PATH), list() first_doc = True for file in file_list: if file.split(".")[-1] == 'csv': csv_list.append(file) csv_list.sort() #sort() ๊ธฐ๋ณธ ์ค๋ฆ์ฐจ์์ ๋ ฌ for file in csv_list: csv_list์ file๋ค์ด ํ๋์ฉ ์ฐจ๋ก๋ก ๋ค์ด์ฌ๊ฑฐ๊ณ doc = create_dateframe(file) ๊ทธ ํ์ผ๋ค์ df์ผ๋ก ํ๋์ฉ ๋ง๋ค๊ณ if first_doc: ์ฒ์๋ค์ด์จ doc์ด๋ผ๋ฉด ์ฐ์ if๊ตฌ๋ฌธ์ด ์คํ๋ ๊ฑด๋ฐ final_doc, first_doc = doc, False ์์์ first_doc =True๋ก ์ง์ ํ๋ ์ํ๋ก, fisrt_doc = False๋ก ๋ฐ๊พธ๊ณ , ์ด๋ฒ์ ๋ค์ด์จ doc์ final_doc์ ์ ์ฅํด๋ผ else: ๊ฑฐ๊ณ ๊ทธ๋ฆฌ๊ณ ๋ค์ ํ์ผ์ด ๋ค์ด์ฌ ๋ fisrt_doc์ด False์ด๊ธฐ ๋๋ฌธ์ else๋ฌธ์ด ์คํ๋๊ณ final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True) ์ด๋ฒ์ ๋ค์ด์จ doc๊ณผ ์ด์ ์ ํ์ผ๋ค์ด ์ ์ฅ๋ final_doc์ ํฉ์ณ์ ์๋ก์ด final_doc์ ์์ฑ if ์ฌ๊ณผ๋ฉด: ๋จน๋๋ค. else: ๋จน์ง ์๋๋ค. ์ด๋ฐ์์ผ๋ก if else๋ฌธ์ ์ค๋ช ํ์๋๋ผ๊ตฌ์. ์ด๋ณด์ ์ฅ์์ ๋ค๋ฅธ ์ด๋ณด๋ถ๋คํํ ํน์ ๋์์ด ๋์ง ์์๊น ํด์ ํด์ํด๋ดค์ต๋๋ค ใ ..ใ
- 0
- 2
- 298
Q&A
countryflag ์ฌ์ดํธ๊ฐ ์ง๊ธ ๋งํ๋์?!
๊ตญ๊ธฐ ํ์ด์ง๋ flagcdn์ด๋ ๋ค๋ฅธ๋ถ์ด ์ฌ๋ฆฐ ํํ์ด์ง ๋๋ค ํด๋ดค๋๋ฐ ๋๊ฐ์ด ํด๋ ๊ตญ๊ธฐ ์ฌ์ง์ด ๋ฌผ์ํ๋ก ๋จ๋ค์ ใ ใ ๊ทธ๊ฑฐ ๋ง๊ณ ์ค๋ฅ๋๋๊ฑด ์๋๋ฐ ๊ตญ๊ธฐ ์ฌ์ง์ด ์ ๋จ๋ ์ด์ ๋ฅผ ๋์ ํ ๋ชจ๋ฅด๊ฒ ์ต๋๋ค ..
- 0
- 3
- 402
Q&A
๊ณต๋ถ๋ฐฉ๋ฒ ์ง๋ฌธ
์ ์ ์๋ ์ ๋ง ๊ฐ์ฌํฉ๋๋ค!!!!! ์ด๋ ๊ฒ ํ๋ฉด์ ๋ฐฐ์๊ฐ๋๊ฒ๋ ์ฌ๋ฏธ์๋๋ฐ ๋ญ๊ฐ ์ ์์ ์ธ ์ฝ์ค๊ฐ ์๋๋ฐ ์ ๋ง ๋ชจ๋ฅด๊ณ ์ฝ์งํ๋๊ฒ ์๋๊ฐ ์ถ์๊ฑฐ๋ ์... ใ ใ ์ญ์ ๋ง์ด ํด๋ด์ผ ๋๋๊ฒ ๋ง๊ตฐ์!!! ๊ทธ๋ฆฌ๊ณ ์ข์ ๊ธฐ์ด๊ฐ์๋ ์ถ์ฒํด์ฃผ์ ์ ์ ๋ง ๊ฐ์ฌํฉ๋๋ค.
- 1
- 3
- 381
Q&A
graphviz ์ค์น
๊น๋ํ๊ฒ ํด๊ฒฐ๋์์ด์!! ๊ทธ๋ํ๊ฐ ์ถ๋ ฅ๋๋๋ฐ ๊ฐ๊ฒฉ๋ฐ์์ต๋๋ค..
- 0
- 10
- 1.1K
Q&A
could not convert string to float ์๋ฌ..
์์ฐ ๊ฐ์ฌํฉ๋๋ค! ๊ฐ์ ๋๋ฌด ์ฌ๋ฐ์ด์ >
- 0
- 5
- 36K
Q&A
could not convert string to float ์๋ฌ..
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('./titanic_train.csv') titanic_df.head(3) print('\n ### train๋ฐ์ดํฐ์ ๋ณด ###\n') print(titanic_df.info()) titanic_df['Age'].fillna(titanic_df['Age'].mean(), inplace=True) #inplace=True๋ ๊ธฐ์กด๋ฐ์ดํฐ๋ฅผ ์ ๋ฐ์ดํธํ๋ค๋๋ง titanic_df['Cabin'].fillna('N', inplace=True) #๋ค๋ฅธ ์นดํ ๊ณ ๋ฆฌ์ฑ ์ปฌ๋ผ์ธ 'N'์ผ๋ก ์ ๋ฐ์ดํธ titanic_df['Embarked'].fillna('N', inplace=True) print(titanic_df.isnull()) #null๋ฐ์ดํฐ๋ฅผ True๋ก ํ์ print('\n๋ฐ์ดํฐ์ธํธ ์ปฌ๋ผ๋ณNull ๊ฐ์', titanic_df.isnull().sum()) #True๊ฐ์ ํฉ์ ์ปฌ๋ผ๋ณ๋ก ํ์ print('\n๋ฐ์ดํฐ์ธํธ ์ ์ฒด Null๊ฐ์', titanic_df.isnull().sum().sum()) print('Sex๊ฐ ๋ถํฌ: \n', titanic_df['Sex'].value_counts()) #๋ฐ์ดํฐํ๋ ์์ ์ปฌ๋ผ์ ๋ฐ์ดํฐ๊ฐ ์นดํ ๊ณ ๋ฆฌ์ฑ์ผ๋ ์นดํ ๊ณ ๋ฆฌ๋ณ ๊ฐ์ print('Cabin๊ฐ ๋ถํฌ: \n', titanic_df['Cabin'].value_counts()) print('Embarked๊ฐ ๋ถํฌ: \n', titanic_df['Embarked'].value_counts()) titanic_df['Cabin'] = titanic_df['Cabin'].str[:1] #๋ฐ์ดํฐํ๋ ์์์ []์ ํํฐ๋ง์ ํ๋ค๋ ์๋ฏธ๋, Cabin์ปฌ๋ผ์ ๋ฐ์ดํฐ์ ์ด๋ค๊ฒ์ ํํฐ๋ง์ ํ๋์ง ์จ์ผํจ. ๊ทธ๊ฒ .string print(titanic_df['Cabin'].head(3)) titanic_df['Cabin'].value_counts() titanic_df.groupby(['Sex', 'Survived'])['Survived'].count() sns.barplot(x='Sex', y='Survived', data=titanic_df) sns.barplot(x='Pclass', y='Survived', hue='Sex', data=titanic_df) # ๋์ด๋๋ณ๋ก ์นดํ ๊ณ ๋ฆฌ๊ตฌ๋ถํ๋ ํจ์์์ฑ, df์ apply lambda์์ ์ฌ์ฉ def get_category(age): cat = '' if age
- 0
- 5
- 36K




