๋น ๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฌ ์ํ ์ค๊ธฐ(Python)
๊ตญ๊ฐ๊ธฐ์ ์๊ฒฉ์ฆ ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ with Python ๊ฐ์์ ๋๋ค. ์ฌ๋ฌ๋ถ๋ค์ ํฉ๊ฒฉ์ ์์ํฉ๋๋ค!

- ๋ฏธํด๊ฒฐ
๊ตฌ๋ฆIDE ์๋น์ค ์ข ๋ฃ ์ดํ ํ์ตํ๊ฒฝ
์๋ ํ์ธ์.๋ณธ ๊ฐ์์ ์ฐ์ต๋ฌธ์ ํ์ด๊ฐ ๊ตฌ๋ฆIDE ํ๊ฒฝ์์ ์งํ๋๊ณ ์๋๋ฐ, ํด๋น ์๋น์ค๊ฐ 25๋ 10์ 30์ผ์ ๋ง์ง๋ง์ผ๋ก ๋ ์ด์ ์ง์ํ์ง ์๋ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.์ดํ ํด๋น ๊ฐ์ ๋ด์ฉ์ ํ์ตํ๊ธฐ ์ํด์๋
python๋น ๋ฐ์ดํฐhyunfelee
ใป
4๋ฌ ์
0
89
1
- ๋ฏธํด๊ฒฐ
10๊ฐ ์ฐ์ต๋ฌธ์
1) X_train, X_test, y_train, y_test = train_test_split (df.iloc[:, 1:], df['survived'], test_size = 0.2, random_state = 42, strati
python๋น ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ์ ๋์
ใป
0
162
1
- ๋ฏธํด๊ฒฐ
VotingClassifier Hard ์ฌ์ฉ
Hard VotingClassifier ์ ์ฌ์ฉํ๋ฉด ์ฌ๋ฌ ๋ชจ๋ธ์ด ๋ด๋์ ์์ธก๊ฐ ์ค์ ๊ฐ์ฅ ๋ง์ด ๋ํ ํ ๊ฐ์ ์ต์ข ์์ธก๊ฐ์ผ๋ก ๋ด๋๋๋ค๋ ๊ฒ์ผ๋ก ์ดํดํ๊ณ ์๋๋ฐ์, 2๊ฐ์ ๋ชจ๋ธ
python๋น ๋ฐ์ดํฐvotingclassifier์ ๋์
ใป
0
106
1
- ๋ฏธํด๊ฒฐ
๊ตฌ๋ฆIDE ์คํ ๋์ ์์ฒญ
<img src="https://cdn.inflearn.com/public/files/posts/e84bf163-0679-4db7-9598-05c667fa1a83/187ad3ab-877d-4345-8793-dd577b27b5cb.png" media-type="img"
python๋น ๋ฐ์ดํฐ๊น์ง์
ใป
0
155
1
- ๋ฏธํด๊ฒฐ
์ง๋ฌธ์ ๋๋ค RandomForestClassifier
RandomForestClassifier๋ง ์ ์ฉํ์ฌ ์์๋ธ ํ์ตํ์์๋ ROC_AUC_SCORE๊ฐ 1.0์ด ๋์ค๋๋ฐ,, ์ฐ์ต๋ฌธ์ ๋์์๊ณผ ๊ฐ์ด 0.84.... ๊ฐ ๋์ค์ง ์๊ณ 1.0์ด ๋์ค๋ ์ด์ ๊ฐ ๋ญ๊น์ ํน์ ๊ณผ์ ํฉ์ด๋ผ๋ฉด ์ค๋ต์ด
python๋น ๋ฐ์ดํฐ๋ฐ์ค์
ใป
0
164
1
- ๋ฏธํด๊ฒฐ
์ง๋ฌธ!
๋๋ฏธํ๋ฅผ ํด์ฃผ๋๋ฐ ๋ผ๋ฒจ์ธ์ฝ๋ฉ์ ๊ฐ์ดํ๋ ์ด์ ๊ฐ ๋ฌด์์ธ๊ฐ์?
python๋น ๋ฐ์ดํฐ์์ฑ์ ์์
ใป
0
338
1
- ๋ฏธํด๊ฒฐ
๋ฐ์ดํฐ ๋๋ฏธํ ์๋ฌ๋ฐ์ ์ง๋ฌธ.
<img src="https://cdn.inf
python๋น ๋ฐ์ดํฐ๋ฐฐ๊ณ ํ๋ค
ใป
0
308
1
- ๋ฏธํด๊ฒฐ
๋ง์ ์ปฌ๋ผ๊ณผ ๋ง์ ๊ฒฐ์ธก์น๋ฅผ ๊ฐ์ง๋ ๋ฐ์ดํฐ
๋ง์ ์ปฌ๋ผ๊ณผ ๋ง์ ๊ฒฐ์ธก์น๋ฅผ ๊ฐ์ง๋ ์ปฌ๋ผ(ex. 10๊ฐ)์ด ๋ง์ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ์๋ ๊ฐ์์์ ๋์ค๋ ๋ฐฉ์์ผ๋ก ํ๊ฒ๋๋ฉด ๋ง์ด ๋ณต์กํด์ง๋ ๊ฑฐ ๊ฐ์ต๋๋ค. ๋ค๋ฅธ ์ข์ ๋ฐฉ๋ฒ์ด ๋ญ๊ฐ ์์๊น์?
python๋น ๋ฐ์ดํฐ์์ฑ์ ์์
ใป
0
197
1
- ๋ฏธํด๊ฒฐ
Dataset์ ์ด๋์ ๋ฐ์ ์ ์๋์?
Dataset์ ์ด๋์ ๋ฐ์ ์ ์๋์?
python๋น ๋ฐ์ดํฐ์์ฑ์ ์์
ใป
0
389
1
- ๋ฏธํด๊ฒฐ
mpg ๋ฐ์ดํฐ์ ์์น
๋ฐ์ดํฐ ์ ์ค 'mpg'๋ ํ์ผ์ด ์ด๋์ ์๋์? ๋ค๋ฅธ๊ฑด ๊ฒ์ํ๋ฉด ๊นํ์ ๋์ค๋๋ฐ
python๋น ๋ฐ์ดํฐPurrSong Inc
ใป
0
333
1
- ๋ฏธํด๊ฒฐ
๊ต์ก์์ 4๊ฐ. ์์ ์ ํ1-๋ฌธ์ (1)์ ๋ํ ์ฝ๋๋ ์ด๋์ ๋ฐ์ ์ ์๋์?
๊ต์ก์์ 4๊ฐ. ์์ ์ ํ1-๋ฌธ์ (1)์ ๋ํ ์ฝ๋๋ ์ด๋์ ๋ฐ์ ์ ์๋์? car_crashes๋ผ๋ dataset์ ๋ถ๋ฌ์ค๋๋ก ์ฝ๋๊ฐ ์ง์ ธ์๋๋ฐ ํด๋น ์ํํ์ผ์ ์ด๋์ ๋ฐ์ ์ ์๋๊ฑด์ง์..?
python๋น ๋ฐ์ดํฐdhguseo
ใป
0
369
1
- ๋ฏธํด๊ฒฐ
๋จ์ํ๊ท (1์ง๋จ)T-test 1๋ฒ ํ์ด
1๋ฒ์์ "(์น๋ฃ ํ ํ์-์น๋ฃ ์ ํ์)์ ํ๊ท " ์ด๊ธฐ ๋๋ฌธ์๊ฐ์์ ์ค๋ช ํด ์ฃผ์ a['bp_after'].mean() ์ด ์๋๊ณ (a['bp_after']-a['bp_before']).mean().round(2) ์ฌ์ผ ๋ง์ง ์๋ ์ถ์๋ฐ..
python๋น ๋ฐ์ดํฐ๊น์งํ
ใป
0
472
2
- ๋ฏธํด๊ฒฐ
๊ฐ์์๋ฃ ๋ฌธ์
๋งค ๊ฐ์ ์ด๋ฐ์ ๋์ค๋ ํ๋ฉด์๋ฃ๋ ๊ฐ์์ ๋ฐ๋ก ์์ฌ๋ ค์ฃผ์ ๊ฑฐ์ฃ ?
python๋น ๋ฐ์ดํฐksp100
ใป
1
545
1
- ๋ฏธํด๊ฒฐ
๊ตฌ๋ฆIDE ์คํ๋ถ๊ฐ๋ฌธ์ ใ ใ
๋ฐ์ค ๋ถ๋ถ์ด ๊ณ์ ๋์ค๊ณ
python๋น ๋ฐ์ดํฐleejken530
ใป
0
800
2
- ๋ฏธํด๊ฒฐ
์ 7๊ฐ ์์ ์ ํ2-๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ: LabelEncoder ๋ฌธ๋ฒ
from sklearn.preprocessing import LabelEncoder label=['species','island','sex'] enc=LabelEncoder() df[label]=df[label].apply
python๋น ๋ฐ์ดํฐsj
ใป
0
440
1
- ๋ฏธํด๊ฒฐ
5๊ฐ ์์ ์ ํ1-๋ฌธ์ 2 ์ง๋ฌธ์ ๋๋ค
๋ง์ง๋ง ์ ์ฒ๋ฆฌ ์ ํ์ ํ์คํธ์ฐจ๊ฐ์ ์ถ๋ ฅํ ๋ ์ ๊ฐ ํผ์ ํ์๋๋print(df['distance'].std())print(df_af['distance'].std())๋ก ํ์๋๋ฐ ์ถ๋ ฅ๊ฒฐ๊ณผ275.2191532793011
python๋น ๋ฐ์ดํฐ์ค๋ธ
ใป
0
403
1
- ๋ฏธํด๊ฒฐ
7๊ฐ ์ฝ๋ ์ง๋ฌธ๋๋ฆฝ๋๋ค
7๊ฐ ์ฝ๋๋ฅผ replit์ ๋ฐ๋ผ์ณ๋ณด๊ณ ์๋๋ฐ์ใ ใ ๋๊ฐ์ง ์ง๋ฌธ์ด ์์ต๋๋ค1) get_dummies ๊ด๋ จ ๊ฐ์์์ ์ ์๋๊ป์๋ get_dummies์์ df ๋ง ์ธ์๋ก ๋ฃ์ผ์ จ๋๋ฐ์ ๋ ๊ทธ๋ ๊ฒ ํ๋๊น ์ซ์์ฒ๋ผ ๋ณด์ด๋ ์ปฌ
python๋น ๋ฐ์ดํฐ๊น๋ฏผ์ง
ใป
0
409
1
- ๋ฏธํด๊ฒฐ
14๊ฐ ์ค์ ๋ฌธ์ ์นดํ ๊ณ ๋ฆฌ ํญ๋ชฉ๋ฌธ์
์ฃผ๊ตฌ๋งค์ง์ ์นดํ ๊ณ ๋ฆฌํ ํ ๋ for๋ฌธ์ ์จ์ผํ๋ ์ด์ ๊ฐ ์๋์??? for๋ฌธ ์์ฐ๊ณ ํ๊ธฐ์ ๊ฐ์ด ํ์๋ ๋ฌธ์ ๋๋๊ฒ ์๋์ง์?X_train['์ฃผ๊ตฌ๋งค์ง์ '] = X_train['์ฃผ๊ตฌ๋งค์ง์ '].astype('category')X_te
python๋น ๋ฐ์ดํฐheroin8
ใป
0
393
1
- ๋ฏธํด๊ฒฐ
์์ 2์ ํ ๋ฌธ์
์๋ ํ์ธ์ ์ ์๋~์ ํ๋ธ๋ก ๊ฐ์ ์๊ฐํ ํ์์ ๋๋ค.์ธํ๋ฐ์ ๊ฐ์ ์๋ก๋์ด์๋ ๊ฒ ํ์ธ ํ ๋ฌธ์๊ธ ๋จ๊น๋๋ค.์ ์๋๊ป์ ์๋ ค์ฃผ์ ๋๋ก ์ฝ๋ ์์ฑํ๋ฉด์ ๊ถ๊ธํ๋ ์ 3๊ฐ์ง๊ฐ ์์ต๋๋ค.๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ ์
pythonbigdata์์ฑ์ ์์
ใป
0
456
1
- ๋ฏธํด๊ฒฐ
๋ฐ์ดํฐ์ ๋ถ๋ฆฌ์ ๊ด๋ จํ์ฌ ์ง๋ฌธ์ด ์์ต๋๋ค.
์๋ ํ์ธ์. ๋น ๋ถ๊ธฐ ์ค๊ธฐ ์ค๋น ์ค์ธ ์๊ฐ์์ ๋๋ค.๋จผ์ ๊ฐ์ฌํ๋ค๋ ๋ง์ ๋๋ฆฝ๋๋ค. ๋ง์ ๋์์ด ๋๊ณ ์์ต๋๋ค.์๊ฐ ์ค์ ๊ถ๊ธํ ์ฌํญ์ด ์์ด ์ง๋ฌธ ๋๋ฆฝ๋๋ค.10๊ฐ. ์ฐ์ต๋ฌธ์ ํ์ด์์ ๋จผ์ X_train, X_test ๋ฐ์ดํฐ์ ์ผ๋ก
bigdatapythonLeo
ใป
0
437
1






