Posts
Q&A
๊ทธ๋ฆผ ํ ์ฅ์ผ๋ก ์ธ์์ ๋๋ด๋ ์น ์๋น์ค ๊ตฌ์กฐ ๊ธฐ๋ณธ์ด๋ก ๋ง ์ฌ์์ด ์๋ผ์
์ ๋ ๊ทธ๋ ๋ค์. ์ค๊ฐ๋ถํฐ ๋๊ฒจ์ ์ข ๊ฑด๋๋ฐ๊ณ ๋ท๋ถ๋ถ ๋ค์์ต๋๋ค.
- 1
- 3
- 173
Q&A
์ผ๋ณ ์์กด์จ SQL ๋ก์ง์์ ๊ถ๊ธ์ฆ์ด ์์ต๋๋ค.
์ ๋ ์์ํ๋๋ฐ ์ข์ ์ง๋ฌธ ๊ฐ์ฌํฉ๋๋ค.
- 1
- 3
- 347
Q&A
๊ฐ๋ณ ์ฟผ๋ฆฌ ์ฐ๊ฒฐ ์
์ ๋ ๊ถ๊ธํฉ๋๋ค ์คํ๋ ค union ํด์ฃผ๋ฉด ์๋์๊ฐ๋ค์
- 2
- 3
- 262
Q&A
random_state ์ง์ ๋ฌธ์
์๋ ํ์ธ์ ๊ฒ์ํด๋ณด๋ค๊ฐ ์ถ๊ฐ ์ง๋ฌธ์ ๋๋ฆฌ๋ ค๊ณ ํฉ๋๋ค. "๋๊ฐ์ง ๊ฒฝ์ฐ ๋ชจ๋ ์ค์ ๋ถ์์ random_state๋ฅผ ์ค์ ํ๋ ๊ฒ์ด ์ข๋ค"๋ผ๊ณ ํ์ จ๋๋ฐ train_test_split์ random_state์ DecisionTreeClassifier๊ณผ ๊ฐ์ estimator์์์ random_state๋ฅผ ๋์ผํ๊ฒ ์ค์ ํด์ผ ์ ์๋ฏธํ ๊ฒ์ธ๊ฐ์? ์๋ฅผ๋ค์ด train_test_split์์ random_state=7๋ก ์ง์ ํ์ผ๋ฉด DecisionTreeClassifier์ ๊ฐ์ estimator์์๋random_state=7๋ก ์ง์ ํด์ผ ๊ฒฐ๊ณผ๊ฐ ์ ์๋ฏธํ ๊ฒ์ธ์ง ์๋๋ฉด ์ ํ ์๊ด ์๋์ง ๊ถ๊ธํฉ๋๋ค. ํญ์ ๊ฐ์ฌํฉ๋๋ค.
- 1
- 4
- 2.9K
Q&A
UnicodeEncodeError: 'ascii' codec can't encode characters in position 18-20: ordinal not in range(128)
๊ฐ์ ๋ฐ์ดํฐ/์ค์ต์ ์ฌ์ฉํ๋ ์ค์ ๋ฐ์ํ ์๋ฌ ๋ง์ต๋๋ค. ๋ด์ฉ์ ์ฑ 4.4์ฅ ๋๋คํฌ๋ ์คํธ(220์ชฝ)์ ๋๋ค. ์ ์๋ ์ ์๋ํ์๋๋ฐ ๋ณต์ตํ๋ ค๊ณ ๋ค์ ๋๋ ค๋ณด๋ ์๋ฌ๊ฐ ๋ฐ์ํ๋ค์ -> ๊ฒฐ๊ณผ์ ์ผ๋ก ์ฒ ๋ฏผ๋๊ป์ ์๋ ค์ฃผ์ ๋ฐฉ๋ฒ์ผ๋ก resource_tracker.py ํ์ผ ์ด์ด์ ์์ ํ๋ ์ ์ ์๋๋ฉ๋๋ค. ์ค๋ ์ด๊ฒ ๋๋ฌธ์ ๋ช์๊ฐ๋์ ์จ๋ฆํ๋ค๊ฐ ํฌ๊ธฐํ์๋๋ฐ ๋๋ถ์ ํด๊ฒฐ๋์์ต๋๋คใ ใ ์ง์ฌ ํ๋ณตํฉ๋๋ค. ์์ผ๋ก ํ์ ๊ตฌ๊ธ์ฝ๋ฉ๋ง ์จ์ผํ๋ ๋ณ ์๊ฐ์ ๋คํ์๋ค์. ์ด๋ ๊ฒ ๋ง์์ผ๋ก๋ฐ์ ๊ฐ์ฌํ ๋ง์์ ์ ๋ฌํ ์๊ฐ ์์ง๋ง.. ๋ค์ ํ๋ฒ ๊ฐ์ฌํฉ๋๋ค. ์ฒ ๋ฏผ๋๋ ํ๋ณตํ์ธ์
- 0
- 3
- 4.7K
Q&A
LDA ๊ทธ๋ํ ์ข์ฐ๋ฐ์ ์ง๋ฌธํฉ๋๋ค.
๊ทธ๋ฐ ์ด์๊ฐ ์์๊ตฐ์. ๊ฐ์ฌํฉ๋๋ค.
- 1
- 10
- 936
Q&A
LDA ๊ทธ๋ํ ์ข์ฐ๋ฐ์ ์ง๋ฌธํฉ๋๋ค.
๋ณต๋ถ์ ์ฉ์ดํ์๋ผ๊ณ ์๋์ ์ฝ๋ ๋ง๋ถ์ ๋๋ค. from sklearn.discriminant_analysis import LinearDiscriminantAnalysis from sklearn.preprocessing import StandardScaler from sklearn.datasets import load_iris iris = load_iris() iris_scaled = StandardScaler().fit_transform(iris.data) lda = LinearDiscriminantAnalysis(n_components=2) # fit()ํธ์ถ ์ target๊ฐ ์ ๋ ฅ lda.fit(iris_scaled, iris.target) iris_lda = lda.transform(iris_scaled) print(iris_lda.shape) import pandas as pd import matplotlib.pyplot as plt %matplotlib inline lda_columns=['lda_component_1','lda_component_2'] irisDF_lda = pd.DataFrame(iris_lda,columns=lda_columns) irisDF_lda['target']=iris.target #setosa๋ ์ธ๋ชจ, versicolor๋ ๋ค๋ชจ, virginica๋ ๋๊ทธ๋ผ๋ฏธ๋ก ํํ markers=['^', 's', 'o'] #setosa์ target ๊ฐ์ 0, versicolor๋ 1, virginica๋ 2. ๊ฐ target ๋ณ๋ก ๋ค๋ฅธ shape์ผ๋ก scatter plot for i, marker in enumerate(markers): x_axis_data = irisDF_lda[irisDF_lda['target']==i]['lda_component_1'] y_axis_data = irisDF_lda[irisDF_lda['target']==i]['lda_component_2'] plt.scatter(x_axis_data, y_axis_data, marker=marker,label=iris.target_names[i]) plt.legend(loc='upper right') plt.xlabel('lda_component_1') plt.ylabel('lda_component_2') plt.show()
- 1
- 10
- 936
Q&A
LDA ๊ทธ๋ํ ์ข์ฐ๋ฐ์ ์ง๋ฌธํฉ๋๋ค.
๊นํ๋ธ์ ์ฌ๋ ค์ฃผ์ ์ฝ๋ ๊ทธ๋๋ก ์คํํ์ต๋๋ค. ํ ํ๋ฉด์ ๋ด๊ธฐ ์ํด ํ๋ฉด ์ฌ์ด์ฆ๋ฅผ ์ค์ฌ์ ์บก์ณํ๋๋ผ ๊ธ์๊ฐ ์์์ก์ต๋๋ค. ์ํด๋ฐ๋๋๋ค,, (์ฌ์ง) ๋ฒ์ ์ ์๋์ ๊ฐ์ด 0.23.2 ์ ๋๋ค. (์ฌ์ง) ์ฐธ๊ณ ๋ก PCA ๊ณต๋ถํ ๋๋ ๋ฌธ์ ์์ด ๋์ผํ๊ฒ ๋์์ต๋๋ค.
- 1
- 10
- 936
Q&A
๋ณ๋์ฑ์ด ์๋ฏธํ๋๊ฑด ๋ฌด์์ธ๊ฐ์?
๋๋ฒ์งธ PCA Component๋ ์ฝ 5%์ธ๋ฐ 0.5%๋ก ์๋ชป ๋ง์ํ์ ๊ฒ ๊ฐ์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 3
- 431
Q&A
๋ถ๋ฅ์ ํฐ ๊ทธ๋ฆผ์ ๋ํด ์ง๋ฌธํฉ๋๋ค.
๊ฐ์ฌํฉ๋๋ค. ์ด ๊ฐ์์ ์ฅ์ ์ ๋ฌด์๋ณด๋ค ์ง๋ฌธ&๋ต๋ณ์ธ ๊ฒ ๊ฐ์ต๋๋ค. ๊ฒ์ํ์ ๊ฒ์ํด๋ณด๋ฉด์ ์ฌ๋ฌ ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ ๋ง์ ๋์ ๋ฐ๊ณ ์์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 4
- 3
- 236