codingkorea
@codingkorea
Students
343
Reviews
41
Course Rating
4.9
์ฌ๋ฌ๋ถ๋ค์ ๋์๋๋ฆด ํํฐ์ ๋๋ค.
20๋ ๋๋ ํ์ ๊ฒฝํ๊ณผ ๊ฐ์ ๊ฒฝ๋ ฅ์ ๋ฐ์ดํฐ ๋ถ์๊ฐ ๊ณผ์ ํํฐ
SQL200์ ์ฑ ์ ์ ์ - ์ ๋ณด๋ฌธํ์ฌ
์์ ๊ฐ ๊ฐ๋ํ ํ์ด์ฌ ๊ธธ๋ผ์ก์ด์ ์ ์ - ์ ๋ณด๋ฌธํ์ฌ
์ ํ๋ธ ์ฝ๋ฉ ๋ํ๋ฏผ๊ตญ ํ๋ค์ค 100์ ์ ํ๋ฒ
์ฌ๋ํ๋ 19๊ธฐ ๋ฐ์ดํฐ ๋ถ์๋ฐ ํ์๋ค์ ๋ฐ์ ๋ฏธ๋๋ฅผ ์ง์ฌ์ผ๋ก ์์ํฉ๋๋ค.
Courses
Reviews
bigcloud
ยท
[2025 Latest Exam Questions Reflected] Big Data Analytics Engineer Practical Exam 100% Pass! The Pattern of Past Exam Questions Becomes Clear![2025 Latest Exam Questions Reflected] Big Data Analytics Engineer Practical Exam 100% Pass! The Pattern of Past Exam Questions Becomes Clear!jintoniclemon4399
ยท
[2025 Latest Exam Questions Reflected] Big Data Analytics Engineer Practical Exam 100% Pass! The Pattern of Past Exam Questions Becomes Clear![2025 Latest Exam Questions Reflected] Big Data Analytics Engineer Practical Exam 100% Pass! The Pattern of Past Exam Questions Becomes Clear!- SQL for Immediate Practical Use [Direct Instruction by the Author of SQL200]
- SQL for Immediate Practical Use [Direct Instruction by the Author of SQL200]
youjin08965899
ยท
[2025 Latest Exam Questions Reflected] Big Data Analytics Engineer Practical Exam 100% Pass! The Pattern of Past Exam Questions Becomes Clear![2025 Latest Exam Questions Reflected] Big Data Analytics Engineer Practical Exam 100% Pass! The Pattern of Past Exam Questions Becomes Clear!
Posts
Q&A
์ฝ๋ฉ ๊ธฐ๋ณธ ์ฌ์ฉ๋ฒ ๋ฌธ์
์๋ ํ์ธ์! ์ง๋ฌธ ๊ฐ์ฌํฉ๋๋ค. ์ฝ๋ฉ์ ์ฒ์ ๋ค๋ฃจ์ค ๋๋ ํ์ผ ๊ฒฝ๋ก๊ฐ ์กฐ๊ธ ํท๊ฐ๋ฆฌ์ค ์ ์์ต๋๋ค. ^^..์ ๋๋ฌ์ ์์๋ก ์ด๋ํ๋ค ๋ณด๋ฉด ๋ง์ํ์ ๊ฒ์ฒ๋ผ bin, boot ๋ฑ์ด ์๋ ๋ฆฌ๋ ์ค ์์คํ ์ ๊ฐ์ฅ ์ต์์ ๊ฒฝ๋ก(๋ฃจํธ)๋ก ๊ฐ๊ฒ ๋ฉ๋๋ค.์๋ ์์ ํ์๋ ๊ณต๊ฐ์ผ๋ก ๋์์ค์๋ ค๋ฉด, ํ์ฌ ๋ณด๊ณ ๊ณ์ ํด๋ ๋ชฉ๋ก ์ค์์ content๋ผ๋ ์ด๋ฆ์ ํด๋๋ฅผ ์ฐพ์ ๋๋ธ ํด๋ฆญํด ๋ณด์ธ์. ์ฝ๋ฉ์ ๊ธฐ๋ณธ ์์ ๊ณต๊ฐ์ด /content ์์ชฝ์ด๊ธฐ ๋๋ฌธ์, ๊ฑฐ๊ธฐ๋ก ๋ค์ด๊ฐ์๋ฉด ์๊น ๋ณด์ จ๋ ํ์ผ๋ค์ ๋ค์ ๋ง๋์ค ์ ์์ต๋๋ค.ํน์ ๋ ๊ถ๊ธํ ์ ์์ผ์๋ฉด ์ธ์ ๋ ์ง๋ฌธ ๋จ๊ฒจ์ฃผ์ธ์! ํ์ดํ ์ ๋๋ค.
- 0
- 1
- 20
Q&A
8ํ ์์ ํ1 ๋ฌธ์ 2
๋ง์ต๋๋ค! ์ ํํ๊ฒ ์ง์ ํ์ จ์ต๋๋ค. ๐๋ฌธ์ ์์ ๊ตฌํ๋ ๊ฒ์:'์ ์ ์์ฐ ๋น์จ'์ด ์ธ ๋ฒ์งธ๋ก ๋์ ๊ตญ๊ฐ์ '์ ์' ์์ฐ๋ (x)'๋์ ' ์์ฐ๋์ด ์ธ ๋ฒ์งธ๋ก ๋์ ๊ตญ๊ฐ์ '๋์ ' ์์ฐ๋ (y)์ ์ฒด ์์ ๋ ์ฝ๋:import pandas as pd# ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐdf = pd.read_csv("short_prod_data.csv")# ์ด ์์ฐ๋ ๋ฐ ์ ์ ์์ฐ ๋น์จ ๊ณ์ฐdf['total'] = df['Elec'] + df['Agr'] + df['Ship'] + df['Oth']df['Elec_rate'] = df['Elec'] / df['total']# ์ ์ ์์ฐ ๋น์จ์ด ์ธ ๋ฒ์งธ๋ก ๋์ ๊ตญ๊ฐdf_r = df.sort_values(by='Elec_rate', ascending=False)x_table = df_r.iloc[2:3, :]# ๋์ ์์ฐ๋์ด ์ธ ๋ฒ์งธ๋ก ๋์ ๊ตญ๊ฐdf_a = df.sort_values(by='Agr', ascending=False)y_table = df_a.iloc[2:3, :]# x์ y ์ ์ ๋ฐ ํฉ ๊ณ์ฐx = x_table['Elec'].values[0] # ์์ : 'Elec' ์ปฌ๋ผ ์ฌ์ฉy = y_table['Agr'].values[0]result = x + yprint(result) ์ฝ๋ ์ ๋ต์ ์์ ํ์๊ณ ์์๋ ๋ฐ๋ก ์์ ํ๊ฒ ์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 2
- 29
Q&A
๋ค์ค ์ ํ ํ๊ท ์์ํญ ์ถ๊ฐ ๊ด๋ จ ์ง๋ฌธ
์๋ ํ์ธ์, ์ด์งํ๋. ์ข์ ์ง๋ฌธ ๊ฐ์ฌํฉ๋๋ค!1. sm.add_constant() ์ฌ์ฉ ์ฌ๋ถ์ ์ฐจ์ด๋ง์ํ์ ๋๋ก 8ํ์ 10ํ ๋ฌธ์ ์์ ์์ํญ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ด ๋ค๋ฆ ๋๋ค. ๊ทธ ์ด์ ๋ ์ฌ์ฉํ ํจ์๊ฐ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ ๋๋ค.8ํ ๋ฐฉ์ - sm.OLS() ์ฌ์ฉ ์:import statsmodels.api as sm X = df[['๋ณ์1', '๋ณ์2']] X = sm.add_constant(X) # ์๋์ผ๋ก ์์ํญ ์ถ๊ฐ ํ์ y = df['price'] model = sm.OLS(y, X).fit() 10ํ ๋ฐฉ์ - ols(formula) ์ฌ์ฉ ์:from statsmodels.formula.api import ols formula = 'price ~ age + school_distance + subway_distance' model = ols(formula, data=df).fit() # ์๋์ผ๋ก ์ ํธ ํฌํจ๋จ ์ฐจ์ด์ ์ ๋ฆฌ:sm.OLS(): ํ๋ ฌ ํํ๋ก ์ง์ ์ ๋ ฅ โ sm.add_constant() ํ์ํฉ๋๋คols(formula): R ์คํ์ผ ์์ ์ฌ์ฉ โ ์๋์ผ๋ก ์ ํธ ์ถ๊ฐํฉ๋๋ค.๋ฐ๋ผ์ 10ํ ๋ฌธ์ ์์๋ ols(formula) ๋ฐฉ์์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๋ณ๋๋ก sm.add_constant()๋ฅผ ์ถ๊ฐํ ํ์๊ฐ ์์์ต๋๋ค.2. pd.get_dummies vs LabelEncoder2์ ํ ๋ฌธ์ ์์ ๋ฒ์ฃผํ ๋ณ์ ์ฒ๋ฆฌ ์:pd.get_dummies() - ์ํซ์ธ์ฝ๋ฉ:df_encoded = pd.get_dummies(df, columns=['category'], drop_first=True) ๋ฒ์ฃผ๋ฅผ ์ฌ๋ฌ ์ด์ง(0/1) ์ปฌ๋ผ์ผ๋ก ๋ณํ ํฉ๋๋ค.๋ช ๋ชฉํ ๋ณ์(์ฑ๋ณ, ์ง์ญ ๋ฑ)์ ์ ํฉํฉ๋๋ค. LabelEncoder - ๋ ์ด๋ธ์ธ์ฝ๋ฉ:from sklearn.preprocessing import LabelEncoder le = LabelEncoder() df['category_encoded'] = le.fit_transform(df['category']) ๋ฒ์ฃผ๋ฅผ ๋จ์ผ ์ซ์(0, 1, 2...)๋ก ๋ณํํฉ๋๋ค์์ํ ๋ณ์(ํ๋ , ๋ฑ๊ธ ๋ฑ)์ ์ ํฉํฉ๋๋ค๋ชจ๋ธ์ด ์ซ์ ๊ฐ ํฌ๊ธฐ ๊ด๊ณ๋ฅผ ํ์ตํ ์ ์์ต๋๋ค์งํ๋์ด ๋ง์ํ์ ์คํ ๊ฒฐ๊ณผ ์ฐจ์ด ์ด์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.x๊ฐ ๋ฒ์ฃผํ์ด๊ณ ์์ ์๋ฏธ๊ฐ ์๋ค๋ฉด LabelEncoder๊ฐ ํจ๊ณผ์ ์ ๋๋ค.์์๊ฐ ์๋ ๋ช ๋ชฉํ์ด๋ผ๋ฉด ์ํซ์ธ์ฝ๋ฉ์ด ๋ ์ ํํฉ๋๋ค๋ชจ๋ธ ์ข ๋ฅ(์ ํํ๊ท, ํธ๋ฆฌ ๊ณ์ด)์ ๋ฐ๋ผ ๊ฒฐ๊ณผ ๋ฌ๋ผ์ง ์ ์์ต๋๋ค.์ํ ๋๋น ํ:formula ๋ฐฉ์ ์ฌ์ฉ ์ โ ์์ํญ ์๋ ํฌํจํฉ๋๋ค.OLS() ์ง์ ์ฌ์ฉ ์ โ sm.add_constant() ํ์๋ก ์ฐ์ ์ผํฉ๋๋ค๋ฒ์ฃผํ ๋ณ์๋ ๋ฌธ์ ์กฐ๊ฑด ํ์ธ ํ ์ ์ ํ ์ธ์ฝ๋ฉ ์ ํํ์ธ์.์งํ๋์ ์ข์ ์ง๋ฌธ ์ ๋ง ๊ฐ์ฌํฉ๋๋ค.์ถ๊ฐ ์ง๋ฌธ ์์ผ์๋ฉด ์ธ์ ๋ ์ง ๋๊ธ ๋จ๊ฒจ์ฃผ์ธ์!
- 0
- 2
- 47
Q&A
10ํ ์์ ํ1๋ฒ๋ฌธ์ 2๋ฒ ๋ฌธ์ ํ์ด ํ๋ฆผ
์ ์ ๋ง ๊ฐ์ฌํฉ๋๋ค. ๋ฐ๋ก ์์ ํ๊ฒ ์ต๋๋ค์์๋ ์์ ์๋ฃํ์ต๋๋ค.์์ ์๋ฃํ์์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.# ์์ 1) ์ฐ์๋ณ ๋งค์ถ 2์ ์ฐพ๊ธฐ import pandas as pd df = pd.read_csv('sales_data.csv') #1. date ์ปฌ๋ผ์ datetime ํ์์ผ๋ก ๋ณํํ์์ค df['date'] = pd.to_datetime(df['date'], format='%Y๋ %m์ %d์ผ') df.head() # 2. ๊ฐ ์ฐ-์(YYYY-MM) ๋จ์๋ก ์ด ๋งค์ถ์ก์ ๊ณ์ฐํ์์ค df['year_month'] = df['date'].dt.strftime('%Y-%m') ์ฐ์๋ณ๋งค์ถ = df.groupby('year_month')['price'].sum() ์ฐ์๋ณ๋งค์ถ #3. ์ฐ์๋ณ ๋งค์ถ์ก์ ๋ด๋ฆผ์ฐจ์์ผ๋ก ์ ๋ ฌํ์ฌ, 2๋ฒ์งธ๋ก ๋์ ๋งค์ถ์ก์ ์ถ๋ ฅํ์์ค ์ฐ์๋ณ๋งค์ถ = ์ฐ์๋ณ๋งค์ถ.sort_values(ascending=False) result= ์ฐ์๋ณ๋งค์ถ[1] print(result)
- 0
- 2
- 47
Q&A
๋งํฌ๊ฐ์๋ณด์ฌ์ ์ด๋์์ฌ๋ผ์์๋๊ฑฐ์ฃ ๋์ฒด ? ๊ตฌ๊ธ์ฝ๋ฉํ์ผ์ด์
์๋ ๋นจ๊ฐ์ ํ์ดํ๊ฐ ๊ฐ๋ฆฌํค๋ ์์ ๋ ธํธ๋ฅผ ๋๋ฅด์๋ฉด ๋ณด์ค ์ ์์ต๋๋ค. (์ฌ์ง)
- 0
- 4
- 41
Q&A
8ํ 1์ ํ 1๋ฒ ๋ฌธ์
์ข์ ์ง๋ฌธ ๊ฐ์ฌํฉ๋๋ค!๋ฌธ์ ๋ฅผ ๋ค์ ์ดํด๋ณด๋, ์ง๋ฌธ์๋๊ป์ ์ง์ ํ์ ๋ถ๋ถ์ด ๋งค์ฐ ๋ ์นด๋ก์ด ํต์ฐฐ์ ๋๋ค.๋ฌธ์ ํด์์ ๋ํ์ฌ๋ฌธ์ 1-2์์ "์ปคํผ ์๋น๋์ด 3๋ฒ์งธ๋ก ๋ง์ ๋์('city')์ ์ปคํผ ์๋น๋"์ด๋ผ๊ณ ํํํ๋๋ฐ, ์ด ํํ์ด ๋ ๊ฐ์ง๋ก ํด์๋ ์ ์์ต๋๋ค:์ ์ ๋ต์ ์๋ (nlargest ๋ฐฉ์)Central ์ง์ญ์ ๋ชจ๋ ํ ์ค์์ coffee_servings ๊ฐ์ด 3๋ฒ์งธ๋ก ํฐ "ํ"์ ์ฐพ๋ ๊ฒ๊ฐ์ ๋์๊ฐ ์ฌ๋ฌ ๋ฒ ๋ํ๋๋ ๊ฐ ํ์ ๋ ๋ฆฝ์ ์ผ๋ก ์ทจ๊ธ์ง๋ฌธ์๋์ ์ ๊ทผ (groupby ๋ฐฉ์)๊ฐ์ ๋์๊ฐ ์ฌ๋ฌ ๋ฒ ๋ํ๋๋ฉด ํฉ์ฐํ์ฌ, "๋์๋ณ" coffee_servings ํฉ๊ณ๊ฐ 3๋ฒ์งธ๋ก ํฐ ๋์๋ฅผ ์ฐพ๋ ๊ฒ์ค๋ฌด์ ์ผ๋ก ๋ ํฉ๋ฆฌ์ ์ธ ์ ๊ทผ์ ๋ต ์ฌ๋ถ์ง๋ฌธ์๋์ ํ์ด๋ ์ถฉ๋ถํ ์ ๋ต์ด ๋ ์ ์์ต๋๋ค!์คํ๋ ค "๋์์ ์ปคํผ ์๋น๋"์ด๋ผ๋ ํํ์ ๋ณด๋ฉด, ์ง๋ฌธ์๋์ฒ๋ผ ๋์๋ฅผ ํ๋์ ๋จ์๋ก ๋ณด๊ณ groupby๋ก ์ง๊ณํ๋ ๊ฒ์ด ๋ ๋ ผ๋ฆฌ์ ์ผ๋ก ํ๋นํฉ๋๋ค.๋ค๋ง, ์ ๊ฐ ์๋ํ๋ ๊ฒ์:๋ฐ์ดํฐ์ ๊ฐ ํ์ ๋ ๋ฆฝ์ ์ธ ๊ด์ธก์น๋ก ๋ณด๊ณ ๋จ์ํ๊ฒ "3๋ฒ์งธ๋ก ํฐ ๊ฐ"์ ์ฐพ๋ ๋ฐฉ์์ด๋ณด์ ์ ์ฅ์์ ๊ฐ์ฅ ์ง๊ด์ ์ด๊ณ ๋จ์ํ ํ์ด๊ฒฐ๋ก ์ ์ ๋ต (nlargest): ๋ฌธ์ ๋ฅผ ๊ฐ์ฅ ๋จ์ํ๊ฒ ํด์ํ ํ์ด์ง๋ฌธ์๋ ์ ๋ต (groupby): ์ค๋ฌด์ ์ผ๋ก ๋ ์ ํํ๊ณ ๋ฐ์ดํฐ์ ์๋ฏธ๋ฅผ ๊ณ ๋ คํ ํ์ด๋ ๊ฐ์ง ๋ชจ๋ ํ๋นํ ์ ๊ทผ์ด๋ฉฐ, ์ด๋ฐ ์ง๋ฌธ์ ํ์ ๊ฒ ์์ฒด๊ฐ ๋ฐ์ดํฐ๋ฅผ ๊น์ด ์๊ฒ ์ดํดํ๊ณ ๊ณ์ ๋ค๋ ์ฆ๊ฑฐ์ ๋๋ค!์์ผ๋ก๋ ์ด๋ฐ ์ ๋งคํจ์ ์์ ๊ธฐ ์ํด ๋ฌธ์ ๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ๋ช ํํ๊ฒ ์์ ํ๊ฒ ์ต๋๋ค:"Central ์ง์ญ์์ coffee_servings ๊ฐ์ด 3๋ฒ์งธ๋ก ํฐ ํ์ ๊ฐ"๋๋ "Central ์ง์ญ์์ ๋์๋ณ ์ด coffee_servings๊ฐ 3๋ฒ์งธ๋ก ํฐ ๋์"์ข์ ์ง๋ฌธ ๊ฐ์ฌ๋๋ฆฌ๊ณ , ๊ณ์ ์ด๋ ๊ฒ ๊น์ด ์๊ฒ ๊ณ ๋ฏผํ์๋ฉด ์ค๋ ฅ์ด ๋ง์ด ๋ ๊ฒ์ ๋๋ค! ๐
- 0
- 1
- 49
Q&A
๋ต๋ณ ํญ์ ๊ฐ์ฌ๋๋ฆฝ๋๋ค. ์ง๋ฌธ ์์ต๋๋ค.
์ข์ ์ง๋ฌธ์ ๋๋ค! ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์ค๊ธฐ ์ ํ2(์์ ํ2)์ ํน์ฑ์ ๊ณ ๋ คํ์ฌ ๋ต๋ณ๋๋ฆฌ๊ฒ ์ต๋๋ค.๋ฐ์ดํฐ Drop ์ ๋ต์ ์ ํจ์ฑ์ ๋ํ ํ์ฌ ์ฝ๋์ ๋ฌธ์ ์ ์ cond = y_train['repair_cost'] ytrain = y_train[~cond] # ytrain๋ง ํํฐ๋ง์ด๋ ๊ฒ ํ๋ฉด xtrain๊ณผ ytrain์ ํ ๊ฐ์๊ฐ ์ ๋ง์์ ์๋ฌ๊ฐ ๋ฐ์ํฉ๋๋ค!์ฌ๋ฐ๋ฅธ ์์ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. cond = y_train['repair_cost'] xtrain = xtrain[~cond] # X๋ ๊ฐ์ด ํํฐ๋งytrain = y_train[~cond]๋ง์ํ์ ๊ฑด ์ฒ๋ผ ๋ช ๋ฐฑํ ์ด์์น(์์ ์๋ฆฌ๋น)๋ ์ ๊ฑฐํ๋ ๊ฒ์ด ํฉ๋ฆฌ์ ์ ๋๋ค.๊ทธ๋ฆฌ๊ณ train ๋ฐ์ดํฐ๋ drop ๊ฐ๋ฅํ๋ฐ test๋ ์ ๋ drop ํ์ง ๋ง์ธ์.์๋์ ์ฝ๋๋ ์ ๋ ํ๋ฉด ์๋ฉ๋๋ค. xtest = xtest.dropna() # ์ ์ถํ์ผ ํ์ ์๋ง์ต๋๋ค.๊ฒฐ์ธก์น ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ ์ํ ์๊ฐ ๊ด๊ณ์ ๋ค์๊ณผ ๊ฐ์ด ํด์ฃผ์ธ์.xtest = xtest.fillna(xtest.mean()) # ์์นํxtest['category'] = xtest['category'].fillna('Unknown') # ๋ฒ์ฃผํ๊ทธ๋ฆฌ๊ณ ๋๋ฒ์งธ ์ง๋ฌธ์ด์ ์ํซ์ธ์ฝ๋ฉ ๋ถ์ผ์น ๋ฌธ์ ๋ ๋งค์ฐ ์ค์ํ ์ง๋ฌธ ์ ๋๋ค.๋ฌธ์ ์ํฉ:# Train: ๋ฏธ๊ตญ, ์๊ตญ, ํ๋์ค# Test: ๋ ์ผ, ๋ฌ์์, ์๊ตญpd.get_dummies(xtrain) # 3๊ฐ ์ปฌ๋ผpd.get_dummies(xtest) # 3๊ฐ ์ปฌ๋ผ (๋ค๋ฅธ ์ด๋ฆ!) โ ์๋ฌ!ํด๊ฒฐ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ด ํ์๋ฉด ๋ฉ๋๋ค. ๋ฐฉ๋ฒ: pd.get_dummies() + reindex xtrain_encoded = pd.get_dummies(xtrain, columns=['country'])xtest_encoded = pd.get_dummies(xtest, columns=['country'])# test๋ฅผ train ์ปฌ๋ผ์ ๋ง์ถค (์๋ ์ปฌ๋ผ์ 0์ผ๋ก ์ฑ์)xtest_encoded = xtest_encoded.reindex(columns=xtrain_encoded.columns, fill_value=0)์ํ ์๊ฐ์ด ์ ํ๋์ด ์์ด์ ๊ฒฝ์ง๋ํ ํ ๋ ์ฒ๋ผ ๋ชจ๋ธ์ ๋ค์ํ๊ฒ ์ฐ๊ณ ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๋ฉฐ ์ํ ๋ฌธ์ ๋ฅผ ํ์๊ฐ ์์ต๋๋ค.๊ทธ๋์ ์ต๋ํ ๊ฐ๋จํ๊ฒ ์ฝ๋๋ฅผ ์๊ธฐํ๊ณ ์์ฑํ์๋ฉด 40์ ๋ง์ ์ 35์ ์ด์์ ๋ง์ถ์ ์์ผ๋๊น์. ์ผ๋จ ์ํ์ ์ต๋ํ ๊ฐ๋จํ๊ฒ ์ฝ๋๋ฅผ ์์ํ์๋๊ฑธ ์ถ์ฒ๋๋ ค์.๊ทธ๋ฆฌ๊ณ ๋๋ค ํฌ๋ ์คํธ ๋ถ๋ฅ์ ํ๊ท ์ง๋ฌธ์ ์์ฃผ ์ํด์ฃผ์ ง๋๋ฐ์.์ํ๋๋ ๊ทธ๋ฅ ๋ถ๋ฅ ๋ฌธ์ ๊ฐ ๋์ค๋ฉด ๋๋ค ํฌ๋ ์คํธ ๋ถ๋ฅ(RandomForestClassifier) ๋ฅผ ํ๊ณ ์์น ์์ธก ๋ฌธ์ ๊ฐ ๋์ค๋ฉด ๋๋ค ํฌ๋ ์คํธ ํ๊ท(RandomForestRegressor) ๋ก ํ๋ฉด ๋ฉ๋๋ค.๊ด๋ จ๋ ์์ ๋ ์ ๊ฐ ์ต๊ทผ 10ํ ์ํ๋ฌธ์ ๋ณต๊ธฐ๋ก ์ฌ๋ฆฐ 2์ ํ ๋ฌธ์ ๋ฅผ ์ฐธ๊ณ ํ์๋ฉด ํ๊ท๋ฌธ์ ๋ฅผ ๋ณด์ค ์ ์์ต๋๋ค.๋ถ๋ฅ๋ 2ํ~9ํ ์ํ์ ๋๋ถ๋ถ์ผ๋ก ๋๋ค ํฌ๋ ์คํธ ๋ถ๋ฅ๋ก ์ 2์ ํ์ ํ์ด์ ๊ทธ๊ฑธ ๋ณด์๋ฉด ๋๊ตฌ์.์ผ๋จ ์งง๊ณ ๊ฐ๋จํ๊ฒ 2์ ํ ์ฝ๋๋ฅผ ์์ฑํ์๊ณ ๊ณ์ ๋งค์ผ๋งค์ผ ์ํํ๊ฒฝ์์ ๋ฐ๋ณต ์ฐ์ตํ๋ค๋ณด๋ฉด ๊ผญ ํฉ๊ฒฉํ์ญ๋๋ค.ํ์ดํ ! ํ์ธ์.
- 0
- 2
- 41
Q&A
์ํซ์ธ์ฝ๋ฉ ์ดํ ์นผ๋ผ ๋ถ์ผ์น ๋ฌธ์
๋ค ~ ๋ต๋ณ๋๋ฆฌ๊ฒ ์ต๋๋ค.MinMaxScaler๋ 2์ฐจ์ ๋ฐฐ์ด์ ์ ๋ ฅ์ผ๋ก ๋ฐ์์ผ ํฉ๋๋ค.๊ทธ๋ฐ๋ฐ x_tr, x_val, test2๊ฐ 1์ฐจ์ ๋ฐฐ์ด(์๋ฆฌ์ฆ)์ด์ด์ ์๋ฌ๊ฐ ๋ฐ์ํ๋ ๊ฒ ๊ฐ์ต๋๋ค.๋ค์๊ณผ ๊ฐ์ด ์์ ํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค. from sklearn.preprocessing import MinMaxScalerscaler = MinMaxScaler()# 2์ฐจ์์ผ๋ก ๋ณํ ํ ์ค์ผ์ผ๋งx_tr_scaled = scaler.fit_transform(x_tr.values.reshape(-1, 1))x_val_scaled = scaler.transform(x_val.values.reshape(-1, 1))test2_scaled = scaler.transform(test2.values.reshape(-1, 1))# ํ์ํ๋ฉด ๋ค์ 1์ฐจ์์ผ๋กx_tr_scaled = x_tr_scaled.flatten()x_val_scaled = x_val_scaled.flatten()test2_scaled = test2_scaled.flatten() ์ฌ๊ธฐ์ ์ค์ํ ์ ์:1. reshape(-1, 1)๋ก 1์ฐจ์์ 2์ฐจ์์ผ๋ก ๋ณํํด์ผ ํฉ๋๋ค.2.ํ์ต ๋ฐ์ดํฐ(x_tr)๋ fit_transform()์ ์ฌ์ฉํ๊ณ ,3.๊ฒ์ฆ/ํ ์คํธ ๋ฐ์ดํฐ๋ transform()๋ง ์ฌ์ฉํฉ๋๋ค.์ด๋ ๊ฒ ํด์ผ ๋ฐ์ดํฐ ๋์๋ฅผ ๋ฐฉ์งํ ์ ์์ต๋๋ค.์๋์๋ฉด ๋ง์ํด์ฃผ์ธ์.
- 0
- 2
- 32
Q&A
6ํ 1์ ํ 3๋ฒ ๋ฌธ์
๋๋ฌด ์ ํ์ ๊ฒ๋๋ค. ์ค์ ์ํ๋๋ transform ์ด๋ ๋ญ๋ ๋ค ์๊ฐ์ด ์๋๊ณ ๋ด๊ฐ ํ์์ ์ฐ์ตํ๊ณ ํ์คํ ์๊ณ ์๋๊ฒ๋ง ์๊ฐ๋๊ธฐ ๋๋ฌธ์ ๋๋ถ๋ถ์ ์ํ์๋ถ๋ค์ด ๊ฑฐ์ ๋ ธ๊ฐ๋ค๋ก ์ฝ๋ฉํด์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค. ์ ๋ง ์ํ์ ๊ฑฐ์์. ๊ตณ์ด transfrom ์ผ๋ก ํ๊ณ ์ถ์ผ์๋ค๋ฉด ๋ค์๊ณผ ๊ฐ์ด ํ์๋ฉด ๋ฉ๋๋ค. df['yr'] = df['๋ ์ง'].str[:4] # ์ฒ์ 4๊ธ์๋งdf['sum'] = df[['์ ์์ ํ', '๊ฐ์ ์ ํ', '์๋ฅ', '์กํ']].sum(axis=1)df['gsum'] = df.groupby('yr')['sum'].transform('sum')result = df.loc[df['gsum'].idxmax()].iloc[0]print(int(round(result['gsum'] / 12, 0))) ๊ทธ๋ฆฌ๊ณ transform ์ด ์ดํด๋๊ธฐ ์ฌ์ฐ์๋ผ๊ณ ์์นจ์ ์๋ฃ๋ฅผ ์ค๋นํ๋๋ฐ ๋ค์์ ๋ด์ฉ์ ์ฐธ๊ณ ํด๋ณด๋ฉด ๋์์ด ๋ง์ด ๋ ๊ฒ ๊ฐ์ต๋๋ค. (์ฌ์ง)(์ฌ์ง)(์ฌ์ง)(์ฌ์ง) ์์ ๋ด์ฉ์ ์ ๊ฐ ์์์ผ๋ก ์ฌ๋ ค๋๋ฆด๊ป์.
- 0
- 1
- 38
Q&A
์ฝ๋ฉ ๋ฐฉ๋ฒ์ ๋ฐ๋ฅธ ์ฑ์ ๊ธฐ์ค์ ๊ดํ์ฌ ์ง๋ฌธ์์ต๋๋ค.
๋ณด์ฌ์ฃผ์ ์ฝ๋๋ ์ฒด์ ์ ๋ถ๋ฆฌํ์ ์ด ์ ํ ์์ผ์ ์ ๋ง ํ๋ฅญํ ์ฝ๋์ ๋๋ค.์ฒด์ ์ ์ฝ๋๊ฐ ์๋๋ผ ์ ์ถํ ๋ต์ผ๋ก ํ๊ธฐ ๋๋ฌธ์ ์ด๋ป๊ฒ ์์ฑํ์๋ ์ ํ ์๊ด ์์ผ์ญ๋๋ค.๋ค๋ง ์ํ๋๋ ๋ชจ๋ ์ฝ๋๋ฅผ ๋ค ์ธ์๊ฐ์ผํ๊ธฐ ๋๋ฌธ์ ๊ฐ๊ธ์ ๋จ์ํ๊ฒ ์ฝ๋๋ฅผ ์์ฑํ์ค ํ์๊ฐ ์์ต๋๋ค. ์๋ฅผ๋ค์ด ๋ณ์๋ช ๋ ๋์๋ฌธ์๋ฅผ ์์ด์ด๋ค๋๊ฐ (์:Produced) ํ๋ฉด ์๋ฌด๋๋ ์์ด ๋๊ฐ๊ณ ์คํ๊ฐ ๋์ ์คํ์ด ์๋ ์ ์์ผ๋ ๊ทธ๋ฅ ๋จ์ํ๊ณ ์งง๊ฒ ์์ฑํ์๋๊ฑธ ์ถ์ฒ๋๋ฆฝ๋๋ค.
- 0
- 1
- 43





![Thumbnail image of the [2025 Latest Exam Questions Reflected] Big Data Analytics Engineer Practical Exam 100% Pass! The Pattern of Past Exam Questions Becomes Clear!](https://cdn.inflearn.com/public/courses/335192/cover/99e36628-6e8d-4403-bfe3-7f5d5844aa9a/335192.jpg?w=148)
![Thumbnail image of the SQL for Immediate Practical Use [Direct Instruction by the Author of SQL200]](https://cdn.inflearn.com/public/courses/335513/cover/e2411bc7-040f-4c60-bbe9-2c254f0f8b18/335513.png?w=148)