์ฑ„๋„ํ†ก ์•„์ด์ฝ˜

์‹ค๋ฌด์—์„œ ํ†ตํ•˜๋Š” ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ - Pandas(ํŒ๋‹ค์Šค) ์‹ค์ „ ๊ฐ•์˜

์ด ๊ฐ•์˜๋Š” ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์ฒ˜์Œ ์‹œ์ž‘ํ•˜๋Š” ํ•™์Šต์ž๋ถ€ํ„ฐ ์‹ค๋ฌด์—์„œ ํ™œ์šฉํ•˜๋ ค๋Š” ํ•™์Šต์ž๊นŒ์ง€ ๋ชจ๋‘๋ฅผ ๋Œ€์ƒ์œผ๋กœ, R์„ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์™€ ์‹œ๊ฐํ™” ์ „ ๊ณผ์ •์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ตฌ์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์šฐ์„  ๊ธฐ์ดˆ ์„ธํŒ… ๋‹จ๊ณ„์—์„œ๋Š” ๊ฐœ๋ฐœ ํ™˜๊ฒฝ ์„ค์น˜๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ DataFrame๊ณผ Series ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์ตํžˆ๋ฉฐ, R ํ”„๋กœ๊ทธ๋ž˜๋ฐ์— ํ•„์š”ํ•œ ๊ธฐ๋ณธ๊ธฐ๋ฅผ ํƒ„ํƒ„ํ•˜๊ฒŒ ๋‹ค์ง‘๋‹ˆ๋‹ค. ์ด์–ด์„œ ํ•ต์‹ฌ ๊ธฐ๋Šฅ ํ•™์Šต์œผ๋กœ ๋„˜์–ด๊ฐ€ ์ธ๋ฑ์‹ฑ, ์Šฌ๋ผ์ด์‹ฑ, ์ •๋ ฌ, ํ•„ํ„ฐ๋ง, ๊ฒฐ์ธก์น˜ ์ฒ˜๋ฆฌ ๋“ฑ ๋ฐ์ดํ„ฐ ๋ถ„์„์—์„œ ๊ฐ€์žฅ ์ž์ฃผ ์‚ฌ์šฉ๋˜๋Š” ๊ธฐ๋Šฅ๋“ค์„ ์‹ค์Šต ์ค‘์‹ฌ์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์ดˆ๋ฅผ ๋‹ค์ง„ ํ›„์—๋Š” ์ค‘๊ธ‰ ๊ธฐ๋Šฅ์œผ๋กœ ํ™•์žฅํ•˜์—ฌ ๋‚ ์งœยท์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ, ๊ทธ๋ฃนํ™” ์—ฐ์‚ฐ(groupby), ๋ฐ์ดํ„ฐ ๋ณ‘ํ•ฉ(merge, concat), ํ•จ์ˆ˜ ์ ์šฉ(apply, lambda) ๋“ฑ ์‹ค์ œ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์—…๋ฌด์—์„œ ํ•„์ˆ˜์ ์œผ๋กœ ์š”๊ตฌ๋˜๋Š” ๊ธฐ๋Šฅ๋“ค์„ ์ง‘์ค‘์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋‹จ์ˆœํ•œ ๋ฐ์ดํ„ฐ ์กฐ์ž‘์„ ๋„˜์–ด, ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋Šฅ๋ ฅ์„ ๊ธฐ๋ฅผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ์‹œ๊ฐํ™” ํŒŒํŠธ์—์„œ๋Š” ์„  ๊ทธ๋ž˜ํ”„, ํžˆ์Šคํ† ๊ทธ๋žจ, ๋ฐ•์Šคํ”Œ๋กฏ, ์‹œ๊ณ„์—ด ๊ทธ๋ž˜ํ”„ ๋“ฑ ๋‹ค์–‘ํ•œ ์‹œ๊ฐํ™” ๊ธฐ๋ฒ•์„ ๋‹ค๋ฃจ์–ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด๋‹ค ์ง๊ด€์ ์œผ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์‹œ๊ฐํ™”๋ฅผ ํ†ตํ•ด ๋ถ„์„ ๊ฒฐ๊ณผ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ „๋‹ฌํ•˜๋Š” ๋Šฅ๋ ฅ๊นŒ์ง€ ํ•จ๊ป˜ ์Šต๋“ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ๋ณธ ๊ฐ•์˜๋Š” ์ด๋ก  ํ•™์Šต์— ๊ทธ์น˜์ง€ ์•Š๊ณ , ๋‹ค์–‘ํ•œ ์˜ˆ์ œ์™€ ๋‹จ๊ณ„๋ณ„ ์‹ค์Šต์„ ํ†ตํ•ด ๋ฐฐ์šด ๋‚ด์šฉ์„ ๋ฐ”๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ˆ˜๊ฐ•์ƒ์€ ๊ฐ•์˜๋ฅผ ๋”ฐ๋ผ๊ฐ€๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋„ ์‹ค๋ฌด ๊ฐ๊ฐ์„ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํ‚ค์šฐ๊ณ , ๋‚˜์•„๊ฐ€ ์‹ค์ œ ํ”„๋กœ์ ํŠธ์—๋„ ํ™œ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์—ญ๋Ÿ‰์„ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

6๋ช… ์ด ์ˆ˜๊ฐ•ํ•˜๊ณ  ์žˆ์–ด์š”.

๋‚œ์ด๋„ ์ž…๋ฌธ

์ˆ˜๊ฐ•๊ธฐํ•œ 12๊ฐœ์›”

๋‚ ๊ฐœ ๋‹ฌ๋ฆฐ ๋™์ „

๊ฐ•์˜ ์ถ”์ฒœํ•˜๊ณ  ์„ฑ์žฅ๊ณผ ์ˆ˜์ต์„ ๋งŒ๋“ค์–ด ๋ณด์„ธ์š”!

๋‚ ๊ฐœ ๋‹ฌ๋ฆฐ ๋™์ „

๋งˆ์ผ€ํŒ… ํŒŒํŠธ๋„ˆ์Šค

๊ฐ•์˜ ์ถ”์ฒœํ•˜๊ณ  ์„ฑ์žฅ๊ณผ ์ˆ˜์ต์„ ๋งŒ๋“ค์–ด ๋ณด์„ธ์š”!

์ˆ˜๊ฐ• ํ›„ ์ด๋Ÿฐ๊ฑธ ์–ป์„ ์ˆ˜ ์žˆ์–ด์š”

  • pandas ๊ธฐ๋ณธ์— ๋Œ€ํ•ด์„œ ์™„์ „ํžˆ ํ•™์Šตํ•œ๋‹ค

  • ์‹ค์ œ ์˜ˆ์ œ๋ฅผ ํ†ตํ•ด ํ•™์Šต ๋‚ด์šฉ์„ ์‘์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ€์ง€๋„๋ก ํ•œ๋‹ค

์‹ค๋ฌด์—์„œ ํ†ตํ•˜๋Š” ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ - Pandas(ํŒ๋‹ค์Šค) ์‹ค์ „ ๊ฐ•์˜

์ด ๊ฐ•์˜๋Š” ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์ฒ˜์Œ ์‹œ์ž‘ํ•˜๋Š” ํ•™์Šต์ž๋ถ€ํ„ฐ ์‹ค๋ฌด์—์„œ ํ™œ์šฉํ•˜๋ ค๋Š” ํ•™์Šต์ž๊นŒ์ง€ ๋ชจ๋‘๋ฅผ ๋Œ€์ƒ์œผ๋กœ, R์„ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์™€ ์‹œ๊ฐํ™” ์ „ ๊ณผ์ •์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ตฌ์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์šฐ์„  ๊ธฐ์ดˆ ์„ธํŒ… ๋‹จ๊ณ„์—์„œ๋Š” ๊ฐœ๋ฐœ ํ™˜๊ฒฝ ์„ค์น˜๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ DataFrame๊ณผ Series ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์ตํžˆ๋ฉฐ, R ํ”„๋กœ๊ทธ๋ž˜๋ฐ์— ํ•„์š”ํ•œ ๊ธฐ๋ณธ๊ธฐ๋ฅผ ํƒ„ํƒ„ํ•˜๊ฒŒ ๋‹ค์ง‘๋‹ˆ๋‹ค. ์ด์–ด์„œ ํ•ต์‹ฌ ๊ธฐ๋Šฅ ํ•™์Šต์œผ๋กœ ๋„˜์–ด๊ฐ€ ์ธ๋ฑ์‹ฑ, ์Šฌ๋ผ์ด์‹ฑ, ์ •๋ ฌ, ํ•„ํ„ฐ๋ง, ๊ฒฐ์ธก์น˜ ์ฒ˜๋ฆฌ ๋“ฑ ๋ฐ์ดํ„ฐ ๋ถ„์„์—์„œ ๊ฐ€์žฅ ์ž์ฃผ ์‚ฌ์šฉ๋˜๋Š” ๊ธฐ๋Šฅ๋“ค์„ ์‹ค์Šต ์ค‘์‹ฌ์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์ดˆ๋ฅผ ๋‹ค์ง„ ํ›„์—๋Š” ์ค‘๊ธ‰ ๊ธฐ๋Šฅ์œผ๋กœ ํ™•์žฅํ•˜์—ฌ ๋‚ ์งœยท์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ, ๊ทธ๋ฃนํ™” ์—ฐ์‚ฐ(groupby), ๋ฐ์ดํ„ฐ ๋ณ‘ํ•ฉ(merge, concat), ํ•จ์ˆ˜ ์ ์šฉ(apply, lambda) ๋“ฑ ์‹ค์ œ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์—…๋ฌด์—์„œ ํ•„์ˆ˜์ ์œผ๋กœ ์š”๊ตฌ๋˜๋Š” ๊ธฐ๋Šฅ๋“ค์„ ์ง‘์ค‘์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋‹จ์ˆœํ•œ ๋ฐ์ดํ„ฐ ์กฐ์ž‘์„ ๋„˜์–ด, ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋Šฅ๋ ฅ์„ ๊ธฐ๋ฅผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ์‹œ๊ฐํ™” ํŒŒํŠธ์—์„œ๋Š” ์„  ๊ทธ๋ž˜ํ”„, ํžˆ์Šคํ† ๊ทธ๋žจ, ๋ฐ•์Šคํ”Œ๋กฏ, ์‹œ๊ณ„์—ด ๊ทธ๋ž˜ํ”„ ๋“ฑ ๋‹ค์–‘ํ•œ ์‹œ๊ฐํ™” ๊ธฐ๋ฒ•์„ ๋‹ค๋ฃจ์–ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด๋‹ค ์ง๊ด€์ ์œผ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์‹œ๊ฐํ™”๋ฅผ ํ†ตํ•ด ๋ถ„์„ ๊ฒฐ๊ณผ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ „๋‹ฌํ•˜๋Š” ๋Šฅ๋ ฅ๊นŒ์ง€ ํ•จ๊ป˜ ์Šต๋“ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ๋ณธ ๊ฐ•์˜๋Š” ์ด๋ก  ํ•™์Šต์— ๊ทธ์น˜์ง€ ์•Š๊ณ , ๋‹ค์–‘ํ•œ ์˜ˆ์ œ์™€ ๋‹จ๊ณ„๋ณ„ ์‹ค์Šต์„ ํ†ตํ•ด ๋ฐฐ์šด ๋‚ด์šฉ์„ ๋ฐ”๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ˆ˜๊ฐ•์ƒ์€ ๊ฐ•์˜๋ฅผ ๋”ฐ๋ผ๊ฐ€๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋„ ์‹ค๋ฌด ๊ฐ๊ฐ์„ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํ‚ค์šฐ๊ณ , ๋‚˜์•„๊ฐ€ ์‹ค์ œ ํ”„๋กœ์ ํŠธ์—๋„ ํ™œ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์—ญ๋Ÿ‰์„ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๋‚ด์šฉ์„ ๋ฐฐ์›Œ์š”

๐Ÿ”น Part 1-1. ๊ฐœ๋ฐœํ™˜๊ฒฝ ์„ค์น˜ ๋ฐ ์†Œ๊ฐœ

  • ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์‹œ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ๊ฐœ๋ฐœํ™˜๊ฒฝ ์„ค์น˜ ๊ณผ์ •์„ ๋‹จ๊ณ„๋ณ„๋กœ ๋‹ค๋ฃจ๋ฉฐ, Jupyter Notebook๊ณผ Python ํ™˜๊ฒฝ ์„ค์ •์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

  • Pandas ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์˜ ๊ฐœ๋…๊ณผ ํŠน์ง•์„ ์†Œ๊ฐœํ•˜๊ณ , ๋ฐ์ดํ„ฐ ๋ถ„์„์—์„œ Pandas๊ฐ€ ์–ด๋–ค ์—ญํ• ์„ ํ•˜๋Š”์ง€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”น Part 1-2. DataFrame

  • Pandas์˜ ํ•ต์‹ฌ ๊ฐ์ฒด์ธ DataFrame ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์˜ˆ์ œ๋ฅผ ํ†ตํ•ด ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

  • ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋กœ๋ถ€ํ„ฐ DataFrame์„ ๋งŒ๋“ค๊ณ , ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํŒŒ์ผ๋กœ ์ €์žฅํ•˜๋Š” ๋ฐฉ๋ฒ•๊นŒ์ง€ ์ตํžˆ๋ฉฐ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ ์ดํ•ด์™€ ๊ด€๋ฆฌ ๊ธฐ์ดˆ๋ฅผ ๋‹ค์ง‘๋‹ˆ๋‹ค.

๐Ÿ”น Part 1-3. Indexing & Slicing

  • DataFrame๊ณผ Series์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํšจ์œจ์ ์œผ๋กœ ๋‹ค๋ฃจ๊ธฐ ์œ„ํ•œ ์ธ๋ฑ์‹ฑ๊ณผ ์Šฌ๋ผ์ด์‹ฑ ๊ธฐ๋ฒ•์„ ์ง‘์ค‘์ ์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

  • ํ–‰๊ณผ ์—ด์„ ์ง€์ •ํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”์ถœํ•˜๊ณ  ๊ฐ€๊ณตํ•˜๋Š” ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์„ ์‹ค์Šตํ•˜์—ฌ ์‹ค๋ฌด ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์˜ ๊ธฐ๋ณธ๊ธฐ๋ฅผ ์Šต๋“ํ•ฉ๋‹ˆ๋‹ค.

์ˆ˜๊ฐ• ์ „ ์ฐธ๊ณ  ์‚ฌํ•ญ

์ด ๊ฐ•์˜๋Š” ์ง€์‹๊ณต์œ ์ž์˜ ์งˆ๋ฌธ/๋‹ต๋ณ€์„ ์ œ๊ณตํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค

ํ•™์Šต ์ž๋ฃŒ

์ฃผ์ฐจ๋ณ„ ๊ต์•ˆ์ด pdfํŒŒ์ผ๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค

์ด๋Ÿฐ ๋ถ„๋“ค๊ป˜
์ถ”์ฒœ๋“œ๋ ค์š”

ํ•™์Šต ๋Œ€์ƒ์€
๋ˆ„๊ตฌ์ผ๊นŒ์š”?

  • ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ์ž…๋ฌธ์ž

  • pandas ๊ธฐ๋ณธ์— ๋Œ€ํ•ด ์•Œ๊ณ ์‹ถ์œผ์‹  ๋ถ„

์•ˆ๋…•ํ•˜์„ธ์š”
์œ ์šฉํ•œITํ•™์Šต์ž…๋‹ˆ๋‹ค.

8,278,846

๋ช…

์ˆ˜๊ฐ•์ƒ

6,391

๊ฐœ

์ˆ˜๊ฐ•ํ‰

4.6

์ 

๊ฐ•์˜ ํ‰์ 

309

๊ฐœ

๊ฐ•์˜

์œ ์šฉํ•œ IT ๊ฐ•์˜๋ฅผ ํ†ตํ•ด ์—ฌ๋Ÿฌ๋ถ„์˜ ์„ฑ์žฅ์„ ๋•๊ฒ ์Šต๋‹ˆ๋‹ค.

์ปค๋ฆฌํ˜๋Ÿผ

์ „์ฒด

16๊ฐœ โˆ™ (6์‹œ๊ฐ„ 6๋ถ„)

ํ•ด๋‹น ๊ฐ•์˜์—์„œ ์ œ๊ณต:

์ˆ˜์—…์ž๋ฃŒ
๊ฐ•์˜ ๊ฒŒ์‹œ์ผ: 
๋งˆ์ง€๋ง‰ ์—…๋ฐ์ดํŠธ์ผ: 

์ˆ˜๊ฐ•ํ‰

์•„์ง ์ถฉ๋ถ„ํ•œ ํ‰๊ฐ€๋ฅผ ๋ฐ›์ง€ ๋ชปํ•œ ๊ฐ•์˜์ž…๋‹ˆ๋‹ค.
๋ชจ๋‘์—๊ฒŒ ๋„์›€์ด ๋˜๋Š” ์ˆ˜๊ฐ•ํ‰์˜ ์ฃผ์ธ๊ณต์ด ๋˜์–ด์ฃผ์„ธ์š”!

์œ ์šฉํ•œITํ•™์Šต๋‹˜์˜ ๋‹ค๋ฅธ ๊ฐ•์˜

์ง€์‹๊ณต์œ ์ž๋‹˜์˜ ๋‹ค๋ฅธ ๊ฐ•์˜๋ฅผ ๋งŒ๋‚˜๋ณด์„ธ์š”!

๋น„์Šทํ•œ ๊ฐ•์˜

๊ฐ™์€ ๋ถ„์•ผ์˜ ๋‹ค๋ฅธ ๊ฐ•์˜๋ฅผ ๋งŒ๋‚˜๋ณด์„ธ์š”!

โ‚ฉ66,000