roadmap
@roadmap
受講生
6,790
受講レビュー
1,138
講義評価
4.9
講義
受講レビュー
- [仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)
- [4週]『Vibe Coding』完読チャレンジ:退勤後1時間一緒に勉強しよう(完走時にGilbut 2万ポイント進呈)
- [4週]『Vibe Coding』完読チャレンジ:退勤後1時間一緒に勉強しよう(完走時にGilbut 2万ポイント進呈)
- [4週]『Vibe Coding』完読チャレンジ:退勤後1時間一緒に勉強しよう(完走時にGilbut 2万ポイント進呈)
投稿
Q&A
작업형1 모의문제 4번에 3)문제 질문
df=df.iloc[0:10] 이 코드에서 만약 100개의 데이터가 있었다면 10개로 슬라이싱이 되버렸습니다.그럼 10개의 데이터만 df에 남아 있는데 특정 컬럼 합계를 묻게 되면 나머지 90개는 알 수가 없습니다.
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 17
Q&A
이상치 전처리 작업
안녕하세요!좋은 질문입니다 😊말씀하신 것처럼 이상치를 판단하는 방법에는 현실적인 범위 기준(도메인 지식) 과 통계적 기준(IQR, 분위수 기반) 이 모두 있습니다.학교에서 배우신 IQR 방식도 충분히 올바른 방법입니다.다만 빅데이터분석기사 실기 시험에서는 제공되는 데이터 크기가 비교적 작고, 데이터의 특성을 지금 알 수 없어요. 이런 상황에서 IQR을 일괄적으로 적용하면 실제로 필요한 데이터까지 이상치로 판단되어 삭제될 수 있고, 결과적으로 학습 데이터가 너무 줄어 성능에 영향을 줄 가능성이 있습니다.틀린 접근은 아니나 작업형2 시험에서는 리스크가 있어 추천하진 않습니다. 예를 들어 다중 분류 A, B, C가 있고 C가 10개 밖에 없는데 IQR로 50%가 삭제되면 성능에 문제가 생겨요
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 25
Q&A
시계열 데이터 날짜와 시간 format
혹시 강의 어디에 제가 H만 대문자로 사용이라고 했을까요? 알려주시면 너무 감사하겠습니다.시간은 모두 대문자가 맞습니다!! ## Python 날짜와 시간 포맷 코드 정리 ### 📅 날짜 | 코드 | 의미 | 예시 출력 | |------|------|-----------| | `%Y` | 연도 (4자리) | 2024 | | `%y` | 연도 (2자리) | 24 | | `%m` | 월 (01~12) | 07 | | `%d` | 일 (01~31) | 05 | | `%A` | 요일 (전체) | Monday | | `%a` | 요일 (약어) | Mon | | `%B` | 월 이름 (전체) | July | | `%b` | 월 이름 (약어) | Jul | --- ### ⏰ 시간 | 코드 | 의미 | 예시 출력 | |------|------|-----------| | `%H` | 시 (24시간, 00~23) | 14 | | `%I` | 시 (12시간, 01~12) | 02 | | `%M` | 분 (00~59) | 07 | | `%S` | 초 (00~59) | 05 | | `%f` | 마이크로초 (6자리) | 000123 | | `%p` | AM / PM | PM | --- ### 🔗 자주 쓰는 조합 | 패턴 | 예시 출력 | |------|-----------| | `%Y-%m-%d` | 2024-07-05 | | `%H:%M:%S` | 14:07:05 | | `%Y-%m-%d %H:%M:%S` | 2024-07-05 14:07:05 | | `%Y년 %m월 %d일` | 2024년 07월 05일 | | `%A, %B %d, %Y` | Friday, July 05, 2024 | --- ### ⚠️ 헷갈리기 쉬운 것 | 코드 | 실제 의미 | 흔한 실수 | |------|-----------|-----------| | `%m` | 월 (month) 01~12 | 분으로 착각 → 분은 `%M` | | `%M` | 분 (minute) 00~59 | 월로 착각 → 월은 `%m` | | `%s` | ❌ 공식 미지원 | 초로 착각 → 초는 `%S` | | `%h` | ❌ 존재하지 않음 | 시로 착각 → 시는 `%H` |
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 34
Q&A
평가결과값 문의
작성한 코드는 잘 작성하셨습니다. 데이터가 문제가 있었네요!id가 라벨이 예측이 가능한 부분이 있어 id가 있을 때 1.0이 나왔습니다. 제가 곧 수정해서 업데잇 하겠습니다. 알려주셔서 감사해요!! 응원합니다
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 28
Q&A
수업중에 사용하신 참고 자료 공유해주세요.
안녕하세요! 영상 하단에 링크 공유 하였습니다. 감사합니다:)
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 11
Q&A
작업형 2 기출7회분에서
결론만 말씀드리면 100% 사용하는 것이 좋습니다.단, 데이터에 따라 달라져 반드시 성능이 향상된다고 말할 순 없어요!(혹시 코드가 익숙하시다면 크로스 밸리데이션, k-fold 기법도 추천합니다. 입문자의 경우 제외) 100% 사용할 경우 단, 재학습해야 하므로 코드가 복잡해집니다. 입문자의 경우 재학습 과정에서 실수할 가능성이 있어 심화 내용이라고 말씀드리고 싶네요!왜 강조하지는 않고 있냐?시험을 위한 과정인데 80% 학습해도 40점 구간에선 그동안 문제가 없었어요! 언제 꼭 필요할까?최근 다중분류(11회) 문제에서 극단적인 불균형 데이터를 준 케이스가 있어요!이럴 땐 100% 사용하는 것이 유리하다고 볼 수 있습니다.
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 38
Q&A
평가지표 F1 스코어 질문드립니다.
평기 기준은 명확하게 출제 됩니다.F1 스코어만 요청했다면 이진 분류이고, F1 스코어만 사용하면 됩니다.추가 옵션이 있는 경우 다중 분류이고 F1 스코어에서 제시된 옵션값을 추가하면됩니다. 단, 평가 기준은 실제 채점과는 관련이 없습니다. 자체적으로 검증데이터로 자가 평가하는 용도입니다. (모의시험)
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 26
Q&A
수강 기간 연장 문의 드립니다.
메일 답변 완료
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 41
Q&A
수강기간 연장 문의드립니다.
메일 발송 - 연장 문의는 일괄 답변하고 있어 답변 처리가 늦을 수 있단점 양해 부탁드려요 감사합니다
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 38
Q&A
수강기간 연장 문의드립니다.
메일 발송 - 연장 문의는 일괄 답변하고 있어 답변 처리가 늦을 수 있단점 양해 부탁드려요 감사합니다
- いいね数
- 0
- コメント数
- 2
- 閲覧数
- 44





![Thumbnail image of the [仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)](https://cdn.inflearn.com/public/courses/329972/cover/dcfb28fd-48c1-4bb1-ab31-d59eac874194/329972-original.png?w=148)