강의

멘토링

로드맵

Inflearn コミュニティ Q&A

dachki のプロフィール画像
dachki

投稿した質問数

15日間のビッグデータパイロットプロジェクト

6.探索パイロット実行4段階 - 05.テーマ3-異常運転パターンスマートカー情報

주제영역3 데이타 조회 문의

作成

·

17

0

주제영역3 데이타 조회 문의 입니다.

 

저는 쿼리문장을 날리면

image.png

건수가 10개만 조회가됩니다.

managed_smartcar_drive_info 테이블를 전체데이타 건수는

image.png

43000건 정도나옵니다.

주제영역4는 실행하면 33건이 나오고있습니다.

질문은 주제영역3는 결과가 94건인데..

저는 10건이라서 제가 어떤 부분을 잘못한건지?

아니면 저사향이고 랜덤으로 자바파일 로그 데이타 생성이므로 문제가 없는 건지 질문드립니다.

또한 , 10건이여도 7장이후 분석에서 문제가 없는지 질문합니다.

빅데이터hadoopkafkazookeeperredisflumeimpala데이터-엔지니어링

回答 2

0

빅디님의 프로필 이미지
빅디
インストラクター

안녕하세요! 뒤안길님!!!

Managed_Smartcar_Symptom_Info 테이블에 10건은 다음 주제영역 및 과제를 진행하는데 문제 되지 않습니다.

해당 테이블은 스마트카 이상징후 정보가 10건이 발견 됐다는 얘기 인데요,

시뮬레이터를 오래 돌리면 그 건수가 증가 하게 되어 있는데, 10건 정도면 다음 작업 수행에 지장이 없습니다.

아~주! 잘하고 계세요!!! 파일럿플젝 끝까지 화이팅 해주세요!! ^^

-빅디 드림

0

안녕하세요, 인프런 AI 인턴입니다. 뒤안길님!

현재 질문하신 내용은 데이터 조회 결과가 강의와 다르게 나타나는 문제에 대한 것 같습니다. 이와 관련된 유사한 상황과 해결 방법을 통해 같은 문제를 해결한 사례를 제공해 드리겠습니다.

  1. 15일간의 빅데이터 파일럿 프로젝트에서 데이터 수집 및 적재 과정 문제 해결 방법에서 Big.D의 답변에서 설명된 것처럼 데이터 조회나 적재 과정에서 발생할 수 있는 문제는 여러 가지 이유가 있을 수 있습니다. 특히, 데이터 생성 시 랜덤성이나 환경 설정 차이로 인해 발생할 수 있습니다.

  2. 하둡과 카프카, 스톰 등 주변 기술 스택과의 설정 차이에서도 여러 사용자의 환경이나 로그 생성 조건에 따라 결과가 달리 나타날 수 있다고 설명하고 있습니다.

데이터 분석 과정에서 10건의 데이터만 있어도 분석 자체는 가능하지만, 데이터 양이 적어질수록 통계적 의미나 패턴 발견이 제한될 수 있습니다. 하지만 데이터의 질을 통해 의미 있는 분석 결과를 도출할 수 있는 경우도 있으니, 10건의 데이터로도 충분히 분석에 도전해 보실 수 있습니다.

더 나아가, 강의에서 데이터를 생성하는 로그 시뮬레이터는 특정 조건 하에서 작동하며, 조건에 따라 결과가 달라질 수 있기 때문에, 문제가 없는 경우도 많습니다. 하지만 만약 데이터의 부족으로 분석의 제약이 생기는 것이라면, 시뮬레이터의 조건을 확인하여 추가적인 데이터를 생성하거나 다른 방법으로 데이터를 확보해 볼 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

dachki のプロフィール画像
dachki

投稿した質問数

質問する