묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2(신 버전)
예시문제 작업형2를 먼저 푼 뒤에 풀이 영상을 봤습니다.근데 제가 처음에 풀 때는 train, test 데이터의 주구매상품을 unique 찍어보니 다르게 나와서 pd.concat을 통해 데이터를 합친 뒤 라벨 인코딩을 하고 다시 나눠서 진행했습니다.근데 풀이영상에서는 안 합치고 라벨 인코딩을 진행하셨는데 train 테이블 가지고 학습하는데 예측할 테이블보다 유니크 수가 더 많으면 굳이 합칠 필요가 없는 건가요?그리고 합쳐서 진행해도 상관 없는 걸까요? roc_auc_score는 0.62점으로 풀이 영상보다 높게 나오긴 했습니다.
-
미해결파이썬 주식 매매 봇으로 주식시장 자동사냥하기
국내주식 과거 분봉데이터 관련
안녕하세요, 국내주식 과거 분봉데이터를 받을수는 없는것인가요? 한투 사이트를 보면 당일 분봉데이터만 제공하는 것으로 보입니다만, 다른 방법이 있는지 문의드립니다. 분봉데이터를 받아볼수 있다면, 어떤식으로 데이터를 보관?하여 벡테스팅을 하는것이 효율적인지 조언구합니다. 예를들어 SQL 데이터베이스 같은 db를 사용하는게 나을지 등감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 기출유형 (작업형2)
8회 기출유형 (작업형2) 문제 관련해서 저장할때 오류가 떠서 문의드립니다. import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/8_2/churn_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/8_2/churn_test.csv") train.shape, test.shape cols = train.select_dtypes(include='object').columns cols from sklearn.preprocessing import LabelEncoder for col in cols: le = LabelEncoder() train[col]=le.fit_transform(train[col]) test[col]=le.transform(test[col]) from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val = train_test_split (train,target,test_size=0.2,random_state=2022) X_tr.shape,X_val.shape,y_tr.shape,y_val.shape from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor(random_state=2022) model.fit(X_tr,y_tr) pred = model.predict(X_val) from sklearn.metrics import mean_absolute_error mae = mean_absolute_error(y_val,pred) print(mae) pred = model.predict(test) submit = pd.DataFrame({'pred':pred})제일 마지막 pred = model.predict(test) 과정에서ValueError Traceback (most recent call last) <ipython-input-82-67795a42191c> in <cell line: 0>() ----> 1 pred = model.predict(test) 2 submit = pd.DataFrame({'pred':pred}) 5 frames/usr/local/lib/python3.11/dist-packages/pandas/core/generic.py in __array__(self, dtype, copy) 2151 ) -> np.ndarray: 2152 values = self._values -> 2153 arr = np.asarray(values, dtype=dtype) 2154 if ( 2155 astype_is_view(values.dtype, arr.dtype) ValueError: could not convert string to float: 'CUST0769'이런 오류가 뜨길래 검색해보니 object 형태의 컬럼이 있다고 오류가 뜹니다ㅠ전처리 과정에서 Label인코딩을 하였고, 데이터 형태 int로 바뀐것까지 확인하였는데,확인 부탁드리겠습니다ㅠㅠ선생님 강의에서 customer_ID를 삭제(drop)하였는데, 그걸 저는 따로 진행을 안했는데, 혹시 그것 때문인지 문의드립니다!추가로 customer_ID를 삭제 안하고 진행해도 괜찮은지도 알려주시면 감사하겠습니다~!^^
-
해결됨인프런 클론코딩 Part 1: Next.js와 NestJS로 시작하는 실전 프로젝트
로펀의 인프런 상담소 슬랙 채널 주소
25년 06월 01일 기준, 노션페이지에서 해당 글이 안 보이는데 슬랙채널 링크 여쭤봐도 되나요?
-
미해결RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.6 질문
624만원이 안나와요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 유형
문제에서 어떤방법으로 검정하라고 알려주나요? 예를 들면 '샤피로검정으로 분석하시오' 이런식으로 검정 방법을 명확히 알려주는지 어떠한 상황으로만 가정하는지 궁금합니다
-
해결됨RAG를 활용한 LLM Application 개발 (feat. LangChain)
3.4.1 PineconeVectorStore.from_documents() 안됩니다.
Upstage를 사용해도, exceeded 되었다고 에러나서요. 뭔가 최근에 토큰 제한이 줄었나봐요. 아래와 같이 batch를 주어서 반복문으로 요청후 database.add_documents(batch)하는 방식으로 해야되네요 ㅠㅠ from langchain_pinecone import PineconeVectorStore # 데이터를 처음 저장할 때 index_name = 'tax-upstage-index' # Split documents into smaller chunks text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100) chunked_documents = text_splitter.split_documents(document_list) print(f"Chunked documents length: {len(chunked_documents)}") # Initialize the PineconeVectorStore database = PineconeVectorStore.from_documents( documents=[], # Start with an empty list embedding=embedding, index_name=index_name ) # Upload documents in batches batch_size = 100 for i in range(0, len(chunked_documents), batch_size): print(f'index: {i}, batch size: {batch_size}') batch = chunked_documents[i:i + batch_size] database.add_documents(batch) # Add documents to the existing database
-
미해결홍정모의 따라하며 배우는 C++
explicit instantiation에 대해
굳이 cpp파일에 사용자가 인스턴스화 할 필요 없이 그냥 헤더에 구현body를 두고 알아서 동작하게 하면 되는거 아닌가요?cpp파일에 사용자가 인스턴싱하면 헤더가 깔끔해지는 것 이외의 장점이 또 있나요?
-
해결됨기초 탄탄! 독하게 시작하는 Java - Part 2 : OOP와 JVM
Object Header 의 Klass word (39강 36:00)
39강의 36분 경에 보여주시는 그림에 보면 Object Header 의 Klass word 가 Metaspace 영역의 Class 클래스의 메타데이터를 가르키고 있습니다. 해당 Class 클래스의 메타데이터 내용을 보면 Object Age 나 Lock Flag 등이 들어가는데 제가 공부하기로는 Object Age 나 Lock Flag 와 같은 개별 인스턴스가 가져야 하는 메타데이터는 Mark Word 에 저장되는 것으로 알고 있었는데, 아닌가요?그렇다면 이 강의에서 설명하신 바로는 Class 클래스가 클래스로더의 "준비" 단계에서 생성되고, 실제 인스턴스 객체는 나중에 생성된다고 하셨는데 "준비"단계에 생성된 Class 클래스에 인스턴스 별로 다르게 가져야 하는 정보 (age, lock flag 등) 이 어떻게 구별되서 저장되나요?
-
해결됨실무에 바로 적용하는 스토리북과 UI 테스트
스토리북 테스트에 대한 질문
강의 중 스토리북이 테스트를 위한 라이브러리라고 말씀하신 부분이 있는데요,스토리북 테스트 라이브러리가 yarn pnp와 의존성 간의 충돌이 있는 것으로 보입니다. 혹시 yarn pnp 환경에서 스토리북으로 컴포넌트에 대한 테스트를 진행하고 싶으면 어떻게 진행하면 좋을까요?
-
미해결
2024 책이랑 2025책 차이
안녕하세요, 선생님.올해 4월에 선생님 강의를 구매하며 함께 병행하려고 선생님 책을 중고로 구매했습니다. 되도록 새책을 사려 했는데 모두 품절?절판?인데다, 언제 다시 오픈될지도 모르는 상황이였는데, 가능하면 종이책으로 공부하고 싶어서… 중고책을 구매했었습니다. 그런데 이번 5월에 책이 새로 나왔더라구요ㅠ 혹시 책 내용이 많이 달라졌는지 궁금합니다. 그렇다면 새로 구입을 해야 할 것 같아서요.. ㅜㅜ 달라졌다면 어떤 부분이 달라졌는지, 그리고 기존 책으로 공부해도 되는지가 궁금합니다.
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
섹션7-8회 관련 질문
안녕하세요 강의 잘 듣고 있습니다8회 문제 풀이 중 관련 질문 드립니다작업형1_문제11-2 에서 '피 소비량이 3번째로 많은 도시('city')의 커피 소비량을 구할 때, 'city' 가 같은 데이터가 있는데 city 별로 groupby 할 필요는 없을까요?작업형1_문제2x = 전자 생산 비율이 세번째로 높은 국가의 전자 생산량 으로 문제에서는 정의되어있는데인데 강의에서는 x를 전자생산비율로 계산하는데, 어떤 수치를 확인하는게 맞는지 확인 부탁드립니다작업형3_문제1강의의 풀이방식과는 조금 다르게 아래와 같이 문제를 풀어서 p-value 값을 구했습니다 pvalue 값은 조금 다른데 이렇게 해도 동일하다고 봐도 될까요? from statsmodels.formula.api import logit model2 = logit("Resign ~ Age + YearsAtCompany + MonthlyIncome + JobSatisfaction + Overtime", data=df) data2 = model2.fit() data2.summary()작업형3_문제2다중 선형 회귀분석 수행을 위해 상수항을 추가하는 이유가 궁금합니다답변 부탁드립니다.감사합니다!
-
해결됨오브젝트 - 설계 원칙편
4-2 머니클래스의 사용 질문
의문이 드는게 어디냐면 calc에서Money.won( (long) Math.ceil( money.doubleValue ))을 통해서 Money를 만들어내잖아요.일단 설명의 용이성을 위해 static won이나 메소드 doblueValue 생략하신건 문제 없습니다만..1. money.doubleValue는 환률과 무관한 컨텍스트로 토해지는 값인거 같은데2. 그 값을 바탕으로 won을 통한 Money를 만들어도 되는거냐싶은 생각이 너무 들어요 ^^;아예 값과 참조에 집중하려면 Money.value(long)같은걸로 했어야 하지 않았나 싶은...실제 이어지는 ceil의 메소드화에서는 아예 won의 도움없이 Money를 숫자기반으로 만들기도 했구요.
-
해결됨코틀린 코루틴 완전 정복
왜 runBlocking 종료로 메인스레드가 종료될까요?
새로운 루트Job이 dispatchers.IO 스레드에 의해 실행되면, 메인스레드가 기다려야하지 않나요?dispatchers.IO 에 의해 할당되는 실행 스레드는 데몬스레드가 아닐거같은데 말이죠..
-
해결됨오브젝트 - 설계 원칙편
4-2강 음량 작음
왠지는 모르겠으나 4-2강만 음량이 다른 강의 대비 80%수준으로 낮아지는.. 죄송 별걸다..=.=
-
미해결멀티패러다임 프로그래밍 1편: 반복자 패턴 & LISP (with TypeScript, Clojure, Kotlin)
멀티패러다임 프로그래밍 책
유인동님! 안녕하세요!!책을 아직 구매하지 않았는데 책과 이 영상강의중 어떤 것이 더 심화된 내용일까요!?아니면 같은내용인데 영상으로 더 쉽게 접할 수 있게 만드신 강의인건지 궁금합니다!
-
미해결
yum 관련 오류
CentOS 7 버전으로 한 경우 오류 레포지토리 내 패키지들이 삭제로 인해 yum 이 처리안되는경우강좌내용시 server(B)에 yum -y install bind_utils 등등 설치시 오류납니다. - /etc/yum.repos.d 미러 폴더 변경[base]# newbaseurl=http://centos.mirror.cdnetworks.com/7/os/x86_64[updates]# newbaseurl=http://centos.mirror.cdnetworks.com/7/updates/x86_64[extras]# newbaseurl=http://centos.mirror.cdnetworks.com/7/extras/x86_64[centosplus]# newbaseurl=http://centos.mirror.cdnetworks.com/7/centosplus/
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선생님 짧은 길은 없는걸까요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작년 말에 하고 개인적인 일이 크게 있어서 멘탈터져갖고 응시포기하고, 이번에 또 준비중인데요 확실히 쉽지 않네요. 사람들이 유형2랑 유형 3만 기출 반복 통해서 좀 하면 된다고 하는데, 마음의 여유가 없다보니.. 혹시 2유형이라도 일단 정복하고 싶은데 학습 순서 추천 가능할까요
-
해결됨한 입 크기로 잘라먹는 Next.js(v15)
2-11 InferGetServerSidePropsType<T> 제네릭 관련 질문
안녕하세요getServerSideProps 함수로 반환된 props 타입을 정의하는데 있어서 이해가 잘 가지 않아 질문드립니다.props의 타입을 지정할 때, next js의 내장타입을 사용하면서 해당 타입의 제네릭으로InferGetServerSidePropsType<typeof getServerSideProps>이렇게 작성하는데, <typeof getServerSideProps> 의 값은 function인데 어떻게 props 내부의 값을 전달할 파악할 수 있는지 궁금합니다. 제가 제네릭에 대한 이해도가 낮아서 그런거 같기도 한데,,, 답변 주시면 감사드리겠습니다.
-
해결됨10주완성 C++ 코딩테스트 | 알고리즘 코딩테스트
2-P 백준 14502 질문입니다.
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 문제 해설에서 큰돌님이 벽을 세우실 때 아래와 같이 for문으로 순열을 구현하셨습니다.그런데 큰돌님의 개념 교안에는 아래처럼 for문으로 구현돼있더라구요. 위 처럼 구현해도 실전에서 별 상관이 없는것인가요? 순서만 다를 뿐 취향대로 코드를 작성하면 되는건지 질문드립니다.