묻고 답해요
130만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨SQL 코딩테스트를 위한 첫 걸음
EASY INNER JOIN 관련 average-selling-price 연습문제
선생님 이 문제에 대해서 and p.start_date <= u.purchase_dateand u.purchase_date <= p.end_date이 부분을 왜 조건을 달아줘야 하는지 궁금합니다. 따로 문제에 명시되지 않은거같은데.. 확인부탁드립니다! select p.product_id ,round(sum(u.units*p.price)/sum(u.units), 2) average_price from Prices pinner joinUnitsSold uon p.product_id=u.product_idand p.start_date <= u.purchase_dateand u.purchase_date <= p.end_dategroup by p.product_id;
-
미해결다양한 사례로 익히는 SQL 데이터 분석
시각화 그래프가 안보여요
안녕하세요. 매출 분석01 - 일/주/월/분기별 매출액 및 주문건수 시각화 하기강의를 들으면서 코드를 실행하는데 그래프가 이러타할 오류없이 나타나지 않아서 글 작성합니다. 각각 라이브러리의 버전은 아래와 같습니다. 쥬피터 파일 내의 [일별 매출 시각화] 에 대한 코드를 실행하는데, 쿼리가 들어간 데이터 프레임까지는 잘 실행이 되는데, 그래프를 그리는 코드를 실행하면 그래프가 나타나지 않습니다. <스크린샷1 - 데이터 프레임은 잘 나타남> <스크린 샷2 - 그래프 그리는 코드 실행시 그래프가 나타나지 않음> <스크린 샷 3 - 그래프 그리는 코드 실행시 그래프가 나타나지 않음> <스크린 샷4 - 키 에러라고 뜨는데 왜 이렇게 나타나는지 잘 모르겠어요. 코드를 따로 바꾸거나 수정하지 않았습니다. > 터미널이 이상해서 그런가하고 전체적으로 다 끄고 다시 켜서 실행해 봤는데도 나타나지 않아서 질문 드립니다.
-
미해결처음하는 SQL과 데이터베이스(MySQL) 부트캠프 [입문부터 활용까지] (업데이트)
섹션 1. 데이터베이스와 RDBMS 이해 강의자료가 어디있을까요?
섹션 1. 데이터베이스와 RDBMS 이해 강의를 켰는데 영상에는 자료를 보라고 했는데 오른쪽 강의자료란에는 다운로드버튼이 없어서요!확인해주시면 감사하겠습니다.
-
해결됨SQL 코딩테스트를 위한 첫 걸음
INNER JOIN 강의 질문
안녕하세요 선생님 INNER JOIN 문제에 대해 해석이 잘안되어서 질문하게 되었습니다.. 조인하기 전에 서브쿼리를 넣어서 쿼리를 완성하는지에 대해 궁금합니다 ㅠ 문제 자체를 잘 이해 못하고 있는거 같기도한데 상세한 설명 부탁드리겠습니다...
-
해결됨SW 개발자를 위한 성능 좋은 SQL 쿼리 작성법
JION을 이용한 중복 IO 제거 사례 강의 관련 문의
안녕하세요. 강의듣다가 궁금한사항이 있어 문의드립니다. 위 강의에서SELECT 서브쿼리에서 동일 테이블 접근으로 인해 I/O 중복 발생하여 아래처럼 인라인뷰를 만들고 JOIN을 하면 테이블 중복 I/O가 발생하지 않는것을 이해했는데요. 그런데 SELECT절에 COUNT만 필요해서 스칼라 서브쿼리를 한번만 사용하게 되면 중복I/O가 발생하지 않기에 스칼라 서브쿼리를 쓰는게 성능상 문제가 없는걸까요? 중복I/O 발생과는 좀 다른 내용일수 있지만 강의 듣다가 궁금해서 문의드립니다. 답변주시면 감사하겠습니다.
-
미해결시니어 백엔드 개발자가 알려주는 데이터베이스 개론 & SQL
강의자료
혹시 강의자료로 사용하시는 ppt 자료를 받을 수 있을까요? 복습할 때 있으면 유용할거 같습니다
-
미해결처음하는 SQL과 데이터베이스(MySQL) 부트캠프 [입문부터 활용까지] (업데이트)
sakila database sql 압축에 없다고 떠요
없다고 뜹니다..
-
미해결생애 첫 SQL With 제코베
수식 오류가 나요
SELECT Country || City || Address FROM Customers알려주신 대로 그대로 했는데 오류가 납니다ㅠㅠ
-
미해결데이터 분석 SQL Fundamentals
Non Equi 조인과 Cross 조인 실습 강의 내용에 대해 질문드립니다
선생님 안녕하세요강의 잘 보고 있습니다강의 중간(10:20~25초 사이)내용에 대해 확인하고 싶은 부분이 있습니다수업내용중 아래의 sql로 질의할때-- 직원 급여의 이력정보를 나타내며, 해당 급여를 가졌던 시점에서의 부서번호도 함께 가져올것. select * from hr.emp_salary_hist a join hr.emp_dept_hist b on a.empno = b.empno; record 4번 데이터의 deptno 값 30이 출력된다고 하셨습니다만 a.fromdate between b.fromdate and b.todate위의 between 조건으로 조인해서 sql로 질의했을 때에출력되는 결과물은record 3번 데이터 deptno 값 20이 출력되는데, record 3번의 a.fromdate (1982-01-01)값만이조인된 b.fromdate(1981-04-01) and b.todate(9999-12-31)의 범위에 해당되어 출력되는 인식인데 (제가 잘못 이해했을 수도 있습니다만... )어떻게 deptno값 30이 출력되는지가 궁금합니다
-
해결됨[SQL Quest] 실전 문제 풀이로 SQL 역량 강화 하기 (Basic)
데이터 관련 커리어에 관하여 질문드립니다.
안녕하세요. 현재 데이터 사이언티스트 및 엔지니어를 꿈꾸고 있습니다.데이터 사이언티스트가 회사에 따라 일하는 업종이 다르지만, 제가 생각하기에 제가 원하는 직무는 데이터 분석에 가까운 것 같습니다. 게임업계의 N사의 경우 데이터 사이언티스트를 채용했으나, 추천시스템이나 이상탐지 등 모델을 개발하는 업무라 아무래도 학사 출신 보다는 석/박사 출신들이 많을 것 같다는 생각이 들었기 때문입니다. 머신러닝과 딥러닝 모델을 가져와서 쓰는 것은 가능하지만, 만드는 것은 또 다른 영역이었기에, 해당 부분으로는 꿈을 접게 되었습니다.그래서 데이터 분석가 쪽으로 가자! 는 마음으로 Python외에도 SQL 공부를 지속적으로 해왔습니다. 문제는, 면접장을 가봤더니, 어떤 회사의 경우 SQL이 아닌 SAS를 쓰는 경우도 있었고, 가장 크게 한계에 부딪쳤던 부분은, 서비스 지표의 문제점을 파악하고 다양한 가설 및 A/B 테스트로 서비스 개선을 해보신 분 (모바일 서비스 데이터 분석), 데이터 시각화(Tableau 등 BI툴) 경험을 본다는 점입니다.SAS는 일단 너무 비싸기 때문에, 이건 혼자서 배울 수 있는 능력이 아니라고 판단해서, 제외했습니다.데이터 시각화의 경우 Tableau는 혼자서 책을 찾아보면서 공부를 하는 중입니다. Q1. 서비스 지표의 문제점을 파악하고 다양한 가설 및 A/B 테스트로 서비스 개선을 해보신 분 이라는 이 부분이 저는 도대체 어떻게 신입이 키워나갈 수 있는지, 어떻게 공부를 하면 좋을지... 잘 모르겠습니다. 서비스 지표를 통해서 해당 데이터를 분석하는 건 할 수 있지만, 지표의 문제점을 파악한다? 가 와닿지가 않습니다.마케팅 지표를 알아야, 해당 요건을 충족할 수 있을 것 같았지만, Q1을 해결하지 못해서, 데이터를 가지고 할 수 있는 일이 무엇이 있을까...를 생각해보던 중 Data Engineer라는 직무도 알게 되었습니다. Java SpringBoot 나 Django를 활용해서 웹을 개발한 경험도 있었고, Spark, Hive SQL에 대해서 공부를 했던 경험이 있었기 때문입니다. 그런데, 항상 공고에 등장했던 부분이었던 대용량 데이터 처리를 위한 데이터 파이프라인(수집/처리/분석) 개발 경험이 발목을 잡았던 것 같습니다. Q2. 데이터 파이프라인(수집/처리/분석) 개발 경험이 하둡 아키텍처나, K8S 내에서 트러블 슈팅 경험을 말하는 것인가요? 해당 부분을 해보려고 했으나, 문제는 하둡 아키텍처를 AWS로 구성하는데 비용이 엄청나게 들어서 엄두를 못냈습니다.수집은 크롤링으로 했는데, Kafka도 언급이 있는 걸 보면, Kafka나 Flink와 같이 실시간 스트리밍 수집을 공부해야할까요?아키텍처를 구성해야 할 것 같은데, 관련 지식이 없어서 문제입니다. 비전공자다 보니, 취업이 생각보다 너무 어렵게 느껴집니다. 이번 하반기는 유독 2차에서 많이 떨어졌네요.. 내년 상반기에는 좋은 소식이 있었으면 좋겠습니다. Q3. 추가로, 강사님께서 알려주신 부분을 공부하면서, 노션에 정리를 했었습니다. 노션에는 강사님께서 첨부하신 PDF자료는 일절 없고, 쿼리문과 제가 공부를 하면서 느낀 점이나, 어떻게 문제를 풀어야하는지 등을 정리했는데, 혹시 괜찮을까요? (노션이 홈페이지와 연동이 되어있다보니, 문제가 있다면 해당 부분은 개인 아카이브에 보관하겠습니다.)=> 답변주신부분대로 테이블 조회(데이터 확인=> 이건 강사님께서 만드신 소중한 수업 자료이니 해당 부분은 제외) 부분을 제외하구 쿼리 부분만 기재해도록 하겠습니다.
-
미해결생애 첫 SQL With 제코베
산술연산에서 오류가 나요
이렇게 계속 오류가 나요!
-
해결됨[SQL Quest] 실전 문제 풀이로 SQL 역량 강화 하기 (Basic)
3분 20초 FORMAT_DATE 반환 타입에 관하여
[기타 질문]선생님 3분 20초 쯤에, FORMAT_DATE('%Y', date)에 대한 주석 문에 대해서 int형이 아닌 String형으로 표시를 해야 할 것 같습니다.date between '2022-01-01' and '2022-12-31' -- 2022 -- date between '2022-01-01' and '2022-12-31' EXTRACT(YEAR FROM date) = 2022 -- 2022 -- EXTRACT(YEAR FROM date) -> int로 나온다. -- EXTRACT(날짜 단위 from 날짜 필드) FORMAT_DATE('%Y', date) = '2022' -- 2022선생님께서 알려주신 3가지 방법으로 모두 적용해보니,SELECT EXTRACT(YEAR FROM date), FORMAT_DATE('%Y', date) FROM project.daily_play WHERE (EXTRACT(YEAR FROM date) = 2023 AND mode = 3) OR (EXTRACT(YEAR FROM date) = 2022 AND mode = 4) 이런 식으로 나오더라구요. EXTRACT의 반환 값은 int형(숫자형)이 나오고, FORMAT_DATE이나 FORMAT_DATETIME의 경우 반환 값은 String 형태로 나오는 것 같습니다.
-
해결됨[SQL Quest] 실전 문제 풀이로 SQL 역량 강화 하기 (Basic)
데이터베이스에 맞게 연결했는데, BAD-REQUEST라고 나옵니다..
data-whiz에 첨부해주신 json파일을 강의에서 언급한 부분대로, Database를 Connect했는데, 자꾸 Connect error가 뜨네요.. 어떻게 해야할까요[기타 질문]쿼리 작성 질문 외 강의에서 사용된 용어 등 다양한 질문들도 환영합니다. 편안하게 질문 부탁드립니다🙋♂️🙋♀️
-
미해결[백문이불여일타] 데이터 분석을 위한 중급 SQL
왜 order by를 안넣으면 오류가 뜰까요?
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.top earners 문제에서 차근차근 따라하던 중에 자꾸 오류가 떠서 질문 드립니다.order by를 빼면 자꾸 이런 오류가 뜨고ERROR 1064 (42000) at line 1: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'ORDER BY earnings DESC' at line 5 포함을 하면잘 실행이 됩니다... 그리고 *에 대해서 헷갈리네요 나는 earnings를 기준으로 그게 몇명인지 카운트할거야 -> *를 쓰면 raw데이터에서 그 값에 해당되는 컬럼의 개수를 세주는 것인가요?
-
미해결[백문이불여일타] 데이터 분석을 위한 중급 SQL
w3school 오류
알려주신대로 하나도 틀림없이 썼는데도 결과값이 계속 저렇게 뜹니다. SELECT * FROM products와 같은 간단한 쿼리문에는 오류가 발생하지 않더라고요. 어떤 문제가 있을까요?
-
미해결[백문이불여일타] 데이터 분석을 위한 중급 SQL
COUNT를 쓰는 이유가 궁급합니다!
안녕하세요, 쿼리문을 작성하다가 궁금한 점이 생겨서 글을 남깁니다.기호 *는 컬럼의 모든 내용을 가지고 온다는 뜻으로 알고 있습니다, SELECT * 처럼요. 근데 이 쿼리문에서는 COUNT(*) 이라고 작성을 했을 때 earnings라는 컬럼의 모든 경우만 보여주는 이유는 GROUP BY 때문이라고 보면 될까요? 혹시 질문 자체에도 오류가 있다면 알려주시면 감사하겠습니다!
-
미해결공공데이터 CSV 파일을 이용해 테이블 만들기
[14강 도로명 주소db 구축(2)]관련
안녕하세요.평소에 궁금했던 분야였고 업무에 활용하고 싶었는데 아무래도 sql 초급수준이다 보니 어떻게 접근을 해야 할지 몰랐는데 본 강좌가 무척 도움이 되었습니다.이에 감사드리며 다소 기초적일 수 있는 질문 두가지를 드립니다. 아무리 생각해도 제 수준에서는 알 수가 없어서요.ㅡㅡ; 도로명주소db 활용방법 중 도로명코드의 update 쿼리문 중, rownum=1 을 사용하는 이유는 뭔가요? 어차피 where 조건으로 B.도로명코드=A.도로명 코드 AND B.읍면동일련번호 = A.읍면동일련번호 로 하면 한행만 나오지 않나요??간단히 쿼리문으로 조회를 해봤는데요. 조건상 1개의 행만 나와야 할 거 같은데 두개가 나오는 이유를 모르겠습니다. ( 23.10월 주소db 전체분 을 반영하였습니다.)
-
해결됨다양한 사례로 익히는 SQL 데이터 분석
ntile 정규분포에 관하여 ... 향후 일을 하게 될 시
강의를 듣는 도중, ntile()의 경우, 분포가 skew가 심하면(정규분포가 아니라면), 순위를 매길 때, 문제가 생김을 배울 수 있었습니다. Q1. 저는 왜곡이 되어있는 걸 보자마자, 차라리 판다스나 Spark SQL로 데이터를 정규화 한뒤에, 시각화를 하는게 더 빠르지 않을까? 하는 생각이 들었는데요, 기업에서 일을 하게 될 때, 어떤 경우에 SQL을 쓰는지가 궁금합니다.저는 강사님의 강의를 수강하며, python 데이터 분석 -> 머신러닝 -> 딥러닝 이후, 현재 SQL강의를 수강하고 있습니다. 희망직무는 데이터 사이언스트 및 데이터 엔지니어를 희망하는데, 항상 채용공고를 보면, python 능력도 중요하지만 고급 SQL 능력도 자격요건으로 되어 있는 경우가 많았습니다.Q2. 현업에서 데이터를 가공하거나 처리할 때, 오히려 프로그래밍언어보다는 SQL를 훨씬 많이 쓴다고 하는데, Q1처럼 때에 따라 유동적으로 쓰는 것인지, 아니면 앞으로 데이터 분석을 연습할 때도, (이를 테면, 캐글과 같은) 파이썬 보다는 SQL위주로 연습하는 것이 더 적합한 건지 여쭙고 싶습니다. Q3. 이건 머신러닝과 관련된 이야기지만, 이렇게까지 skew가 개선되지 않을 때는 어떻게 해야하나요?from sklearn.preprocessing import StandardScaler # OverSampling을 해도 Skew가 개선되지 않음 # UnderSampling을 하면 데이터가 줄어들기 때문에, 사용에 유의가 필요하나 skew가 # 너무 심하기 때문에 사용함. from imblearn.under_sampling import CondensedNearestNeighbour from scipy import stats import numpy as np def log_transform(column): return np.log1p(column) scaler = StandardScaler() df["freq"] = log_transform(df["freq"]) df["freq"] = scaler.fit_transform(df[["freq"]]) cnn = CondensedNearestNeighbour(sampling_strategy='majority', random_state=42) X_resampled, y_resampled = cnn.fit_resample(df[["freq"]], df["user_id"].values) resampled_df = pd.DataFrame(data=X_resampled, columns=["freq"]) print(resampled_df) ####### freq 0 -0.352373 1 -0.352373 2 -0.352373 3 -0.352373 4 2.495698 ... ... 2557 -0.352373 2558 3.642937 2559 -0.352373 2560 -0.352373 2561 -0.352373 [2562 rows x 1 columns] ######### resampled_df["freq"] = log_transform(resampled_df["freq"]) resampled_df["freq"].skew() ### 2.4721717038971214
-
해결됨비전공자의 전공자 따라잡기 - 데이터베이스,SQL
설정에서 AutoIncrement를 바꿔도 수정이 되지 않습니다.
Row를 지운 후 auto_increment를 설정에서 1로 변경하도록 시도했습니다.아래 사진처럼 적용 완료되었다는 말만 나오고 도로 카운트가 원상복귀 됩니다.
-
미해결[백문이불여일타] 데이터 분석을 위한 중급 SQL
'' 따옴표 쓰임 관련 질문이요!
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. ''따옴표는 보통 문자 기재시, 사용하는 것으로 알고있는데엘리아스 뒤에도 ''따옴표인가요?어떤 책에서는 "" 쌍따옴표를 쓰고,_ 이런 특수문자사용시에 도 ""를 쓰라고해서정확한 사용법을 알려주세요ㅜ