inflearn logo
강의

Course

Instructor

SQL Used Directly in Practice [Lecture by the author of '200 SQL Examples']

26 SQL - Analyzing Big Data with SQL

음 잘 입력한거 같은데... 세션이 만료가 되버려 조회가 안됩니다.. 질의 결과에서 계속 돌고있습니다.

58

ssh9414245763

6 asked

0

CREATE OR REPLACE VIEW speech_view

AS

SELECT REGEXP_SUBSTR(lower(speech_text), '[^ ]+', 1, a) word

FROM speech, (SELECT LEVEL a

FROM dual

CONNECT BY LEVEL <= 52);

 

SELECT COUNT(word) AS 부정단어

FROM speech_view

WHERE lower(word) IN (SELECT lower(n_text)

FROM negative);

 

image.png

 

sql 빅데이터 oracle

Answer 2

0

codingkorea

승호님, 작성하신 쿼리의 로직 자체는 텍스트를 쪼개기 위해 잘 구상했습니다. 문법적인 오류는 없습니다.

다만, 성능 문제 때문에 조회가 안 되는 것입니다. 원인은 FROM speech, (SELECT LEVEL... <= 52) 부분에 있습니다.

이 코드는 speech 테이블에 있는 모든 문장마다 무조건 52개씩 데이터를 복제(Cross Join)합니다. 만약 문장이 1,000개만 있어도 52,000개의 행이 메모리에 생성되는데, 그중 대부분은 글자가 없는 NULL 값입니다. 이 불필요한 데이터를 처리하느라 DB가 응답을 못 하고 세션이 끊어지는 것입니다.

[해결 방법]

뷰를 생성할 때, 글자가 없는(NULL) 행은 아예 생성되지 않도록 WHERE 절에서 미리 걸러주면 해결됩니다. 아래 코드로 수정해주세요.

CREATE OR REPLACE VIEW speech_view

AS

SELECT REGEXP_SUBSTR(lower(speech_text), '[^ ]+', 1, a) AS word

FROM speech, (SELECT LEVEL a FROM dual CONNECT BY LEVEL <= 52)

WHERE REGEXP_SUBSTR(lower(speech_text), '[^ ]+', 1, a) IS NOT NULL;

이렇게 하면 실제 단어가 존재하는 데이터만 뷰에 담기므로 속도가 훨씬 빨라질 겁니다.

감사합니다.

 

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. c신승호님.

현재 질문하신 쿼리 실행 중 세션이 만료되어 결과를 확인할 수 없는 문제를 겪고 계시는 것 같습니다. 이는 여러 원인에 의해 발생할 수 있으며, 아래 몇 가지 해결 방법을 제안드립니다:

  1. 세션 타임 아웃 설정: 데이터베이스 세션이 일정 시간이 지나면 자동으로 만료될 수 있습니다. 데이터베이스 설정에서 세션 타임아웃을 확인하고 조정하는 방법을 강의 참조 자료나 사용자 매뉴얼에서 찾아보시기 바랍니다.

  2. 쿼리 최적화: 현재 작성한 쿼리가 복잡하거나 데이터 양이 많을 경우 전체 쿼리 실행이 오래 걸려 세션이 만료될 수 있습니다. REGEXP_SUBSTRCONNECT BY 구문은 성능에 영향을 줄 수 있으니 이를 다른 방식으로 최적화할 수 있는지 확인해 보세요.

  3. 데이터 검토: speechnegative 테이블의 데이터 양을 줄이거나 필터링된 조건으로 쿼리를 실행하여 데이터 양을 제한하면 세션 만료를 방지할 수 있습니다.

  4. 실제 쿼리 실행 환경 확인: 실무 환경의 데이터베이스와 강의 자료에 명시된 환경 설정이 다를 수 있으니, 실행 환경을 점검해 보세요. 필요시 DBA에게 권한이나 설정 관련 지원을 받을 수도 있습니다.

다른 수강생 분들이 유사한 질문을 올리셨을 수도 있습니다. 관련 질문 URL을 통해 더 많은 정보를 확인해 보세요:

저는 질문자님의 이해를 돕고자 기존의 유사 답변 링크도 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면 언제라도 질문해 주세요. 곧 지식공유자께서도 직접 답변해 주실 것입니다.

공통 코드 , 계층 구조 질문

1

7

1

시험환경 질문 드립니다.

0

9

1

수강기간 연장 가능 여부 문의드립니다

0

17

1

문제2-2에서 유의한 변수에서 음수는 유의한지?

0

17

3

77번 문제

0

11

1

76번 문제

1

15

2

64번 문제 관련

0

19

2

강의 만료 후 오프라인 저장 강의 수강 가능 여부

0

29

2

xgboost에 관해

0

28

2

빅데이터분석기사 작업2형

0

34

2

정규화 여부

0

21

1

airflow 3로 되면서 2.x대에 지원 중단된 패키지가 많네요..ㅠ

0

24

1

dags 디렉토리안에 sql디렉토리 넣고 .sql 파일로 관리해도 되나요?

0

23

2

2,3차 정규화 질문

0

27

2

평가지표 RMSE 문의

0

34

2

1-3번문제 질문

0

35

2

회귀모델 평가지표 최근 시험환경에서의 지원여부가 궁금합니다

1

35

2

수강완료 후 문의 드립니다.

1

32

2

컬럼 삭제 관련

0

31

2

실전 모의고사 난이도

0

28

2

22번문제 질문있습니다.

0

62

2

오라클18c로 진행해도 괜찮을까요?

0

77

1

책이 필요한가요??

0

60

1

맥북 설치

0

269

3