inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Logpresso Enterprise - Thu thập và phân tích dữ liệu

value 값 추가 파싱

Đã giải quyết

346

kerberos936228

5 câu hỏi đã được viết

1

json 형태의 로그를 수집 후 

table a | parse json_parser(생성) 로 파싱을 하면 Key value가 정상적으로 파싱이 되는데 그 이후에 value들을 , 기준으로 짤라서 사용할 수 있을까요?? 이런 형태입니다. key(b): value(c,d,e)

 

bigdata

Câu trả lời 1

0

logpresso

안녕하세요. 파싱 이후에 값을 재가공은 데이터 처리하는 데 있어 다양한 방식으로 빈번한 요구사항이 있습니다. 

일단 파싱을하면 b라는 컬럼에 c,d,e라는 텍스트로 값이 들어가게 될 것인데요.

이 값을 split이라는 함수로 배열로 만들 수 있습니다. 그 이후 배열의 값을 문자열 함수를 사용하여 원하는 대로 가공할 수 있습니다.

1. 값을 하나씩 별도의 필드로 추출하는 방식

- 이는 valueof 라는 함수를 사용하여 배열의 값을 필드로 추출하는 방식입니다.

json "{ 'b' : 'c,d,e'}" | eval b2 = split(b, ","), b_c = valueof(b2, 0), b_d = valueof(b2, 2), b_e = valueof(b2, 2)

2. 배열의 값을 하나씩 행으로 생성하는 방식

- 이는 explode라는 쿼리를 사용하여 c, d, e를 각각의 행으로 만드는 방식입니다. 

json "{ 'b' : 'c,d,e'}" | eval b2 = split(b, ",") | explode b2

 

함수를 가지고 배열 혹은 문자열 자체를 재가공 하실 수 있습니다. 

 

 

강의자료요청

0

797

1

강의 자료 요청

0

435

1

mac os ) zip 파일 dataframe 오류

0

659

1

강의자료 요청

0

383

1

강의자료 요청합니다

0

402

1

ModuleNotFoundError : No module named 'mmlspark' - 20230218

0

616

1

강의 자료 요청

0

334

1

강의내용과 교안내용 차이

0

316

1

3,4과목 파일도 요청드립니다~

0

266

1

TrainValidationSplit과 randomSplit 사용 질문

0

393

1

headless chrome 오류 문의

0

1486

1

교안 통합파일 요청드립니다.

0

396

1

실습에서 fsck와 report , rm 명령어 사용결과가 상이합니다.

0

607

2

parquet read시 partition 개수

0

416

1

교재가 있나요?

0

309

1

교재가 있나요?

0

454

1

강의자료 부탁드립니다

0

210

1

대용량 데이터 Join

0

835

1

최신 기출문제 문의

0

767

1

강의자료 부탁드립니다

0

339

1

시스로그 수집기 수집 설정 중 시스로그 설비 목록 설정 문의

0

477

1

parsecsv 쿼리 사용 후 count 쓰는 법 문의

0

376

1

시스로그 포트 생성 안됨

0

248

0

센트리 부분 강의 관련 질문입니다

0

471

1