인프런 커뮤니티 질문&답변

Jaewoo Choi님의 프로필 이미지
Jaewoo Choi

작성한 질문수

딥러닝 CNN 완벽 가이드 - Fundamental 편

Plant Pathology 캐글 경연대회 개요 및 데이터 세트 가공하기

tf.data질문드립니다.

작성

·

204

0

안녕하세요 선생님 수업 도중에 가끔씩 tf.data에 대해 몇번 언급하셨는데 kaggle을 보면 대부분 tf.data를 써서 하는데 그것이 코드 관리에 있어서 더 효율적인건가요?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

음, 저는 tf.data를 개인적으로 선호하지 않습니다. 그런데 tensorflow에서 계속 밀어 붙이고 있어서, 사실 좀 아쉬운 부분이 있습니다. 

tf.data의 장점은 numpy가 아니라 tensor를 이용하여 성능을 보다 향상 시킬 수 있다는 것입니다. 반대로 제가 tf.data를 선호하지 않는 주요 이유는 이미지 사전 처리시 numpy 기반이 아니라 tensor를 기반으로 사용하고 있기 때문입니다. 그래서 이미지 사전 처리시 numpy 기반의 opencv 패키지를 활용할 수가 없습니다.  예를 들어서 tf.data를 이용하면 albumentations 라이브러리를 사용할 수가 없습니다. 물론 사용할 수는 있지만 이러면 tf.data의 성능상 잇점이 없어지므로 굳이 tf.data를 사용할 필요가 없습니다. 

tf.data를 이용하면 이미지 처리시 다양한 전처리를 tensor 기반 API로 수정을 해줘야 하는데, 전처리가 복잡할 수록 tensor API를 처리가 더 어려워집니다. 또한 코드관리도 Sequence를 이용하는 것 보다 효율적이지 않습니다.  그래서 제가 tf.data 강의는 본 강의에서 소개 시켜드리지 않았습니다. 

그럼에도 불구하고 tensoflow에서는 tf.data 사용을 계속 사용자에게 밀어 붙이고 있어서, 저도 고민이 됩니다. 

감사합니다. 

 

Jaewoo Choi님의 프로필 이미지
Jaewoo Choi

작성한 질문수

질문하기