EfficientDet 관련 질문

Question

안녕하세요.

현재 efficientdet esri 코드를 기반으로 custom data로 프로젝트를 진행하고 있습니다.

학습하는데에는 문제가 없으나 궁금한 점이 있어 질문 드립니다.

학습을 중단한 후 다시 학습을 진행할 때 중단한 시점부터 다시 시작하는 방법이 있을까요? esri 코드에서 def get_efficientdet_model(config): 부분 pretrained_ckpt에 저장된 ckpt를 넣으면 될까요? 혹은 다른 방법이 있을까요?
훈련 중 loss값이나 AP, AR 값을 저장하고 시각화하기 위해 wandb를 사용할려고 하는데 코드 중 어느 부분에 wandb 코드를 넣어야 할지 모르겠습니다.

Answer

안녕하십니까,

efficientdet은 --ckpt 파라미터를 train config로 설정하면 train 시 가장 마지막 checkpoint 부터 자동으로 학습을 수행합니다.

이를 적용하려면 아래에서 TRAIN_CFG에서 ckpt 파라미터를 model_name과 동일하게 'efficientdet-d0' 로 설정해주면 됩니다.

class TRAIN_CFG:
  model_name = 'efficientdet-d0' # efficientdet 모델명
  ckpt = 'efficientdet-d0'
  strategy = '' # tpu, 여러개의 GPU들, 단일 GPU 일때 학습 strategy 설정. 
  model_dir = '/mydrive/model_trained' # 학습된 모델이 저장될 위치
  pretrained_ckpt = '/content/efficientdet-d0' 
  hparams = 'num_classes=20,moving_average_decay=0,mixed_precision=true'
  use_xla = False
  use_fake_data = False
  batch_size = 8
  eval_samples = 5000 # evaluation image 데이터 갯수
  steps_per_execution = 1 # ModelCheckPoint의 save_freq 를 숫자로 설정할 경우 사용. 
  num_examples_per_epoch = 2500 # 1 epochs 시 적용하는 examples 개수 
  num_epochs = 15 # epochs 횟수
  train_file_pattern = '/content/tfrecord/train/pascal-*.tfrecord' # 학습용 tfrecords를 glob 형태로 가져오는 표현식. 
  val_file_pattern = '/content/tfrecord/val/pascal-*.tfrecord' # 검증용 tfrecords를 glob 형태로 가져오는 표현식. 
  val_json_file = None # optional coco validation json 
  mode = 'traineval' # train만 적용 또는 train과 eval함께 적용(traineval)
  
  num_cores = 2 # tpu 8 일때 적용.  
  tpu = None
  gcp_project = None
  tpu_zone = None
  eval_master = ''
  eval_name = None
  tf_random_seed = 2021
  profile = False
  debug = False

그리고 wandb는 제가 적용하는 법을 잘 몰라서 아래 예제를 확인해 주십시요. tensorflow 예제는 아니지만, 아마 callback에 wandb를 적용하는 것 같습니다.

https://colab.research.google.com/github/airctic/icevision/blob/master/notebooks/wandb_efficientdet.ipynb

감사합니다.

윤정덕

EfficientDet 관련 질문

이 글과 비슷한 Q&A

[탑다운] 상담문제

작업형1 모의문제2 age 컬럼의 이상치 관련

비동기 함수를 동기적인 실행으로 만드는 부분 질문입니다

실행을 했음에도 연결이 안되는 경우는 어떻게 해야할까요