• 카테고리

    질문 & 답변
  • 세부 분야

    컴퓨터 비전

  • 해결 여부

    미해결

흑백 이미지 데이터 셋에 관련된 질문입니다.

23.06.17 15:46 작성 조회수 373

0

안녕하세요. 선생님

정말 질 좋은 강의를 들을 수 있어서 행운이라고 생각합니다.

CatnDog_Sequence기반으로 개인적으로 Modify하여 공부를 해보고 있습니다.

제가 갖고 있는 이미지는 흑백 이미지 인데요.

image = cv2.imread("D:\\Lens_image_data\\test\\test_set\\sort1\\1.BMP", cv2.IMREAD_ANYCOLOR)
print(image.shape)

shape을 print해보았을 때, (1548, 1544)으로 RGB 3채널이 아닌 것도 확인하였습니다.

1) 따라서 Image_Batch 배열 진행 시에도 뒤에 3채널은 빼고 넣었으며,

image_batch = np.zeros((image_name_batch.shape[0], IMAGE_SIZE, IMAGE_SIZE), dtype='float32')

2) 이미지를 cv2로 읽어올 때도 아래와 같이 변경해보았습니다.

image = cv2.imread(image_name_batch[image_index], cv2.IMREAD_UNCHANGED)

이렇게 되면 shape이 (64, 224, 224) (64,) 이렇게 나오는데, 흑백 이미지로 할 때는 상기와 같이 바꾸는게 맞는 것인지 궁금합니다.

답변 2

·

답변을 작성해보세요.

0

안녕하십니까,

잘 듣고 계시다니, 저도 기분이 좋군요.

CNN을 사용하려면 이미지 채널이 무조건 3차원이 되어야 합니다(Batch 포함 4차원)

적용하신대로 마지막 1채널의 이미지를 3개 채널로 복사해서 만드셔도 되고,

그냥 채널을 마지막 차원에 추가하셔도 됩니다.

rgb_image = np.expand_dims(gray_image, -1)

 

감사합니다.

 

anwlro7347님의 프로필

anwlro7347

질문자

2023.06.18

답변해주셔서 감사합니다. 결국 imagenet을 이용하려면 총 4차원이 되어야 하는게 맞군요. Gray Image를 Color image처럼 차원을 맞춰서 진행해보도록 하겠습니다.

0

anwlro7347님의 프로필

anwlro7347

질문자

2023.06.17

            if self.pre_func is not None:
                image = self.pre_func(image)

            image_batch[image_index] = image
            
        image_batch = np.repeat(image_batch[..., np.newaxis], 3, -1)
        return image_batch, label_batch

 

ImageNet을 사용하려면 채널이 무조건 3개가 입력이 되어야 하는 것 같네요.. 일단은 gray image를 RGB 처럼 3채널로 만들어 보았습니다. 단순 1채널 이미지를 3채널 형식에 복사하는 형식으로 짜보았는데, 잘 될련지 모르겠네요