인공지능이 인간의 시각능력처럼 '볼' 수 있다는 의미는 무엇인가 ?
알파고 같은 인공지능은 마치 사람의 감각을 모방하듯이 사람처럼 바닥판과 바둑알의 모양과 위치를 보고 이미지의 패턴을 인식하고 바둑대국상황을 보고 판단하는 능력과 어디에 두면 좋은지에 대한 감각, 전문가의 감각으로 미지의 바둑문제를 해결하는 선택을 잘 하는 것이다.
특히, 알파고 딥러닝 모델은 16만 개의 바둑 기보를 이미지로 그대로 입력받아 학습한 것으로, 수많은 바둑 기보 데이터는 바둑의 대국 수순을 기록한 것인데, 바둑 기보를 이미지로 입력받거나 대국할 때에 바둑돌의 위치와 순서를 제대로 인식하려면 인간의 시각능력 뿐만아니라 전문가적 감각까지 필요하다. 알파고는 바둑기보를 인식하는 등 인간의 시각기능과 같은 구조와 같은 작동방식을 모방하는 알고리즘으로 심층학습(Deep Learning)인 합성곱 신경망(CNN, Convolutional Neural Networks) 모델을 활용한다. CNN 모델 구조는 바둑판의 바둑돌이나 꽃과 같은 이미지를 인식하는 우리 눈속 망막 그리고 시상을 거쳐 뇌의 시각피질 까지의 경로를 모방하여 신경망에서 일어나는 시각처리 신경경로를 구조화한 것이다.
CNN 모델의 작동방식은 인간의 눈으로부터 꽃이라는 이미지의 시각정보를 얻고 망막의 시신경부터 시각 피질내 신경세포까지 뉴런이 가진 이미지 인식능력과 같은 방식으로 시각정보를 양방향,동시성, 병행처리하는 방식으로 작동한다. 옆 그림은 눈속 망막에 분포되어 있는 시신경의 수백만개의 광수용체들을 표현한 것인데, 망막의 시신경 뉴런들이 시각정보를 획득하는 것은 빛에 감광 능력을 지닌 광수용체(photoreceptors)가 빛의 양과 빛의 밝기의 정보를 획득하여 픽셀같은 정보로 표현하기 때문이다.
마치 픽셀을 이용하여 이미지의 질감까지 표현하는 픽셀패턴처럼 픽셀이미지에서 패턴의 정보를 획득하는 것과 같다. 이를 모방하여 시각적 이미지 인식 모델인 CNN은 꽃 이미지를 바둑판 모양의 픽셀패턴 사각형 행렬로 분해하여 사각형 픽셀 이미지에서 직접 시각적 패턴을 필터링하여 그리드 토폴로지(grid topology, 격자 + 망구성방식) 특징을 추출하는 방식으로 디지털화 작업을 수행하는 것이다.
댓글을 작성해보세요.