• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

PCA에 대한 질문입니다.

21.05.13 22:24 작성 조회수 252

0

1. 

이부분에서 n_components의 갯수를 6개로 하셨는데 혹시 위에서 heatmap으로 확인했을때 BILL_AMT1 ~ BILL_AMT6과 같은 6개의 피처들의 상관관계가 가장 높기 때문에 n_components의 갯수를 6개로 하셨는지 궁금합니다.  

2. PCA의 목적이 여러가지 상관관계가 높은 피처들이 포함된 데이터세트에서 새로운 면(새로운 피처들)을 찾는다는것이 목적인데 어느부분에서 새로운 면을 찾은것인지 뭔가 직관적으로 이해하고싶은데 제가 이해한바로는 상관관계가 높은 피처들을 추출해서 component1, component2와 같은 교수님께서 지정하신 이름의 새로운 피쳐들을 찾아낸다 라고 이해를 했는데 제가 이해한것이 맞는지 아니라면 좀더 직관적으로 설명해주시면 감사하겠습니다. 

3.

변동성이란것이 위의 예제를 예로들면 상관관계가 제일 높은 BILL_AMT1 ~ BILL_AMT6의 피쳐들을 추출해서 스케일링한후 PCA를 이용하여 변동성을 구하였는데 구한 변동성을 어디에다 쓰는것인지 이 변동성들이 의미하는것이 직관적으로 어떤것인지 궁금합니다. 

질문이 많아서 글이 길어졌는데 긴글 읽어주셔서 감사합니다. 제가 쓴글이 잘 이해가 되실지 모르겠네요.  답변 부탁드리겠습니다 교수님 감사합니다.

답변 1

답변을 작성해보세요.

0

안녕하십니까,

1. BILL_AMT1 ~ BILL_AMT6를 감안해서 n_components를 정한건 아닙니다.

BILL_AMT1~BIL_AMT6는 상관관계가 높아서 PCA변환하면 적은 n_components로도 원본 feature의 성능 저하가 크지 않게 변환 될 수 있습니다.  그리고 다른 PAY1~PAY6역시 상관 관계가 높기 때문에 전체적으로 n_components를 6 정도만 해도 원본 feature 그대로 예측하는 것 대비 성능이 떨어지지 않을 거라 생각해서 적용한 것입니다. 

해당 데이터 세트는 feature간의 상관 관계가 높아서 n_components=4 로 해도 성능이 많이 떨어지지 않습니다.

2.  PCA의 원래 목표는 기존 Feature들의 차원을 효과적으로 축소하는 효율적인 새로운 차원을 만드는 것입니다. 새로운 차원에 대한 강조 보다는 차원 축소에 대한 강조가 더 큽니다. 새롭게 만들어진 PCA Feature는 기존 차원들을 상당히 감소 시킬 수 있으면서 동시에  기존 차원들의 고유 특성을 상당히 반영할 수 있습니다(기존 차원들의 중복/종속된 특성값을 정리하면서 고유 특성을 반영)

PCA는 새로운 feature를 찾지만 기존 feature들을 상당부분 설명할 수 있어야 합니다.

기존 Feature들의 고유 성분을 기반으로 새롭게 만들어진 n_component1, n_component2 등은 완전히 새로운 것이 아닙니다.  기존 Feature들의 고유 특성은 유지하면서도, feature들끼리 중복되거나 Noise성인 특성값은 정리가 될 수 있어야 합니다. 그리고 이렇게 뽑인 PCA를 이용하여 기존에는 굉장히 많은 feature 수(예를 들어 얼굴 image 파일)를 가진 데이터에서 핵심 feature만 뽑아서 얼군 인식이나 Eigenface 도출과 같은 업무에 적용이 가능합니다(이 외에도 다양한 영역에서 적용됩니다)

3. 변동성을 어디다 활용한다기 보다는 PCA Component들이 기존 feature들을 얼마나 나 잘 설명하고 있는가를 확인하기 위함이라고 생각하시면 될 것 같습니다.

새롭게 생성된 PCA Component가 기존 feature들을 상당부분 설명하기 위해 PCA는 기존 Feature 값들의 데이터 분포에 대한 주요 성분을 고유 벡터(주성분 벡터)로 뽑아주는 겁니다.(이렇게 뽑인 PCA Feature들은 기존의 feature들의 중요 요소를 가지고 있으면서도 압축 되어 있습니다.)

이 개별 고유 벡터가 어느 정도 기존 feature들을 설명하고 있는지 확인하기 위해서 variance 를 기반으로 변동성을 설명한다고 보시면 될 것 같습니다.

감사합니다.

velnuty님의 프로필

velnuty

질문자

2021.05.14

정성스럽게 답변해주셔서 정말 감사합니다 교수님.