test

생성모델

지도 학습 (Supervised Learning)

  • data: x=input, y=output

  • 목표: x를 y로 매핑하는 함수를 학습

비지도 학습 (Unsupervised Learning)

  • data: x=input

  • 목표: 데이터의 숨겨진 구조나 패턴 학습

생성 모델 (Generative Models)

  • data: x=input, y=output OR x=input

  • 목표: 관찰된 샘플로부터 데이터의 분포를 표현하는 모델을 학습
  • 예시: 밀도 추정, 샘플 생성

image-20240830143932774

생성모델의 개요

  • 생성 모델은 관찰된 샘플들을 바탕으로 데이터의 분포를 표현하는 모델을 학습, 데이터의 숨겨진 구조나 기저에 있는 패턴을 포착

Advantages

  • Generation (새로운 데이터 샘플 생성)

  • Debias (데이터의 편향을 감지하고 수정)

  • Outlier detection (정상적인 패턴에서 벗어난 데이터 찾기)

  • Classification (데이터를 여러 범주로 나눌 수 있음)

  • Segmentation (데이터를 의미 있는 부분으로 나눌 수 있음)

Gaussian Mixture Models (GMM)의 개요

image-20240830144551738

p(x): 전체 확률 분포 K: 가우시안 분포(클러스터)의 수 πi: i번째 가우시안의 가중치 (모든 πi의 합은 1) N(x|μi, σi): i번째 가우시안 분포 (평균 μi, 표준편차 σi)

image-20240830144656139

ㅠ (파이): 각 클러스터의 가중치(확률)를 나타냅니다. uk (뮤): k번째 클러스터의 평균을 나타냅니다. Ek (시그마): k번째 클러스터의 공분산 행렬을 나타냅니다. zn: n번째 데이터 포인트가 속한 클러스터를 나타내는 잠재 변수입니다. xn: n번째 관측 데이터 포인트입니다. K: 클러스터의 총 개수입니다. N: 데이터 포인트의 총 개수입니다.