강현구임

인과성이란 무엇인가?

인과성은 원인과 결과의 관계를 말합니다. 예를 들어, “비가 오면 땅이 젖는다”에서 비(원인)와 젖은 땅(결과) 사이의 관계가 인과관계입니다.

1.1 인과성 추론의 예

의료 분야에서 자주 사용되는 예를 들어보겠습니다. 환자의 상태(경미 또는 심각)에 따라 치료약 A와 B의 효과를 비교한다고 가정해봅시다.

C가 T와 O에 영향을 끼치는 경우에는 B가 유리

C가 T에 영향을 끼치지 않는 경우 A가 유리

이 알고리즘은 변수들 간의 관계를 그래프로 표현하여 인과관계를 추론합니다.

체인 구조 (Chain Structure) 형태: X → C → Y 예시: 과거 → 현재 → 미래 특징: X와 Y는 C가 주어졌을 때 조건부 독립
포크 구조 (Fork Structure) 형태: X ← C → Y 예시: 이미지1 ← 클래스 → 이미지2 특징: X와 Y는 C가 주어졌을 때 조건부 독립
충돌자 구조 (Collider Structure) 형태: X → C ← Z 예시: 남성 → 아기 ← 여성 특징: X와 Z는 독립이지만, C가 주어졌을 때 독립이 아니게 됨

결과 분석

실험 결과, 데이터의 특성에 따라 최적의 모델이 달라질 수 있음을 알 수 있습니다. 예를 들어:

변수 간의 인과관계를 도식화 한 것을 인과다이어그램(Causal Diagram)이라고 합니다. 동그라미로 표시된 노드는 변수를 의미하고, 화살표로 표시된 엣지는 두 변수 간 직접적인 인과 관계를 의미합니다.

위의 그래프에서 T가 Y에 미치는 인과 효과를 알고 싶다면 T←A←B→C→Y로 흐르는 외부 영향을 통제해야합니다.

Causal Discovery는 우리가 가진 데이터에서 변수 간 관계를 이용하여 인과 다이어그램을 그리는 방법입니다.

PC 알고리즘은 전통적인 방법 중 하나입니다. 이 알고리즘은 변수들 간의 독립성을 테스트하면서 그래프를 만들어갑니다.

이 방법은 최근에 개발된 더 현대적인 접근법입니다. 기본 아이디어는 “올바른 인과관계를 학습한 모델은 새로운 상황에 더 빨리 적응할 수 있다”는 것입니다.

과정은 이렇습니다:

이 방법의 장점은 복잡한 관계도 잘 찾아낼 수 있다는 것입니다.