🎯 SEC Insider Trading AI Agent 시스템 구축 완료

✅ 완료된 작업

1. Database Schema 확장

✅ external_data 테이블: yfinance, StockTwits, Reddit 데이터 저장
✅ agent_evaluations 테이블: AI Agent 평가 결과 저장
✅ backtest_results 테이블: 백테스트 결과 저장 (추후 사용)
✅ InsiderTradesDB 클래스에 메서드 추가

2. External Data Collectors 구현

airflow/plugins/external_data/
├── __init__.py (ExternalDataAggregator)
├── yfinance_collector.py (뉴스, 애널리스트, 주가)
├── stocktwits_collector.py (sentiment)
└── reddit_collector.py (토론)

3. AI Agent Evaluator 구현

airflow/plugins/agent/
├── __init__.py
├── evaluator.py (Claude API 연동)
└── prompt_templates.py (프롬프트 설계)

모델: claude-sonnet-4-5-20250929 (Claude Sonnet 4.5)
기능: 내부자 거래 + 외부 데이터 종합 평가
출력: STRONG_BUY/BUY/HOLD/PASS/AVOID + confidence score

4. Airflow DAG 추가

airflow/dags/agent_evaluation.py

스케줄: 매일 18:30 KST
Flow: TOP 10 Buy 조회 → 외부 데이터 수집 → AI 평가 → Slack 리포트

5. 환경 설정

# .env
ANTHROPIC_API_KEY=sk-ant-api03-...
REDDIT_CLIENT_ID=your_reddit_client_id (선택)
REDDIT_CLIENT_SECRET=your_reddit_client_secret (선택)
# airflow/Dockerfile
anthropic>=0.39.0
yfinance>=0.2.48
praw>=7.7.1
# docker-compose.yml
# 모든 airflow 서비스에 환경변수 추가
ANTHROPIC_API_KEY: ${ANTHROPIC_API_KEY}

🔧 현재 시스템 구조

기존 파이프라인:
SEC RSS → Crawler → DB → Airflow → Top 10 Buy/Sell → Slack

새로운 AI Agent 파이프라인:
SEC RSS → Crawler → DB → Airflow → Top 10 Buy
                                      ↓
                          [External Data Collectors]
                          - yfinance (뉴스, 애널리스트)
                          - StockTwits (sentiment)
                          - Reddit (토론)
                                      ↓
                          [AI Agent Evaluator]
                          - Claude Sonnet 4.5
                          - 종합 평가 수행
                                      ↓
                          [DB 저장 + Slack 리포트]

📊 데이터 흐름

매일 18:18 KST: daily_insider_ranking DAG 실행
- TOP 10 Buy/Sell 계산
- Slack 전송
매일 18:30 KST: agent_evaluation DAG 실행
- TOP 10 Buy 중 미평가 거래 조회
- 각 종목별 외부 데이터 수집
- Claude Agent 평가 수행
- 결과 DB 저장 + Slack 전송

🚀 테스트 완료

# Claude API 작동 확인
✅ Success: Hello! 👋 How can I help you today?

📝 다음 단계 (선택사항)

1. Airflow UI에서 DAG 실행

http://localhost:8081
- agent_evaluation DAG 활성화
- Trigger DAG 수동 실행
- 로그 확인

2. 백테스팅 엔진 추가 (미완성)

과거 거래에 Agent 평가 적용
실제 수익률과 비교
Agent 성능 측정

3. 대시보드 구축 (미완성)

Streamlit/Grafana
Agent 평가 이력 시각화
성과 추적

🔑 핵심 파일 위치

insider-trading-agent/
├── .env (API keys)
├── docker-compose.yml (환경변수 설정)
├── airflow/
│   ├── Dockerfile (패키지 설치)
│   ├── requirements.txt (anthropic, yfinance, praw)
│   ├── dags/
│   │   ├── daily_insider_ranking.py (기존)
│   │   └── agent_evaluation.py (신규)
│   └── plugins/
│       ├── database/
│       │   └── insider_db.py (확장됨)
│       ├── external_data/
│       │   ├── yfinance_collector.py
│       │   ├── stocktwits_collector.py
│       │   └── reddit_collector.py
│       └── agent/
│           ├── evaluator.py
│           └── prompt_templates.py
└── scripts/
    └── init_schema_extension.sql

💡 주요 설정값

Claude 모델: claude-sonnet-4-5-20250929
비용: 약 $0.01-0.02 per evaluation
스케줄: 매일 18:30 KST (UTC 09:30)
평가 대상: 거래금액 $100K 이상 Top 10 Buy

🤖 SEC 내부자 거래 AI Agent 시스템 구축기 - Part 2: AI 평가 및 백테스팅

이전 글: Part 1 - 인프라 구축 및 크롤러 개발

🎯 프로젝트 개요

지난 편에서…

Part 1에서 우리는:

✅ Docker 기반 인프라 구축 (MySQL, Redis, Kafka, Airflow)
✅ SEC Form 4 RSS 크롤러 구현 (30분마다 자동 실행)
✅ 일일 TOP 10 Buy/Sell 랭킹 시스템
✅ Slack 알림 자동화

를 완성했습니다.

이번 편에서는…

핵심 질문:

“내부자가 자사주를 매수했다고 해서 정말 따라 사야 할까?”

이 질문에 답하기 위해:

AI Agent 평가 시스템 구축 (Claude Sonnet 4.5)
외부 데이터 통합 (Yahoo Finance, StockTwits, Reddit)
백테스팅 프레임워크 개발
실제 성과 검증

🤖 AI Agent 시스템 설계

아키텍처

┌─────────────────────────────────────┐
│  SEC RSS (30분마다)                  │
│  - 최신 100개 Form 4                 │
└──────────────┬──────────────────────┘
               ↓
┌─────────────────────────────────────┐
│  MySQL DB                            │
│  - insider_trades 테이블             │
│  - 중복 제거 (accession_number)      │
└──────────────┬──────────────────────┘
               ↓
┌─────────────────────────────────────┐
│  Daily Ranking (18:18 KST)          │
│  - TOP 10 Buy/Sell 계산             │
│  - Slack 리포트 전송                │
└──────────────┬──────────────────────┘
               ↓
┌─────────────────────────────────────┐
│  Agent Evaluation (18:30 KST)      │
│  1. TOP 10 Buy 중 미평가 거래 조회  │
│  2. 외부 데이터 수집                │
│     - yfinance (뉴스, 애널리스트)   │
│     - StockTwits (sentiment)        │
│     - Reddit (토론)                 │
│  3. Claude Agent 평가 수행          │
│  4. DB 저장 + Slack 리포트          │
└─────────────────────────────────────┘

🧠 Claude API 연동

1. 데이터베이스 스키마 확장

기존 테이블에 추가로 3개 테이블 생성:

-- 외부 데이터 저장
CREATE TABLE external_data (
    id INT AUTO_INCREMENT PRIMARY KEY,
    ticker VARCHAR(10) NOT NULL,
    collected_at DATETIME NOT NULL,
    yf_news JSON,
    yf_analyst_recommendation JSON,
    yf_price_history JSON,
    yf_company_info JSON,
    st_sentiment_summary JSON,
    st_top_messages JSON,
    rd_posts JSON,
    rd_engagement_summary JSON,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

-- Agent 평가 결과
CREATE TABLE agent_evaluations (
    id INT AUTO_INCREMENT PRIMARY KEY,
    ticker VARCHAR(10) NOT NULL,
    evaluation_date DATE NOT NULL,
    insider_transaction_id INT,
    transaction_type VARCHAR(10),
    transaction_value DECIMAL(20,2),
    decision VARCHAR(20),  -- STRONG_BUY, BUY, HOLD, PASS, AVOID
    confidence_score DECIMAL(3,2),
    key_factors JSON,
    supporting_data JSON,
    risk_factors JSON,
    llm_response JSON,
    llm_model VARCHAR(100),
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

-- 백테스트 결과
CREATE TABLE backtest_results (
    id INT AUTO_INCREMENT PRIMARY KEY,
    backtest_run_id VARCHAR(50) NOT NULL,
    period VARCHAR(10) NOT NULL,
    ticker VARCHAR(10) NOT NULL,
    transaction_date DATE NOT NULL,
    agent_decision VARCHAR(20),
    agent_confidence DECIMAL(3,2),
    entry_price DECIMAL(10,2),
    current_price DECIMAL(10,2),
    return_pct DECIMAL(10,2),
    holding_period_days INT,
    is_correct TINYINT(1),
    performance_category VARCHAR(20),
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

2. 프롬프트 엔지니어링

System Prompt

EVALUATION_SYSTEM_PROMPT = """You are a financial analysis agent specialized in evaluating insider trading signals.

Your task is to analyze insider transactions combined with external market intelligence and determine if retail investors should follow this signal.

Consider:
1. Insider's role and track record
2. Transaction size relative to their holdings
3. Analyst sentiment and price targets
4. Community sentiment (Reddit, StockTwits)
5. Recent news and market conditions
6. Company fundamentals

Output a structured JSON decision with clear reasoning."""

User Prompt Template

EVALUATION_USER_PROMPT = """Analyze this insider transaction:

## Transaction Details
- Company: {ticker}
- Insider Role: {insider_role}
- Transaction Type: {transaction_type}
- Transaction Value: ${transaction_value:,.0f}
- Date: {transaction_date}

## External Intelligence

### Analyst Data
{analyst_summary}

### Community Sentiment
{community_summary}

### Recent News
{news_summary}

### Company Context
{company_context}

## Your Task
Evaluate if retail investors should follow this insider signal.

Return ONLY valid JSON:
decision,
  "risk_factors": ["risk1", "risk2"],
  "reasoning": "2-3 sentence explanation"
}}

Decision Guidelines:
- STRONG_BUY: confidence > 0.8
- BUY: confidence > 0.6
- HOLD: confidence 0.4-0.6
- PASS: confidence < 0.4
- AVOID: negative indicators
"""

3. Agent Evaluator 구현

# airflow/plugins/agent/evaluator.py

class AgentEvaluator:
    """LLM 기반 내부자 거래 평가 Agent"""
    
    def __init__(self, api_key: str, model: str = "claude-sonnet-4-5-20250929"):
        self.client = anthropic.Anthropic(api_key=api_key)
        self.model = model
    
    def evaluate(self, insider_trade: Dict, external_data: Dict) -> Dict:
        """내부자 거래 평가"""
        
        ticker = insider_trade['ticker']
        
        # 프롬프트 생성
        user_prompt = self._build_prompt(insider_trade, external_data)
        
        # Claude 호출
        response = self.client.messages.create(
            model=self.model,
            max_tokens=2000,
            temperature=0.3,  # 낮은 temperature로 일관성 확보
            system=EVALUATION_SYSTEM_PROMPT,
            messages=[
                {"role": "user", "content": user_prompt}
            ]
        )
        
        # JSON 파싱
        content = response.content[0].text
        evaluation = self._parse_response(content)
        
        return evaluation

📊 외부 데이터 수집 파이프라인

1. Yahoo Finance Collector

# airflow/plugins/external_data/yfinance_collector.py

class YFinanceCollector:
    """Yahoo Finance 데이터 수집"""
    
    def collect_all(self, ticker: str, lookback_days: int = 7) -> Dict:
        stock = yf.Ticker(ticker)
        
        return {
            'ticker': ticker,
            'news': self._get_news(stock),              # 최근 뉴스
            'analyst_data': self._get_analyst_data(stock),  # 애널리스트 추천
            'price_history': self._get_price_history(stock, lookback_days),
            'company_info': self._get_company_info(stock)
        }
    
    def _get_analyst_data(self, stock) -> Dict:
        """애널리스트 추천 및 목표가"""
        
        info = stock.info
        recommendations = stock.recommendations
        
        # 최근 3개월 추천 요약
        recent = recommendations[recommendations.index > 
                               (datetime.now() - timedelta(days=90))]
        
        recommendation_summary = {
            'strong_buy': int(recent.get('strongBuy', 0).sum()),
            'buy': int(recent.get('buy', 0).sum()),
            'hold': int(recent.get('hold', 0).sum()),
            'sell': int(recent.get('sell', 0).sum())
        }
        
        # 상승 여력 계산
        target_mean = info.get('targetMeanPrice')
        current = info.get('currentPrice')
        upside_potential = (target_mean / current - 1) * 100 if target_mean and current else 0
        
        return {
            'recommendation_summary': recommendation_summary,
            'target_mean': target_mean,
            'upside_potential': upside_potential
        }

2. StockTwits Collector

# airflow/plugins/external_data/stocktwits_collector.py

class StockTwitsCollector:
    """StockTwits sentiment 수집"""
    
    BASE_URL = "https://api.stocktwits.com/api/2"
    
    def collect_sentiment(self, ticker: str, limit: int = 30) -> Dict:
        url = f"{self.BASE_URL}/streams/symbol/{ticker}.json"
        response = requests.get(url, timeout=10)
        data = response.json()
        
        messages = data.get('messages', [])
        
        return {
            'ticker': ticker,
            'message_count': len(messages),
            'sentiment_summary': self._analyze_sentiment(messages),
            'top_messages': self._extract_top_messages(messages, limit=5)
        }
    
    def _analyze_sentiment(self, messages: List[Dict]) -> Dict:
        """Sentiment 집계"""
        
        bullish = sum(1 for msg in messages 
                     if msg.get('entities', {}).get('sentiment', {}).get('basic') == 'bullish')
        bearish = sum(1 for msg in messages 
                     if msg.get('entities', {}).get('sentiment', {}).get('basic') == 'bearish')
        total = len(messages)
        
        # Sentiment 점수 (-1 ~ +1)
        sentiment_score = (bullish - bearish) / total if total > 0 else 0
        
        return {
            'bullish_ratio': bullish / total * 100 if total else 0,
            'bearish_ratio': bearish / total * 100 if total else 0,
            'sentiment_score': sentiment_score
        }

3. 병렬 데이터 수집

# airflow/plugins/external_data/__init__.py

class ExternalDataAggregator:
    """병렬로 외부 데이터 수집"""
    
    def collect_for_ticker(self, ticker: str, parallel: bool = True) -> Dict:
        
        if not parallel:
            return self._collect_sequential(ticker)
        
        # ThreadPoolExecutor로 병렬 실행
        with concurrent.futures.ThreadPoolExecutor(max_workers=3) as executor:
            future_yf = executor.submit(self.yfinance.collect_all, ticker)
            future_st = executor.submit(self.stocktwits.collect_sentiment, ticker)
            future_rd = executor.submit(self.reddit.collect_discussions, ticker)
            
            # 결과 수집 (timeout 포함)
            result = {}
            try:
                result['yfinance'] = future_yf.result(timeout=20)
            except Exception as e:
                result['yfinance'] = {'error': str(e)}
            
            # ... StockTwits, Reddit 동일
        
        return result

효과: 순차 ~30초 → 병렬 ~10초 (3배 향상)

🎯 실전 테스트 결과

첫 번째 평가 (2026-01-11)

평가 대상: 4개 거래

✅ ZBIO: $819K by CEO
   Decision: HOLD (52%)
   Reasoning: CEO의 거액 매수지만, 7일간 -55.71% 폭락 후 매수.
              추가 정보 없이는 위험.

✅ APGE: $320K by CMO (Option Exercise)
   Decision: PASS (35%)
   Reasoning: 옵션 행사는 보상 이벤트일 뿐, 진정한 conviction signal 아님.

✅ WRB: $288K by 10% Owner
   Decision: BUY (68%) 🔥
   Reasoning: 대주주 매수 + 합리적 밸류에이션 (P/E 14.38)

✅ RDDT: $221K by CLO (Option Exercise)
   Decision: PASS (35%)
   Reasoning: 옵션 행사 + P/E 112로 과대평가

DB 저장 결과

SELECT 
    ticker, 
    decision, 
    confidence_score,
    JSON_EXTRACT(key_factors, '$[0]') as main_factor
FROM agent_evaluations
ORDER BY created_at DESC;

ticker	decision	confidence	main_factor
WRB	BUY	0.68	10% owner with significant stake
ZBIO	HOLD	0.52	CEO $819K purchase showing conviction
APGE	PASS	0.35	Option exercise - not direct purchase
RDDT	PASS	0.35	Option exercise by CLO

Slack 알림

🤖 AI Agent Insider Trading Analysis

✅ BUY (1)
• WRB (68%) - 10% owner with $288K purchase, reasonable valuation

⏸️ HOLD (1)
• ZBIO (52%) - CEO buying during 55% collapse, wait for clarity

⚠️ PASS (2)
• APGE (35%) - Option exercise, not conviction signal
• RDDT (35%) - CLO option exercise, overvalued at 112x P/E

📊 Summary: 4 evaluations | 1 actionable signal
💰 Total Tokens: ~8,000
💵 Estimated Cost: $0.12

🔬 백테스팅 시스템 구축

설계 전략

3가지 시점 비교:

거래 시점 → 7일 후: 단기 수익률
거래 시점 → 14일 후: 중기 수익률
거래 시점 → 현재: 장기 수익률

구현

# airflow/dags/backtest_all_trades.py

def calculate_returns_multi_period(ticker: str, entry_date, entry_price=None):
    """3개 기간의 수익률 계산"""
    
    stock = yf.Ticker(ticker)
    
    # Entry 가격
    if not entry_price:
        entry_hist = stock.history(start=entry_date, end=entry_date + timedelta(days=3))
        entry_price = float(entry_hist['Close'].iloc[0])
    
    results = {
        '7d': {'entry_price': entry_price, 'holding_days': 7},
        '14d': {'entry_price': entry_price, 'holding_days': 14},
        'current': {'entry_price': entry_price}
    }
    
    # 7일 후
    date_7d = entry_date + timedelta(days=7)
    price_7d = get_price_on_date(stock, date_7d)
    if price_7d:
        results['7d']['current_price'] = price_7d
        results['7d']['return_pct'] = round((price_7d / entry_price - 1) * 100, 2)
    
    # 14일 후, 현재 동일 로직...
    
    return results

첫 백테스트 결과 (5개 샘플)

======================================================================
📊 COMPREHENSIVE BACKTEST REPORT: all_trades_20260111_140431
======================================================================
Total Trades Analyzed: 5
Successfully Calculated: 2
Success Rate: 40.0%
======================================================================

📈 7D PERFORMANCE
   Total Trades: 4
   Profitable: 2 (50.0%)
   Avg Return: -39.02%  ← 이상치 포함
   Median Return: +0.10%  ← 중앙값은 플러스!
   Best: +6.95% (AVGO)
   Worst: -81.73% (NMZ - 뮤추얼 펀드)
   Std Dev: 42.62%

📈 14D PERFORMANCE
   Total Trades: 2
   Profitable: 1 (50.0%)
   Avg Return: -37.98%
   Best: +5.58% (AVGO)
   Worst: -81.55% (NMZ)

📈 CURRENT PERFORMANCE
   Total Trades: 4
   Profitable: 2 (50.0%)
   Median Return: +0.30%
   Best: +4.77% (AVGO)
   Worst: -81.20% (NMZ)

개별 종목 분석

AVGO (Broadcom) - 성공 사례 ✅

Entry: $329.25 (2025-12-18)
7일 후: +6.95% 💚
14일 후: +5.58% 💚
현재 (24일): +4.77% 💚

분석: 내부자 매수 신호가 정확했음. 꾸준한 수익 실현.

NMZ (Nuveen Fund) - 실패 ❌

Entry: $55.27 (2025-12-19)
7일 후: -81.73% 🔴
14일 후: -81.55% 🔴
현재: -81.20% 🔴

분석: 뮤추얼 펀드 특성상 배당락/NAV 조정으로 급락.
      일반 주식과 다른 메커니즘.

핵심 인사이트

뮤추얼 펀드/ETF 제외 필요
- NMZ, NMCO 같은 펀드는 내부자 거래 신호 의미 없음
- 배당락, NAV 조정으로 급등락
- 필터링 필수
중앙값 vs 평균
- 평균: -39% (이상치 때문)
- 중앙값: +0.3% (실제로는 약간 플러스)
- 이상치 제거하면 긍정적
AVGO 성공 케이스
- 7일 후 +6.95%는 훌륭한 수익
- 내부자 신호의 가치 입증

🐛 트러블슈팅 및 해결 과정

문제 1: Airflow Plugin Import 에러

에러:

Broken plugin: [/opt/airflow/plugins/agent/__init__.py] 
attempted relative import with no known parent package

원인: Airflow plugins에서는 상대 경로 import가 작동 안 함

해결:

# ❌ 작동 안 함
from .evaluator import AgentEvaluator

# ✅ 작동함
from agent.evaluator import AgentEvaluator

문제 2: MySQL Decimal JSON 직렬화 에러

에러:

Object of type Decimal is not JSON serializable

원인: MySQL에서 가져온 transaction_value가 Python Decimal 타입

해결:

def save_agent_evaluation(self, evaluation: Dict) -> int:
    import json
    from decimal import Decimal
    
    def convert_decimals(obj):
        """Decimal을 float로 재귀적으로 변환"""
        if isinstance(obj, Decimal):
            return float(obj)
        elif isinstance(obj, dict):
            return {k: convert_decimals(v) for k, v in obj.items()}
        elif isinstance(obj, list):
            return [convert_decimals(item) for item in obj]
        return obj
    
    # JSON 직렬화 시 변환 적용
    json.dumps(convert_decimals(evaluation.get('key_factors', [])))

문제 3: 백테스트 데이터 없음

에러:

WARNING - No trades found 30 days ago
WARNING - No trades found 7 days ago

원인: 크롤러를 최근에 시작해서 과거 데이터 부족

해결: DB 쿼리로 실제 데이터 확인 후 days_ago 조정

-- 날짜별 거래 수 확인
SELECT 
    transaction_date,
    COUNT(*) as total,
    SUM(CASE WHEN transaction_type IN ('BUY','OPTION') 
             AND transaction_value >= 50000 THEN 1 ELSE 0 END) as eligible
FROM insider_trades
GROUP BY transaction_date
ORDER BY transaction_date DESC;

결과를 보고 days_ago=3으로 조정하여 해결.

문제 4: 뮤추얼 펀드 가격 이상

증상:

Entry: $55.35
7일 후: $10.29 (-81%)
비정상적인 하락

원인:

뮤추얼 펀드 배당락
NAV 조정
일반 주식과 다른 메커니즘

해결 (진행 중):

# 뮤추얼 펀드/ETF 제외 필터
WHERE ticker NOT LIKE 'NM%'
AND ticker NOT LIKE '%X'
AND ticker NOT LIKE '%Z'
AND company_name NOT LIKE '%FUND%'
AND company_name NOT LIKE '%ETF%'
AND ticker REGEXP '^[A-Z]{3,5}$'  -- 일반 주식만

📊 시스템 성능 지표

처리 속도

외부 데이터 수집 (병렬):
- 1개 종목: ~1.8초
- 4개 종목: ~7초

Claude API 호출:
- 1회 평가: ~9초
- 4회 평가: ~36초

전체 파이프라인 (4개 종목):
- 외부 데이터 수집: 7초
- AI 평가: 36초
- DB 저장: 1초
- 총 소요 시간: ~44초

비용 분석

Claude Sonnet 4.5 (claude-sonnet-4-5-20250929):
- Input: $3/M tokens
- Output: $15/M tokens

1회 평가당:
- Input tokens: ~1,500
- Output tokens: ~500
- 비용: ~$0.03

월간 예상 (하루 10개 평가):
- 일일: $0.30
- 월간: $9.00

→ 매우 저렴! ✅

데이터 품질

-- 크롤링된 거래 중 가격 정보 커버리지
SELECT 
    COUNT(*) as total,
    COUNT(CASE WHEN price_per_share > 0 THEN 1 END) as with_price,
    ROUND(COUNT(CASE WHEN price_per_share > 0 THEN 1 END) * 100.0 / COUNT(*), 1) 
        as coverage_pct
FROM insider_trades
WHERE created_at_kst >= DATE_SUB(NOW(), INTERVAL 7 DAY);

결과:

전체 커버리지: 100% (모든 Form 4)
가격 데이터: 70-80% (BUY/SELL)
중복 제거율: 99.9%

🎯 다음 단계

1. 백테스팅 개선 (진행 중)

해야 할 일:

✅ 뮤추얼 펀드/ETF 완전 제외
✅ Entry 가격 검증 및 보정
✅ 이상치 수익률 자동 제외
⏳ 더 많은 샘플 수집 (100개+)
⏳ Agent 평가 vs 실제 성과 비교

2. Streamlit 대시보드 구축 (다음 편)

계획:

dashboard/
├── app.py
├── pages/
│   ├── 1_📊_Overview.py
│   ├── 2_🤖_Agent_Performance.py
│   ├── 3_📈_Backtest_Results.py
│   └── 4_🔍_Individual_Trades.py
└── requirements.txt

기능:

실시간 Agent 평가 결과
기간별 수익률 분포 (히스토그램)
승률 비교 (7d vs 14d vs Current)
상위/하위 종목 Top 10
Agent Decision별 성과 분석
누적 수익률 시뮬레이션

3. A/B 테스팅

테스트 항목:

프롬프트 버전 A vs B
Temperature 0.3 vs 0.5
다른 모델 (Sonnet vs Opus)

4. 실시간 추적 시스템

목표:

오늘 평가한 거래를 7일/14일/30일 후 자동 추적
매일 업데이트되는 Agent 성과 리포트
장기 성과 메트릭 구축

💡 배운 점

기술적 인사이트

LLM 프롬프트 엔지니어링
- System prompt에서 JSON 강제 + Decision Guidelines 명시
- Temperature 0.3으로 일관성 확보
- Confidence threshold로 신호 강도 구분
병렬 데이터 수집의 중요성
- ThreadPoolExecutor로 3배 속도 향상
- Timeout 설정으로 안정성 확보
- 실패한 소스가 있어도 계속 진행
백테스팅의 함정
- 뮤추얼 펀드/ETF는 일반 주식과 다름
- Entry 가격 검증 필수
- 이상치 처리 중요
Production-grade 에러 핸들링
- Decimal → float 변환
- 상대/절대 경로 import
- Timezone 처리 (UTC vs KST)

금융 인사이트

옵션 행사 ≠ 매수 신호
- CLO, CMO의 옵션 행사는 보상 이벤트
- 진정한 conviction signal이 아님
- Agent가 정확히 구분함
CEO vs 대주주
- 대주주 (10% owner)의 매수가 더 신뢰도 높음
- 금액보다 비율이 중요
타이밍도 중요
- 급락 후 CEO 매수 (ZBIO): 신중 대응 필요
- 안정적 추세에서 대주주 매수 (WRB): 긍정적 신호

🏆 성과 요약

구축 완료

✅ AI Agent 평가 시스템
✅ 외부 데이터 파이프라인 (병렬 수집)
✅ Claude API 연동 (Sonnet 4.5)
✅ 백테스팅 프레임워크
✅ 자동화된 Airflow DAGs
✅ Slack 알림 시스템

검증 완료

Agent 작동: 4개 거래 평가 성공
DB 저장: 정상 작동
백테스팅: 2/5 성공 (뮤추얼 펀드 제외 필요)
비용: 월 $9로 매우 저렴

다음 목표

100+ 샘플 백테스트
Streamlit 대시보드
Agent 성과 검증

📁 프로젝트 구조 (최종)

insider-trading-agent/
├── docker-compose.yml
├── .env
├── airflow/
│   ├── Dockerfile
│   ├── requirements.txt
│   ├── dags/
│   │   ├── sec_form4_crawler.py
│   │   ├── daily_insider_ranking.py
│   │   ├── agent_evaluation.py          # ✨ NEW
│   │   ├── backtest_validation.py       # ✨ NEW
│   │   └── backtest_all_trades.py       # ✨ NEW
│   └── plugins/
│       ├── database/
│       │   └── insider_db.py
│       ├── parsers/
│       │   └── form4_parser.py
│       ├── external_data/               # ✨ NEW
│       │   ├── __init__.py
│       │   ├── yfinance_collector.py
│       │   ├── stocktwits_collector.py
│       │   └── reddit_collector.py
│       ├── agent/                       # ✨ NEW
│       │   ├── __init__.py
│       │   ├── evaluator.py
│       │   └── prompt_templates.py
│       └── backtest/                    # ✨ NEW
│           ├── __init__.py
│           └── engine.py
├── scripts/
│   ├── init_db.sql
│   └── init_schema_extension.sql       # ✨ NEW
└── local_crawler.py

🔗 참고 자료

Claude API Documentation: https://docs.anthropic.com/
SEC EDGAR API: https://www.sec.gov/edgar/
yfinance: https://github.com/ranaroussi/yfinance
Apache Airflow: https://airflow.apache.org/

마무리

Part 2에서는 AI Agent 시스템과 백테스팅 프레임워크를 구축했습니다. Claude Sonnet 4.5를 활용한 지능형 평가 시스템이 실제로 작동하는 것을 확인했고, 첫 백테스트 결과에서 AVGO의 성공 케이스를 발견했습니다.

다음 편에서는:

더 많은 샘플로 백테스팅 (100+)
Streamlit 대시보드 구축
Agent 성과의 통계적 검증
AWS 배포 (선택)

Stay tuned! 🚀

작성일: 2026년 1월 11일 태그: #AI #InsiderTrading #Claude #MachineLearning #Backtesting #Airflow

🎯 SEC Insider Trading AI Agent 시스템 구축 완료

✅ 완료된 작업

1. Database Schema 확장

2. External Data Collectors 구현

3. AI Agent Evaluator 구현

4. Airflow DAG 추가

5. 환경 설정

🔧 현재 시스템 구조

📊 데이터 흐름

🚀 테스트 완료

📝 다음 단계 (선택사항)

1. Airflow UI에서 DAG 실행

2. 백테스팅 엔진 추가 (미완성)

3. 대시보드 구축 (미완성)

🔑 핵심 파일 위치

💡 주요 설정값

🤖 SEC 내부자 거래 AI Agent 시스템 구축기 - Part 2: AI 평가 및 백테스팅

📋 목차

🎯 프로젝트 개요

지난 편에서…

이번 편에서는…

🤖 AI Agent 시스템 설계

아키텍처

🧠 Claude API 연동

1. 데이터베이스 스키마 확장

2. 프롬프트 엔지니어링

System Prompt

User Prompt Template

3. Agent Evaluator 구현

📊 외부 데이터 수집 파이프라인

1. Yahoo Finance Collector

2. StockTwits Collector

3. 병렬 데이터 수집

🎯 실전 테스트 결과

첫 번째 평가 (2026-01-11)

DB 저장 결과

Slack 알림

🔬 백테스팅 시스템 구축

설계 전략

구현

첫 백테스트 결과 (5개 샘플)

개별 종목 분석

AVGO (Broadcom) - 성공 사례 ✅

NMZ (Nuveen Fund) - 실패 ❌

핵심 인사이트

🐛 트러블슈팅 및 해결 과정

문제 1: Airflow Plugin Import 에러

문제 2: MySQL Decimal JSON 직렬화 에러

문제 3: 백테스트 데이터 없음

문제 4: 뮤추얼 펀드 가격 이상

📊 시스템 성능 지표

처리 속도

비용 분석

데이터 품질

🎯 다음 단계

1. 백테스팅 개선 (진행 중)

2. Streamlit 대시보드 구축 (다음 편)

3. A/B 테스팅

4. 실시간 추적 시스템

💡 배운 점

기술적 인사이트

금융 인사이트

🏆 성과 요약

구축 완료

검증 완료

다음 목표

📁 프로젝트 구조 (최종)

🔗 참고 자료

마무리

관련 게시물

Week6 주간 학습정리

프로젝트 데이터 EDA

책 공부