방법론
HeatNews 점수 산출 공식과 데이터 처리
1. 데이터 수집
- 국내 주요 경제 매체 RSS 피드 5분 간격 풀링
- Yahoo Finance 시세 5분 간격 갱신 (KOSPI · KOSDAQ + 종목별)
- 운영시간: 한국 시간(KST) 07:50 ~ 20:00
2. 테마 노출(prominence) 점수
각 투자 테마의 뉴스 노출량은 다음 공식으로 산출합니다:
articleCount × 1.0 + uniquePublishers × 0.35 + termHits × 0.15 − spamPenalty
articleCount는 기사 수, uniquePublishers는 다양한 매체 가중치, termHits는 테마 키워드 노출 빈도이며 spamPenalty는 도배성 기사 패널티입니다.
3. 종목 매칭 신뢰도(confidence)
한 종목이 특정 테마에 속한다는 신뢰도 점수:
min(0.2 + aliasHits × 0.26 + (aliasHit ? 0.42 : 0) + themeHits × 0.08, 0.98)
기본 표시 임계값은 0.58이며, 매칭 방식은 다음과 같이 구분됩니다:
- 명시 언급(entity) — 기사에서 종목명이 직접 언급된 경우
- 하이브리드(hybrid) — 직접 언급 + 테마 키워드가 함께 일치
- 테마 유사(theme) — 테마 키워드 기반 매칭 (직접 언급 없음)
4. 반응(reaction) 점수
테마의 시장 반응 점수는 신뢰도로 가중평균한 상대수익률입니다:
Σ(confidence × relativeReturn) ÷ Σ(confidence) → [-15, 15] 클램프
상대수익률 = 종목 변동률 − 벤치마크(KOSPI/KOSDAQ) 변동률. 트리맵 색상은 sqrt 스케일이며 ±5%에서 색이 포화됩니다.
5. 중복 제거
제목을 정규화(소문자 변환 + 공백 압축) 후 일치하면 동일 기사로 처리합니다. 동일 사건을 여러 매체가 보도해도 단일 기사로 카운트됩니다.
6. 색상·시각화
- 녹색 → 벤치마크 대비 강세, 빨강 → 약세, 중립색 → 변동 없음
- 색맹 접근성을 위해 ▲▼ 화살표 기호도 함께 표시
- 타일 크기는 노출 점수에 비례, squarified treemap 알고리즘으로 배치
관련 페이지
⚠ 모든 데이터·점수·분석은 투자 참고 자료이며 투자 권유가 아닙니다. 매매 판단은 사용자 본인 책임이며, 본 서비스는 결과에 대한 책임을 지지 않습니다.