tcga-survival — TCGA Kaplan-Meier Survival
TCGA 33 cohort × HUGO gene → 자체 KM 추정 + log-rank χ² + Mantel-Haenszel HR + Greenwood 95% CI (외부 lib 0, ko/en/ja).
도구 가이드
정의
tcga-survival은 TCGA 33 cancer cohort × HUGO gene 입력을 받아 cBioPortal `_rna_seq_v2_mrna` (log₂(RSEM+1)) raw fetch + 클라이언트 사이드 Z-score 변환 (전체 샘플 mean/SD baseline, cBioPortal 공식 이배체 baseline 우회) → 5 cohort cut (median/quartile/tertile/custom/optimal[Phase 3 placeholder]) → 자체 Kaplan-Meier estimator (Kaplan & Meier 1958) + log-rank χ² (Mantel 1966) + Mantel-Haenszel HR (Pike 1972) + Greenwood log-log 95% CI (R survival default) + chi² p-value 분기식 (χ²≤30 다항식 A&S 26.2.17 / χ²>30 점근 확장 Therneau 2000) 모두 자체 JS로 구현하는 무료 TCGA 생존 분석 도구입니다. 외부 lib 0 baseline (jStat / lifelines / survival.js / D3 / Chart.js 모두 자체 SVG `<path>` step + `<rect>` CI band + `<line>` censored "+" + 자체 통계 ~200 LOC 대체). IDB Raw 30d 캐시 (gtex-expression 동형 wrapper, `_common/idb.ts`) + Edge case 12건 ko/en/ja + StatsBox Cox 권장 의무 캡션 + p-value 해석 4축 가이드 박스.
목적
(1) GEPIA / OncoLnc 영문 단독 + KM 학습 곡선 — 한국어/일본어 통합 진입점 (2) cohort cut UX 부실 (median 고정) — 5 cut method + custom 슬라이더 + Phase 3 Lausen-Schumacher placeholder (3) 한국어 통계 가이드 X — p-value 해석 4축 (인과 / 다중검정 / cherry-picking / exploratory) (4) bio-toolkit 연계 X — mygene-search → gtex-expression → tcga-survival 3-hop 워크플로우 (5) 외부 npm lib 0 baseline — jStat / lifelines / D3 / Chart.js 모두 자체 stack 대체 (6) Cox 권장 ko/en/ja 의무 캡션 (Mantel-Haenszel ≠ Cox 5~15% 오차)
사용법
① TCGA cohort 선택 (LUAD/BRCA/COAD/LIHC/KIRC 등 33종) ② Gene HUGO symbol + Entrez ID 입력 (예: TP53 / 7157) ③ Endpoint 선택 (OS / DSS / PFS / DFI — Liu 2018 Cell 173:400 baseline) ④ Cut method 선택 (median 권장 ★★★★★ / quartile / tertile / custom / optimal[Phase 3]) ⑤ 분석 시작 → IDB Raw 30d 캐시 hit 시 즉시 / miss 시 Route Handler 경유 cBioPortal fetch (2.5초 SLA) ⑥ KM curve (high/low 두 곡선 + 95% CI band + censored "+") + At-Risk Table (0/12/24/36/48 mo) + StatsBox ⑦ Stats: n_High/Low + log-rank χ² + p-value + HR + 95% CI + Cox 권장 의무 캡션 ⑧ Edge banner: cohort_small / subgroup_small / zero_events / censoring_high / pvalue_underflow 등 12종 ⑨ Export: SVG / PNG / TSV (subject-level) / JSON (분석 결과) — Reproducibility tag 의무 포함 ⑩ 외부 deep link: cBioPortal study/comparison / GDC project / NCBI Gene / mygene-search 내부 / gtex-expression 내부 / PubMed
예시
예 1) TCGA-LUAD × TP53 (대표 종양 억제 유전자) → median cut → high/low + log-rank p < 0.05 예상 예 2) TCGA-BRCA × BRCA1 (유방암 핵심 유전자) → quartile cut → Q1/Q4 비교 예 3) TCGA-COAD × KRAS (대장암 표적) → tertile cut → T1/T3 + Cox 권장 캡션 확인 예 4) TCGA-LIHC × MYC (간암 oncogene) → median cut → 강한 유의 (χ²>30 점근 확장 분기 검증) 예 5) TCGA-KIRC × EGFR (신장암 표적 약물 표지자) → median cut → mygene-search / gtex-expression cross-link 활용