MSA Viewer
다중 서열 정렬(MSA) 시각화 + Shannon 보존도 + 5 컬러 스킴 (ClustalX/Zappo/Taylor/Hydrophobicity/Conservation)
도구 가이드
정의
MSA Viewer는 FASTA / Clustal / Stockholm 1.0 포맷의 다중 서열 정렬 파일을 100% 브라우저 내에서 파싱·시각화하는 도구입니다. 메인 그리드는 Canvas 100% Base로 렌더링하여 1,000+ 컬럼·100+ 시퀀스 환경에서도 60fps 스크롤을 유지하며, 룰러/툴팁/도메인 영역은 SVG 데코레이션 레이어로 분리합니다. Shannon 엔트로피 기반 Fractional Gap-Penalized 보존도(S=(1−H/H_max)(1−f_gap))를 기본 + JSD (Capra-Singh 2007, BLOSUM62 background) / % Identity 토글, ClustalX(Thompson 1997 11그룹 보존 임계, 컬럼 프로파일 pre-compute O(1) 캐시) / Zappo / Taylor / Kyte-Doolittle Hydrophobicity / Conservation gradient 5 컬러 스킴을 제공합니다. 외부 차트/MSA 라이브러리 의존성 0.
목적
(1) Jalview (Java 데스크톱 설치 부담) / BioJS MSAViewer (영문 전용, 임베드만) / UGENE (Heavy GUI) 대안 — 웹 즉시 + 한국어 우선 (2) Pfam / InterPro 시퀀스 정렬을 클라우드 업로드 없이 사내·연구실에서 안전하게 검토 (3) Globin / PKC kinase / 7TM GPCR 표준 데이터셋 정합 검증 baseline (4) Phase 1 `_common/sequence.ts` + `_common/svg.ts` 헬퍼 재사용 → 후속 MSA 알고리즘 (BLOSUM 매트릭스, AAindex 등) 확장 진입점
사용법
① FASTA / Clustal / Stockholm 파일 업로드 (또는 "Globin 데모 로드" 클릭) ② 컬러 스킴 선택 (default: ClustalX, Thompson 1997 11그룹 보존 임계) ③ Conservation 알고리즘 선택: • Shannon (Gap-penalized) — default (AL2CO 표준) • JSD (BLOSUM62) — functional residue 우위 (Capra-Singh 2007) • % Identity — 단순 최빈 빈도 ④ Gap 모드: Penalize (default) / Ignore / Include (21st residue) ⑤ Consensus threshold: 50% / 70% / 90% + 가이드 기호(`+` `.` `-`) ⑥ Zoom (8/12/16 px) + 잔기 텍스트 표시 토글 ⑦ 도메인 어노테이션: `>SeqA: 10-45, Kinase, #ff0000` 형식 한 줄에 하나 ⑧ Export: FASTA / Clustal round-trip + PNG (Canvas DPI 보정) + JSON
예시
예 1) Globin family (HBB / HBA / MYG human) → 데모 로드 → His F8 proximal histidine 컬럼 S_norm ≥ 0.95 → ClustalX 색상 즉시 반영 예 2) PKC kinase family (5 시퀀스 × ~300 컬럼) → DFG motif 컬럼 보존도 ≥ 0.9 → ClustalX 노란/붉은 블록 → glycine-rich loop 시각 확인 예 3) 7TM GPCR Rhodopsin family (20 시퀀스 × ~400 컬럼) → TM1~TM7 보존 블록 자동 시각화 → Conservation gradient 색상으로 loop 영역과 대비 예 4) Pfam PF00571 CBS domain (Stockholm) → `#=GC SS_cons` 자동 표시 (α-helix `H` / β-strand `E`) → 도메인 어노테이션으로 active site 강조