Moonshine v2
초경량 실시간 음성 인식(STT) — Whisper 대비 5배 빠른 엣지 디바이스 전용 ASR 엔진
Moonshine v2는 미국 Useful Sensors가 2026년 2월 출시한 오픈소스 음성 인식(ASR, Automatic Speech Recognition) 엔진이에요. 한 줄로 표현하면 "Whisper의 가벼운 동생 — 라즈베리파이, 웨어러블, 모바일에서도 실시간으로 돌아가는 STT"라고 할 수 있습니다. 기존 OpenAI Whisper는 정확하지만 무거워서 (tiny 모델도 39M+) 엣지 디바이스에서 실시간 처리가 어려웠어요. Moonshine v2는 "Ergodic Streaming Encoder" 아키텍처로 sliding-window self-attention을 적용해 27M 파라미터로 Whisper 수준 정확도를 유지하면서 5배 빠른 추론 속도를 달성합니다. RoPE(Rotary Position Embedding)로 zero-padding을 제거해 메모리·연산 낭비도 최소화했어요. 마치 "Whisper가 클라우드 GPU용 SUV라면, Moonshine은 엣지 IoT용 전기 자전거"인 셈이죠. 생명공학·의료 연구원 관점에서는 (1) 환자 인터뷰·임상시험 회의록을 클라우드 전송 없이 로컬에서 실시간 전사(HIPAA·GDPR 보호), (2) 라이브셀 이미징 중 "3분 후 약물 처리" 같은 음성 메모를 자동 타임스탬프와 함께 저장, (3) Raspberry Pi 기반 실험 노트북 보조 디바이스 구축까지 가능해요. moonshine-voice SDK는 STT + 의도 인식 + TTS를 통합 제공해서 "손 안 대고 마이크로 실험 명령" 같은 음성 에이전트도 만들 수 있습니다.
💻 필요한 컴퓨터 사양
최소 2GB (Tiny 27M 모델), 권장 4GB (Base 61M 모델), 8GB+(다중 채널 또는 한국어 fine-tune)
0 (CPU 전용 가능, Raspberry Pi 4부터 실시간) / NVIDIA GPU 2GB+ 시 10배 가속 / Apple Silicon Metal 지원
Tiny ~26MB / Base ~61MB / 전체 패키지 250MB 이내. 학습 데이터 별도
⚡ 설치법
# Quick Start (Python pip)
pip install moonshine-voice
# Python API — 기본 전사
import moonshine
text = moonshine.transcribe("audio.wav", model="moonshine/tiny")
print(text)
# 실시간 스트리밍 (마이크 입력)
from moonshine_voice import StreamingTranscriber
stt = StreamingTranscriber(model="moonshine/base")
for chunk in stt.stream_from_microphone():
print(chunk.text, end="", flush=True)
# 엣지 디바이스 (Raspberry Pi 5)
# requirements: Python 3.10+, sounddevice, numpy
pip install moonshine-voice[edge]
python -m moonshine_voice.pi --model tiny --language ko🧬 바이오 활용
임상 인터뷰·진료 기록 로컬 STT
Moonshine tiny (27M) 모델을 Mac mini M2에 올려 환자 인터뷰를 실시간 전사. 클라우드 전송 0(HIPAA·GDPR 보호), 30분 인터뷰 ~6초 대기로 전사 완료. moonshine-voice SDK에 "환자 ID", "증상 시작 시점" 같은 의도 인식 룰 추가하면 구조화된 EMR 입력 자동 생성.
라이브셀 이미징 음성 어노테이션
현미경 옆 Raspberry Pi 5에 Moonshine + microphone 모듈 배치. "3분 후 EGF 100ng/mL 처리" 같은 음성 메모를 자동 타임스탬프와 함께 .jsonl 로그로 기록 → ImageJ/Fiji 매크로가 시간 동기 메타데이터로 흡수. 손이 자유로워야 하는 라이브 실험에 즉시 적용 가능.
엣지 보이스 에이전트 (실험실 비서)
moonshine-voice SDK + Llama.cpp + Pi 4(4GB)로 실험실 비서 구축. "OD600 0.6 도달 시 알람 켜줘" "PCR 마스터믹스 레시피 보여줘" 같은 명령을 100ms 이하 레이턴시로 인식 → MQTT로 실험 장비 트리거. 클라우드 의존 0, 전력 5W 미만.
📝 업데이트 노트
아직 업데이트 노트가 없습니다.
🧪 관련 생명의 코드
관련된 생명의 코드 글이 아직 없습니다.