BioPlayground

🧬
← AI Tools
ragadvanced

Memory OS

Memory OS**는 대형 언어 모델 기반 에이전트의 고질적인 단기 기억 상실 문제를 근본적으로 해결하기 위해 개발된 7계층 구조의 로컬 에이전트 전용 메모리 운영체제입니다. 컴퓨터가 고속 연산을 처리하는 랜덤 액세스 메모리(RAM)와 대용량 데이터를 저장하는 솔리드 스테이트 드라이브(SSD)를 유기적으로 오가며 자원을 관리하는 방식처럼 에이전트의 실시간 컨텍스트 윈도우(Context Window)를 입체적으로 관리합니다. 이 시스템은 SQLite 데이터베이스와 Qdrant 벡터 검색 엔진, Redis 메시지 큐 및 백그라운드 비

Memory OS는 대형 언어 모델 기반 에이전트의 고질적인 단기 기억 상실 문제를 근본적으로 해결하기 위해 개발된 7계층 구조의 로컬 에이전트 전용 메모리 운영체제입니다. 컴퓨터가 고속 연산을 처리하는 랜덤 액세스 메모리(RAM)와 대용량 데이터를 저장하는 솔리드 스테이트 드라이브(SSD)를 유기적으로 오가며 자원을 관리하는 방식처럼 에이전트의 실시간 컨텍스트 윈도우(Context Window)를 입체적으로 관리합니다. 이 시스템은 SQLite 데이터베이스와 Qdrant 벡터 검색 엔진, Redis 메시지 큐 및 백그라운드 비동기 워커를 독립적인 Docker 컨테이너 생태계로 묶어 로컬 머신에서 완전한 프라이빗 환경으로 구동됩니다. 에이전트가 사용자와 나눈 모든 대화의 흐름을 수집하고 분해하여 SQLite 기반의 관계형 구조와 Qdrant 기반의 고차원 코사인 유사도 벡터 공간에 입체적으로 인덱싱함으로써 영구적인 사실 지식베이스를 구축합니다. 기존의 많은 에이전트용 메모리 플러그인이나 RAG(Retrieval-Augmented Generation) 시스템들은 사용자의 단순 대화 검색 요청에 대응하기 위해 무분별한 벡터 유사도 검색 결과만을 에이전트의 프롬프트에 쏟아부었습니다. 이러한 방식은 제한된 컨텍스트를 빠르게 고갈시키고 비용을 급증시키며 에이전트가 이미 제공된 정보를 재검색하기 위해 계속해서 외부 도구를 호출하는 악순환을 유발해 전체 성능을 극적으로 떨어뜨립니다. Memory OS는 이러한 임시방편적 접근의 한계를 뛰어넘어 SQLite의 FTS5 엔진을 결합한 4단계 검색 폴백(Hybrid → Dense → Lexical → SQLite) 체계를 제공하고 세션 단위의 중복 데이터 필터링과 의미론적 병합(Semantic Deduplication) 스캐너를 통해 극대화된 토큰 효율성(Token Efficiency)을 달성합니다. 특히 이 운영체제의 핵심 차별점은 최상위 아이덴티티 레이어인 그라운드 트루스 계층(Ground Truth Hierarchy)에 있습니다. 이 계층은 에이전트에게 프롬프트에 주입된 메모리 컨텍스트가 절대적이고 권위 있는 사실임을 인지하도록 지침을 하달하여 에이전트가 스스로의 지식을 불신하고 외부 데이터베이스를 중복 조회하는 비효율을 원천 차단합니다. 일반적인 연구자나 개발자 관점에서 Memory OS는 장기적인 RAG 지식 관리 및 자율 협업 파이프라인의 든든한 밑바탕이 됩니다. 시스템은 대화가 종료될 때마다 백그라운드 워커를 통해 해당 대화에서 핵심 개념과 상호 참조를 추출하고 신뢰도 점수(Trust Scoring) 기반의 자동 피드백 루프를 가동하여 노이즈 정보를 지속적으로 여과합니다. 이렇게 정제된 데이터는 자동 큐레이션 위키(Auto-Curated Wiki) 구조로 개념(Concepts), 엔티티(Entities), 비교군(Comparisons) 폴더에 자동 분류 및 정렬되어 마치 숙련된 인간 연구 비서가 곁에서 영구히 업데이트하는 연구 로그와 같은 역할을 수행합니다. 사용자는 매 세션마다 이전 작업의 맥락이나 라이브러리 사양, 설정해 둔 규칙들을 처음부터 다시 설명할 필요가 없으며 단 몇 줄의 질의만으로 수개월 전의 복잡한 설계 결정 사항을 에이전트의 최신 맥락에 즉각적으로 불러와 고도의 연속성 있는 작업을 이어나갈 수 있습니다. 또한 이 솔루션은 상용 클라우드 기반 메모리 서비스에 데이터를 업로드하지 않으므로 민감한 비즈니스 로직이나 연구 기밀 데이터를 다루는 가혹한 보안 환경에서도 외부 유출 걱정 없이 안전하게 적용할 수 있습니다. OpenAI, Anthropic, OpenRouter와 같은 외부 클라우드 LLM API와 자유롭게 연동될 뿐만 아니라 Ollama나 llama.cpp를 통해 완벽히 로컬에서 구동되는 인프라와도 호환되어 비즈니스 성격과 인프라 한계에 맞춤형으로 유연한 대처가 가능합니다. 로컬 도커 스택과 경량 데이터베이스 모델을 조합하여 메모리 사용량을 최소화하면서도 백그라운드의 분산 워커 프로세스를 통해 실시간으로 밀려드는 대규모 에이전트 상태 변화를 지연 없이 소화해 내는 강력한 성능과 안정성을 제공합니다.

💻 필요한 컴퓨터 사양

🧠RAM

8GB 이상 권장 (로컬 임베딩 및 LLM 모델 구동 시 12GB~24GB 필요, CPU 단독 사용 시 속도 저하 발생)

💾저장공간

모델 다운로드 크기 제외 1GB 이내, 로컬 벡터 DB 데이터양에 따라 확장 필요

설치법

### 4-1. Quick Start

```bash
curl -sSL https://raw.githubusercontent.com/ClaudioDrews/memory-os/main/setup.sh | bash
```

### 4-2. 상세 설치

```bash
# 1. 깃허브 저장소 복제 및 이동
git clone https://github.com/ClaudioDrews/Memory-OS.git
cd Memory-OS

# 2. 파이썬 가상환경 설정 및 의존성 설치
pip install -r requirements.txt

# 3. SQLite 데이터베이스 및 검색 인덱스 초기화
python setup/setup_db.py

# 4. 도커 컴포즈 기반 필수 백엔드 실행 (Qdrant + Redis + Worker)
cd docker
cat > .env << EOF
REDIS_PASSWORD=$(openssl rand -hex 16)
EMBEDDING_DIMS=4096
COLLECTION_NAME=knowledge_base
LOG_LEVEL=INFO
EOF
docker compose up -d

# 5. Icarus 플러그인 복사 및 설정 파일 활성화
cp -r ../icarus/ ~/.hermes/plugins/icarus/
# ~/.hermes/config.yaml 파일의 enabled 항목에 '- icarus' 추가 등록 후 gateway restart
```
📄 공식문서🐙 GitHub

📝 업데이트 노트

아직 업데이트 노트가 없습니다.

🧪 관련 생명의 코드

관련된 생명의 코드 글이 아직 없습니다.