BioPlayground

🧬
← AI Tools
image_aiintermediate

Boogu-Image

부구 이미지**(Boogu-Image-0.1)는 boogu-project 팀이 2026년 6월 1일에 발표한 최신 오픈소스 텍스트-이미지 생성 및 편집용 디퓨전(Diffusion) 모델 패밀리입니다. 이 모델은 100억 파라미터(10B Parameter) 규모의 아키텍처를 기반으로 설계되었으며, Qwen3-VL 텍스트 인코더(Text Encoder)와 Flux VAE의 연동 구조를 채택하여 단순한 이미지 생성을 넘어 텍스트와 이미지의 정밀한 정렬(Alignment) 성능을 극대화하였습니다. 마치 전문 활판 인쇄가가 캔버스 위에 한

부구 이미지(Boogu-Image-0.1)는 boogu-project 팀이 2026년 6월 1일에 발표한 최신 오픈소스 텍스트-이미지 생성 및 편집용 디퓨전(Diffusion) 모델 패밀리입니다. 이 모델은 100억 파라미터(10B Parameter) 규모의 아키텍처를 기반으로 설계되었으며, Qwen3-VL 텍스트 인코더(Text Encoder)와 Flux VAE의 연동 구조를 채택하여 단순한 이미지 생성을 넘어 텍스트와 이미지의 정밀한 정렬(Alignment) 성능을 극대화하였습니다. 마치 전문 활판 인쇄가가 캔버스 위에 한 땀 한 땀 활자를 정확하게 정렬해 나가듯, 이 모델은 텍스트 프롬프트에 기재된 철자와 레이아웃을 정확하게 이해하고 다국어 텍스트를 고품질 이미지 내에 수려하게 렌더링하는 타이포그래피(Typography) 특화 생성 기법을 선보입니다. 현재 베이스(Base) 모델을 필두로 하여 고속 추론을 지원하는 터보(Turbo) 모델, 그리고 명령어 기반 이미지 변형을 제공하는 에디트(Edit) 모델까지 다채로운 배리언트를 제공하며, ComfyUI 플랫폼과의 네이티브 연동을 통해 별도의 복잡한 인프라 구성 없이도 강력한 로컬 가상 워크플로우를 손쉽게 구축할 수 있습니다. 기존의 오픈소스 이미지 생성 모델들은 화려한 배경이나 피사체를 사실적으로 묘사하는 데에는 큰 진전을 이루었으나, 이미지 내부에 글자를 직접 렌더링하는 과정에서 문자 뭉개짐이나 철자 왜곡(Spelling distortion) 등의 기술적 한계를 노출해 왔습니다. 부구 이미지는 이러한 한계를 극복하기 위해 다국어 텍스트 레이아웃(Layout) 알고리즘과 조밀한 텍스트 렌더링(Dense Text Rendering) 최적화를 아키텍처 레벨에서 내재화하여, 상용 폐쇄형 인공지능 도구에 의존하지 않고도 높은 시각적 충실도와 가독성을 보장하는 고해상도 디자인을 만들어냅니다. 특히 주목할 만한 부분은 상용 독점 모델 대비 훈련에 사용된 데이터 규모가 약 한 자리 수(One order of magnitude) 가량 작음에도 불구하고, 고도의 데이터 정제 파이프라인과 정밀한 피드백 메커니즘을 바탕으로 초고해상도의 상업적 타이포그래피 품질을 확보했다는 점입니다. 아울러 상업적 라이선스로 악용 제약이 큰 타 모델들과 달리 Apache-2.0 오픈소스 라이선스를 채택하여, 사용자가 개발 비용이나 사용 제한에 대한 우려 없이 온전히 로컬 환경에서 상업적 사용 권한을 발휘할 수 있게 보장합니다. 실제 연구 현장과 디자인 실무에서 부구 이미지는 정보의 정확성이 요구되는 복잡한 과학적 모형(Scientific visualization)이나 정밀 제품 인포그래픽 제작에 강력한 도구로 자리매김하고 있습니다. 예를 들어 생명공학 분야 연구자가 논문이나 학회 포스터 발표를 위해 복잡한 단백질 구조나 세포막 내 유전자 전사 과정을 시각화하려는 경우, 부구 이미지는 다이어그램 이미지 내부에 'mRNA Transcription'이나 'Cell Membrane' 같은 학술 용어를 철자의 변형 없이 자연스럽고 명확하게 병기해 줌으로써 불필요한 사후 포토샵 수작업을 대폭 생략해 줍니다. 또한 에디트 모델의 지시어 기반 국소 이미지 수정 기능을 활용하여, 기존 바이오 테크 제품 시안 이미지 내의 레이블 텍스트를 한국어에서 영어로 정교하게 바꾸거나 특정 실험 장비의 색상 및 배경 질감을 일관성 있게 리터칭함으로써 시제품 프로토타입 시각화의 생산성을 극적으로 끌어올립니다.

💻 필요한 컴퓨터 사양

🧠RAM

NVIDIA GPU 12GB+ 권장 (Turbo 모델은 8GB 이상, Base/Edit 모델은 12GB~16GB 이상, 2K 생성 및 텍스트 인코더 로드 시 24GB 권장)

💾저장공간

모델 가중치(Base, Turbo, Edit 각 10B 규모) 및 종속 패키지 포함 50GB 이상 권장

⚡ 설치법

### 4-1. Quick Start

```bash
git clone https://github.com/boogu-project/Boogu-Image && cd Boogu-Image
conda create -y -n boogu python=3.10 && conda activate boogu
pip install -r requirements/torch2.7-cu126.txt && pip install -e .
```

### 4-2. 상세 설치

```bash
# Flash Attention 최적화 설치 (선택)
python utils/get_flash_attn.py

# 파이썬 추론 예시 (Hugging Face diffusers 사용)
# pip install -U diffusers transformers accelerate torch
import torch
from diffusers import DiffusionPipeline

pipe = DiffusionPipeline.from_pretrained("Boogu/Boogu-Image-0.1-Base", torch_dtype=torch.float16)
pipe.to("cuda")

prompt = "A high-quality product mockup of a cosmetic bottle, with the text 'NATURE' printed on it, product photography style"
image = pipe(prompt).images[0]
image.save("boogu_output.png")
```
📄 공식문서🐙 GitHub

📝 업데이트 노트

아직 업데이트 노트가 없습니다.

🧪 관련 생명의 코드

관련된 생명의 코드 글이 아직 없습니다.