BioPlayground

๐Ÿงฌ
โ† AI Tools
ragbeginner

Firecrawl Research Index

๐Ÿšจ **๋ณธ ์„น์…˜์ด BP ์‚ฌ์ดํŠธ(/ai-tools/[slug])์— ๊ทธ๋Œ€๋กœ ๋…ธ์ถœ๋ฉ๋‹ˆ๋‹ค.** ยงํ’ˆ์งˆ baseline ยงdescription ๋ฃฐ์„ ๋ฐ˜๋“œ์‹œ ์ค€์ˆ˜:

๐Ÿšจ ๋ณธ ์„น์…˜์ด BP ์‚ฌ์ดํŠธ(/ai-tools/[slug])์— ๊ทธ๋Œ€๋กœ ๋…ธ์ถœ๋ฉ๋‹ˆ๋‹ค. ยงํ’ˆ์งˆ baseline ยงdescription ๋ฃฐ์„ ๋ฐ˜๋“œ์‹œ ์ค€์ˆ˜: Mendable.ai์—์„œ ๊ฐœ๋ฐœํ•˜์—ฌ 2026๋…„ 6์›” 17์ผ์— ์ „๊ฒฉ ์ถœ์‹œํ•œ Firecrawl Research Index๋Š” AI ์—์ด์ „ํŠธ์™€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์ด ํ•™์ˆ  ๋…ผ๋ฌธ ๋ฐ ์˜คํ”ˆ์†Œ์Šค ์ƒํƒœ๊ณ„์— ์ดˆ๊ณ ์„ฑ๋Šฅ RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ, Retrieval-Augmented Generation)๋ฅผ ์ฆ‰๊ฐ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•๋Š” ์—ฐ๊ตฌ ํŠนํ™”ํ˜• ๋ฐ์ดํ„ฐ ์ธ๋ฑ์Šค ์„œ๋น„์Šค์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ์›น ์Šคํฌ๋ ˆ์ดํผ๋“ค์ด ์›์‹œ HTML ๋ฐ์ดํ„ฐ๋ฅผ ๊ทธ๋Œ€๋กœ ๊ธ์–ด์™€ ๋ถ„์„ ๋ฆฌ์†Œ์Šค๋ฅผ ์†Œ๋ชจํ•˜๊ฒŒ ๋งŒ๋“ค์—ˆ๋‹ค๋ฉด, ์ด ๋„๊ตฌ๋Š” 300๋งŒ ๊ฐœ ์ด์ƒ์˜ arXiv ํ•™์ˆ  ๋…ผ๋ฌธ๊ณผ ํ•ด๋‹น ์—ฐ๊ตฌ๋“ค์˜ ๊ณต์‹ ๊นƒํ—ˆ๋ธŒ(GitHub) ์ €์žฅ์†Œ ๋ฐ์ดํ„ฐ๋ฅผ ๋งค์ผ ์ž๋™์œผ๋กœ ์ธ๋ฑ์‹ฑํ•˜๊ณ  ํŒŒ์‹ฑํ•˜์—ฌ LLM์ด ์ฆ‰์‹œ ์ฝ์„ ์ˆ˜ ์žˆ๋Š” ๋งˆํฌ๋‹ค์šด ํ˜•์‹์˜ ์ •์ œ๋œ ํ…์ŠคํŠธ์™€ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋กœ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋น„์œ ํ•˜์ž๋ฉด, ์ผ๋ฐ˜ ์›น ์Šคํฌ๋ ˆ์ดํผ๊ฐ€ ๋ฐ”๋‹ค์—์„œ ์ •์ œ๋˜์ง€ ์•Š์€ ์›์œ ๋ฅผ ๊ทธ๋Œ€๋กœ ํผ ์˜ฌ๋ฆฌ๋Š” ํŽŒํ”„๋ผ๋ฉด, Firecrawl Research Index๋Š” ์ •์œ ์†Œ ๊ณผ์ •์„ ๊ฑฐ์ณ ์ž๋™์ฐจ์— ๋ฐ”๋กœ ๋„ฃ์„ ์ˆ˜ ์žˆ๋Š” ๊ณ ๊ธ‰ ํœ˜๋ฐœ์œ ๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ณต๊ธ‰ํ•˜๋Š” ์ง€๋Šฅํ˜• ๊ธ‰์œ  ์‹œ์Šคํ…œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ํ•™์ˆ  ๊ฒ€์ƒ‰ API๋‚˜ ๊ฐœ๋ณ„ ํ•™์ˆ  ์•„์นด์ด๋ธŒ ํฌ๋กค๋ง ๋ฐฉ์‹์€ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์˜ ๋…ธ์ด์ฆˆ๊ฐ€ ์‹ฌํ•˜๊ณ , ๋…ผ๋ฌธ ํ…์ŠคํŠธ ๋‚ด์˜ ์ˆ˜์‹์ด๋‚˜ ํ‘œ๊ฐ€ ๊นจ์ ธ LLM์˜ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ๋ฅผ ์˜ค์—ผ์‹œํ‚ค๋Š” ๊ณ ์งˆ์ ์ธ ๋ฌธ์ œ๋ฅผ ์•ˆ๊ณ  ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์—ฐ๊ตฌ์šฉ ์—์ด์ „ํŠธ๊ฐ€ ๋…ผ๋ฌธ์˜ ์ด๋ก ์  ์›๋ฆฌ๋ฅผ ์ดํ•ดํ•˜๋”๋ผ๋„ ์‹ค์ œ ๊ตฌํ˜„ ์ฝ”๋“œ์ธ ๊นƒํ—ˆ๋ธŒ ๋ฆฌํฌ์ง€ํ† ๋ฆฌ๋ฅผ ๋ณ„๋„๋กœ ๊ฒ€์ƒ‰ํ•˜๊ณ  ๋ณ‘ํ•ฉํ•˜๋Š” ๊ณผ์ •์—์„œ ํ† ํฐ ์†Œ๋ชจ๊ฐ€ ๊ทน์‹ฌํ•˜๊ณ  ๊ฒ€์ƒ‰ ์„ฑ๊ณต๋ฅ ์ด ๋–จ์–ด์กŒ์Šต๋‹ˆ๋‹ค. Firecrawl Research Index๋Š” ์ด๋Ÿฌํ•œ ํŒŒํŽธํ™”๋œ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ํ˜์‹ ์ ์œผ๋กœ ๋‹จ์ˆœํ™”ํ•˜์—ฌ ๋‹จ์ผ API ํ˜ธ์ถœ๋งŒ์œผ๋กœ arXiv์˜ ์ „๋ฌธ ํ…์ŠคํŠธ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๊ด€๋ จ ๊นƒํ—ˆ๋ธŒ์˜ ๋ฆฌ๋“œ๋ฏธ(README), ์ด์Šˆ(Issues), ํ’€ ๋ฆฌํ€˜์ŠคํŠธ(Pull Requests) ๋‚ด์—ญ๊นŒ์ง€ ์—ฐ๊ณ„ ๊ฒ€์ƒ‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ arXivQA ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€ ๊ฒฐ๊ณผ, ๊ธฐ์กด ๋ฒ”์šฉ ์›น ๊ฒ€์ƒ‰ ์—”์ง„ ๋Œ€๋น„ 18% ๋†’์€ ๊ฒ€์ƒ‰ ์žฌํ˜„์œจ(Recall)๊ณผ 0.750์˜ ๋†’์€ ํ‰๊ท  ์—ญ์ˆœ์œ„(MRR, Mean Reciprocal Rank)๋ฅผ ๋‹ฌ์„ฑํ•˜์—ฌ ์—์ด์ „ํŠธ๊ฐ€ ์ตœ์ƒ์œ„ 2๊ฐœ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ๋‚ด์—์„œ ์›ํ•˜๋Š” ํ•ต์‹ฌ ์ •๋ณด๋ฅผ ์ •ํ™•ํžˆ ์ฐพ์•„๋‚ด๋„๋ก ์ตœ์ ํ™”๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ธ์ถœ ์ •ํ™•๋„๋ฅผ ๊ทน๋Œ€ํ™”ํ•˜์—ฌ ๋ฌด์˜๋ฏธํ•œ ํƒ์ƒ‰ ํ† ํฐ ๋‚ญ๋น„๋ฅผ ์ ˆ๊ฐํ•˜๊ณ  ์˜ค๊ฒ€์ƒ‰์œผ๋กœ ์ธํ•œ ์—์ด์ „ํŠธ์˜ ์˜ค์ž‘๋™์œจ์„ ํš๊ธฐ์ ์œผ๋กœ ๋‚ฎ์ถฐ ์ค๋‹ˆ๋‹ค. ์ƒ๋ช…๊ณตํ•™ ๋ฐ ์ธ๊ณต์ง€๋Šฅ ์œตํ•ฉ ์—ฐ๊ตฌ์ž๋Š” ์ด ๋„๊ตฌ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ตœ์‹  ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ ์˜ˆ์ธก ๋ชจ๋ธ์ด๋‚˜ ๋ถ„์ž ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๋™ํ–ฅ์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ถ”์ ํ•˜๊ณ  ๋ถ„์„ ํŒŒ์ดํ”„๋ผ์ธ์„ ์ž๋™ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์—์ด์ „ํŠธ์—๊ฒŒ ํŠน์ • ์งˆํ™˜ ํ‘œ์ ์— ๋Œ€ํ•œ ์ƒˆ๋กœ์šด ํ™•์‚ฐ ๋ชจ๋ธ(Diffusion Model) ์•„ํ‚คํ…์ฒ˜๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋„๋ก ์ง€์‹œํ•˜๋ฉด, Firecrawl Research Index๋Š” ์ˆ˜๋ฐฑ ์žฅ์˜ ๋…ผ๋ฌธ์„ ๋’ค์ง€๋Š” ๋Œ€์‹  ํ•ด๋‹น ์ด๋ก ์˜ ์ˆ˜ํ•™์  ์ˆ˜์‹๊ณผ ๊ตฌ์กฐ์  ๋‹ค์ด์–ด๊ทธ๋žจ์ด ๋งˆํฌ๋‹ค์šด์œผ๋กœ ๋ฒˆ์—ญ๋œ ๋…ผ๋ฌธ ๋ณธ๋ฌธ ๋ฐ ๊นƒํ—ˆ๋ธŒ ํŒŒ์ด์ฌ(Python) ์†Œ์Šค์ฝ”๋“œ๋ฅผ ํ•œ ๋ฒˆ์— ํŒจํ‚ค์ง•ํ•˜์—ฌ ๋ฆฌํ„ดํ•ฉ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ž๋Š” ์ด๋ฅผ ํ†ตํ•ด ๋ณต์žกํ•œ ๋ฌธํ—Œ ์กฐ์‚ฌ ๋‹จ๊ณ„๋ฅผ ๋‹จ ๋ช‡ ์ดˆ ๋งŒ์— ์ข…๊ฒฐํ•˜๊ณ  ์ตœ์‹  ๋…ผ๋ฌธ์˜ ๋ฒค์น˜๋งˆํฌ ์„ฑ๋Šฅ ์ง€ํ‘œ๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ๋น„๊ต ๋ถ„์„ํ•˜๋Š” ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG, Retrieval-Augmented Generation) ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•จ์œผ๋กœ์จ ์—ฐ๊ตฌ ์ƒ์‚ฐ์„ฑ์„ ์ˆ˜์‹ญ ๋ฐฐ ์ด์ƒ ๋Œ์–ด์˜ฌ๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ตœ์ข…์ ์œผ๋กœ ์ถ•์ ๋œ ๋ฐ์ดํ„ฐ๋Š” ํŒŒ์ดํ”„๋ผ์ธ ๋‚ด๋ถ€์˜ ์ถ”๊ฐ€์ ์ธ ์˜๋ฏธ๋ก ์  ํ•„ํ„ฐ๋ง์„ ๊ฑฐ์ณ ์‹ ์•ฝ ๊ฐœ๋ฐœ์ด๋‚˜ ๋ถ„์ž ๋™๋ ฅํ•™ ์˜ˆ์ธก์˜ ๊ฐ€์†ํ™”์— ์ง์ ‘ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ’ป ํ•„์š”ํ•œ ์ปดํ“จํ„ฐ ์‚ฌ์–‘

๐Ÿง RAM

0 (ํด๋ผ์šฐ๋“œ API ๊ธฐ๋ฐ˜ ์ž‘๋™, ๋กœ์ปฌ GPU ๋ฆฌ์†Œ์Šค ๋ถˆํ•„์š”)

๐Ÿ’พ์ €์žฅ๊ณต๊ฐ„

100MB ๋ฏธ๋งŒ (SDK ๋ฐ CLI ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์„ค์น˜์šฉ)

โšก ์„ค์น˜๋ฒ•

### 4-1. Quick Start

```bash
# Firecrawl CLI ๊ธฐ๋ฐ˜์˜ Research Index ์—์ด์ „ํŠธ ์Šคํ‚ฌ ์ถ”๊ฐ€
npx skills add firecrawl/skills@firecrawl-research-index
```

### 4-2. ์ƒ์„ธ ์„ค์น˜

```bash
# Python SDK ์„ค์น˜๋ฅผ ํ†ตํ•œ API ์—ฐ๋™ ์ค€๋น„
pip install firecrawl-py

# ํ™˜๊ฒฝ๋ณ€์ˆ˜ ์„ค์ •
export FIRECRAWL_API_KEY="your_api_key_here"
```

```python
from firecrawl import FirecrawlApp
import os

# API ์ดˆ๊ธฐํ™” ๋ฐ arXiv ํ•™์ˆ  ๋…ผ๋ฌธ ๊ฒ€์ƒ‰ ์š”์ฒญ
app = FirecrawlApp(api_key=os.getenv("FIRECRAWL_API_KEY"))

# Note: Research Index๋Š” /v2/search/research/papers API ์—”๋“œํฌ์ธํŠธ๋ฅผ ํ†ตํ•ด ์ ‘๊ทผํ•˜๋ฉฐ,
# SDK์˜ search ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋˜๋Š” direct API request๋กœ ์—ฐ๋™ํ•ฉ๋‹ˆ๋‹ค.
```

```bash
# API ์—”๋“œํฌ์ธํŠธ๋ฅผ ์‚ฌ์šฉํ•œ ์ง์ ‘ ํ˜ธ์ถœ ์˜ˆ์‹œ
curl -X GET "https://api.firecrawl.dev/v2/search/research/papers?query=diffusion%20image%20synthesis&k=20" \
  -H "Authorization: Bearer $FIRECRAWL_API_KEY"
```

๐Ÿงฌ ๋ฐ”์ด์˜ค ํ™œ์šฉ

๐Ÿ”ฌ

๐Ÿ”ฌ [๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ ์˜ˆ์ธก ๋ชจ๋ธ ์ตœ์‹  ์—ฐ๊ตฌ ์ถ”์  ๋ฐ RAG ์‹œ์Šคํ…œ ๊ตฌ์ถ•]**

Firecrawl Research Index์˜ `/v2/search/research/papers` API๋ฅผ ํ˜ธ์ถœํ•˜๊ณ  ํŒŒ๋ผ๋ฏธํ„ฐ `query="AlphaFold-Multimer complex prediction"`, `k=10`์„ ์„ค์ •ํ•˜์—ฌ ๊ฒ€์ƒ‰์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. 3M+ ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ 10๊ฐœ์˜ ์ตœ์‹  ๋…ผ๋ฌธ ์ „๋ฌธ๊ณผ ๊ทธ์— ์ƒ์‘ํ•˜๋Š” PyTorch ์ฝ”๋“œ ์ €์žฅ์†Œ๋ฅผ 2์ดˆ ์ด๋‚ด๋กœ ํ™•๋ณดํ•˜๊ณ , LangChain๊ณผ ์—ฐ๋™ํ•˜์—ฌ ๋กœ์ปฌ RAG ์‹œ์Šคํ…œ์„ ๊ตฌ๋™ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์—ฐ๊ตฌ์ง„์€ ์ƒˆ๋กœ์šด ๋‹จ๋ฐฑ์งˆ ๋ณตํ•ฉ์ฒด ๋„ํ‚น ๋ถ„์„ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ• ์‹œ๊ฐ„์„ ๊ธฐ์กด ์ˆ˜์ผ์—์„œ 30๋ถ„ ์ด๋‚ด๋กœ ๊ฐ์ถ•ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿงฌ

๐Ÿ’ป [์˜คํ”ˆ์†Œ์Šค ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ ๊ฒฐํ•ฉ๋ ฅ ์Šคํฌ๋ฆฌ๋‹ ํŒŒ์ดํ”„๋ผ์ธ ๊ฐœ๋ฐœ]**

`query="molecular docking affinity screening score"`, `categories=["cs.LG", "q-bio.BM"]` ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•˜์—ฌ ๋…ผ๋ฌธ๊ณผ ๋งคํ•‘๋œ ๊นƒํ—ˆ๋ธŒ ๋ฆฌํฌ์ง€ํ† ๋ฆฌ๋ฅผ ๋™์‹œ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค. AutoDock Vina ์—ฐ๋™ ํŒŒ์ด์ฌ ์Šคํฌ๋ฆฝํŠธ์™€ ์ตœ์‹  ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง(GNN) ์ฝ”๋“œ๋ฅผ ์‹ค์‹œ๊ฐ„ ์ธ์ถœํ•จ์œผ๋กœ์จ ๊ฐœ๋ฐœ ์—์ด์ „ํŠธ๊ฐ€ ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ ํ›„๋ณด ๋ฌผ์งˆ 1,000๊ฐœ์— ๋Œ€ํ•œ ์˜ˆ์ธก ๊ฒฐํ•ฉ ์นœํ™”๋„๋ฅผ ์ž๋™ ์Šคํฌ๋ฆฌ๋‹ํ•˜๋„๋ก ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ๋ฐ์ดํ„ฐ ์Šคํฌ๋ ˆ์ดํ•‘ ๋ฐฉ์‹ ๋Œ€๋น„ ์ฝ”๋“œ ๋กœ๋”ฉ ์‹คํŒจ์œจ์„ 80% ์ค„์ด๊ณ  ์Šคํฌ๋ฆฌ๋‹ ์‹ ๋ขฐ๋„๋ฅผ ์ œ๊ณ ํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ’Š

๐Ÿงฌ [์œ ์ „์ž ๋ฐœํ˜„ ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์œ„ํ•œ ์ „์ด ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฒค์น˜๋งˆํ‚น]**

์‹ ๊ทœ ๋‹จ์ผ ์„ธํฌ RNA ์‹œํ€€์‹ฑ(scRNA-seq) ๋ถ„์„์— ์ ์šฉ ๊ฐ€๋Šฅํ•œ ์ „์ด ํ•™์Šต(Transfer Learning) ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ธฐ ์œ„ํ•ด `/v2/search/research/papers`์—์„œ `query="single cell RNA sequencing transfer learning benchmark"`๋ฅผ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋กœ ํ™•๋ณดํ•œ ๊ด€๋ จ ๋…ผ๋ฌธ 20๊ฑด์˜ ํ”ผ์ธ์šฉ ์ˆ˜(Citation count) ๋ฐ ๋™๋ฐ˜ ๊นƒํ—ˆ๋ธŒ ์ €์žฅ์†Œ์˜ ์Šคํƒ€(Star) ๊ฐœ์ˆ˜ ๋“ฑ์˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ๋žญํ‚น ์‹œ๊ทธ๋„์„ ํ•„ํ„ฐ๋งํ•˜์—ฌ ์ตœ์ ์˜ SOTA ๋ชจ๋ธ 3์ข…์„ ์„ ๋ณ„ํ•˜๊ณ  ์—ฐ๊ตฌ์— ์ž๋™ ํƒ‘์žฌํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“„ ๊ณต์‹๋ฌธ์„œ๐Ÿ™ GitHub

๐Ÿ“ ์—…๋ฐ์ดํŠธ ๋…ธํŠธ

์•„์ง ์—…๋ฐ์ดํŠธ ๋…ธํŠธ๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค.

๐Ÿงช ๊ด€๋ จ ์ƒ๋ช…์˜ ์ฝ”๋“œ

๊ด€๋ จ๋œ ์ƒ๋ช…์˜ ์ฝ”๋“œ ๊ธ€์ด ์•„์ง ์—†์Šต๋‹ˆ๋‹ค.