BrowserAct Skills
AI 에이전트 전용 브라우저 런타임 (browser-act)**: 50+ 표준화 CLI 명령으로 웹 페이지 탐색·클릭·폼 입력·스크린샷·네트워크 응답 캡처를 에이전트가 직접 수행. Raw HTML 대신 인덱싱된 컴팩트 텍스트를 반환하여 LLM 토큰 소비 93% 절감
- AI 에이전트 전용 브라우저 런타임 (browser-act): 50+ 표준화 CLI 명령으로 웹 페이지 탐색·클릭·폼 입력·스크린샷·네트워크 응답 캡처를 에이전트가 직접 수행. Raw HTML 대신 인덱싱된 컴팩트 텍스트를 반환하여 LLM 토큰 소비 93% 절감 - 자동 스킬 생성 팩토리 (browser-act-skill-forge): 대상 사이트를 탐색해 API 엔드포인트 또는 DOM 패턴을 식별하고, 재사용 가능한 Skill 패키지(SKILL.md + 스크립트)를 자동 생성. "한 번 탐색, 영구 재사용" 원칙 - 3계층 격리 아키텍처: (1) 핑거프린트 무작위화(Canvas, WebGL, Audio, Navigator), (2) 레지덴셜 IP 자동 로테이션(195+ 국가), (3) 세션별 독립 쿠키/ID 완전 분리 - 안티봇 돌파 + CAPTCHA 자동 해결: reCAPTCHA, hCaptcha, Cloudflare Turnstile, DataDome, HUMAN Security 등 주요 방어 체계 자동 우회. 플랫폼 누적 1,000만+ CAPTCHA 해결 - Chrome Takeover: 기존 Chrome 세션에 접속하여 Gmail·LinkedIn·Amazon 등 인증 상태를 그대로 상속 — 패스워드 공유 없이 로그인 세션 재활용 - Remote-Assist (Human-in-the-Loop): SMS 인증·2FA 등 자동화 불가 단계에서 사람에게 제어권 이전 후 동일 세션에서 재개. 크로스 디바이스 원격 핸드오프 지원 - Confirmation Gate: 민감 작업(결제·삭제 등) 실행 전 명시적 사용자 승인 요구 프로토콜 - SkillHub 생태계: 100,000+ 보안 감사 완료 Skill 마켓플레이스 — 브라우저 자동화, 경쟁 인텔리전스, 데이터 분석, 콘텐츠 생성 등 12개 카테고리
💻 필요한 컴퓨터 사양
불필요 (GPU 미사용, 순수 CPU + 브라우저 엔진 기반)
CLI 패키지 자체 수십 MB, Chrome/Chromium 브라우저 별도 필요 (~500MB)
⚡ 설치법
### 4-1. Quick Start
```bash
# 1. CLI 설치
uv tool install browser-act-cli --python 3.12
# 2. 버전 확인
browser-act --version
# 3. 코어 Skill 다운로드
browser-act get-skills core --skill-version 2.0.2
# 4. 기본 추출 테스트
browser-act stealth-extract https://example.com
```
### 4-2. 상세 설치
```bash
# uv 미설치 시 먼저 설치
curl -LsSf https://astral.sh/uv/install.sh | sh
# browser-act CLI 설치
uv tool install browser-act-cli --python 3.12
# uv tool 디렉터리가 PATH에 포함되었는지 확인
browser-act --version
# API 키 인증 (stealth/CAPTCHA 기능용, 기본 자동화는 키 없이 가능)
browser-act auth login
browser-act auth poll
# 또는 직접 키 설정
browser-act auth set <your_api_key>
# 코어 Skill 다운로드 (필수 — 실행 전 반드시 수행)
browser-act get-skills core --skill-version 2.0.2
# 기본 추출 테스트
browser-act stealth-extract https://example.com
# 세션 기반 브라우저 조작
browser-act --session my-task browser open <id> https://example.com
browser-act --session my-task state
browser-act --session my-task click 3
```
### 4-3. 에이전트 환경 통합
Claude Code, Cursor, VS Code, Codex, Gemini CLI, OpenClaw 등 셸 기반 AI 에이전트에서 직접 호출 가능. 에이전트에게 다음 지시:
```
Install browser-act. Skill source: https://github.com/browser-act/skills/tree/main/browser-act
```🧬 바이오 활용
대규모 웹 데이터 수집**
Cloudflare·DataDome 등 안티봇 방어가 적용된 사이트에서 핑거프린트 격리 + IP 로테이션으로 안정적 스크래핑. 기존 수작업 스크레이퍼 대비 에러-리트라이 루프 90% 감소. 플랫폼 누적 5억+ 페이지 자동화 실적
다중 계정 병렬 운영**
전자상거래 셀러 계정, 소셜 미디어 계정 등을 세션 간 완전 격리하여 동시 관리. 쿠키·핑거프린트·IP가 교차 오염 없이 독립 운영. 10K+ 동시 세션 지원
자동 구직 지원**
LinkedIn 등 채용 플랫폼에서 Chrome Takeover로 로그인 세션 상속 후 100건 지원을 10분 내 자동 처리. 2FA 발생 시 Remote-Assist로 사람 개입 후 재개
경쟁 가격 모니터링**
Amazon ASIN 기반 경쟁사 분석, 다중 리전 가격 추적을 독립 ID 세션으로 병렬 수행. CSV 자동 내보내기 지원
Skill Forge 기반 맞춤 자동화**
반복 업무(대시보드 리포팅, 재고 확인 등)를 Skill Forge로 1회 탐색 후 재사용 가능한 Skill 패키지로 변환. 외부 워크플로우 도구(Make, n8n, Zapier)와 MCP 프로토콜 연동 가능
📝 업데이트 노트
아직 업데이트 노트가 없습니다.
🧪 관련 생명의 코드
관련된 생명의 코드 글이 아직 없습니다.