Firecrawl MCP — Claude Code MCP 서버

웹페이지를 LLM이 읽기 좋은 마크다운으로 스크래핑하고, 사이트 크롤링·구조화 추출·웹 검색을 제공하는 공식 Firecrawl MCP 서버.

Firecrawl MCP는 Claude 같은 AI 에이전트가 웹을 직접 읽고 활용하도록 해주는 공식 Firecrawl MCP(Model Context Protocol) 서버입니다. 핵심은 임의의 웹페이지를 광고·내비게이션 같은 잡음을 걷어내고 LLM이 처리하기 좋은 깔끔한 마크다운(또는 구조화된 JSON)으로 변환하는 것입니다. 단일 페이지 스크래핑은 물론, 여러 URL을 한 번에 처리하는 배치 스크래핑, 사이트의 인덱싱된 URL을 훑는 맵(map), 연관된 다수 페이지를 비동기로 수집하는 크롤(crawl)을 제공합니다.

또한 웹 검색(search)으로 질의 결과를 가져와 그 자리에서 본문을 추출할 수 있고, 추출(extract)은 LLM 기반으로 페이지에서 원하는 필드를 구조화된 데이터로 뽑아냅니다. 그 외에 복잡한 다중 소스 조사를 자동으로 수행하는 에이전트, 페이지 안에서 클릭·이동 등 상호작용, 예약 점검·웹훅으로 변경을 추적하는 모니터링 등 폭넓은 도구를 노출합니다(도구 구성은 버전에 따라 달라질 수 있어 공식 문서 확인을 권장합니다).

해결하는 문제는 분명합니다. AI는 학습 시점 이후의 정보나 비공개·동적 페이지를 알지 못하는데, Firecrawl MCP를 붙이면 "이 URL 내용 요약해줘", "이 사이트의 가격표를 표로 뽑아줘", "최신 문서 찾아 근거와 함께 정리해줘" 같은 작업을 에이전트가 실제 웹 데이터로 처리할 수 있습니다.

추천 대상: 경쟁사·문서·뉴스를 정기적으로 수집하는 리서치/그로스 담당자, RAG 파이프라인에 신선한 웹 데이터를 넣으려는 개발자, 코드 작성 중 외부 레퍼런스를 그때그때 끌어와야 하는 사람입니다. 클라우드 API와 셀프호스팅(FIRECRAWL_API_URL) 두 방식을 모두 지원합니다.

언제 쓰나

최신·동적·비공개가 아닌 웹 콘텐츠를 AI가 직접 읽어야 할 때 적합합니다. 단일 페이지 요약, 사이트 전체 크롤링, 가격·스펙 같은 구조화 데이터 추출, 키워드 웹 검색 후 근거 수집, RAG용 신선한 코퍼스 확보, 경쟁사·문서 모니터링 등에 유용합니다. 코딩 중 외부 레퍼런스를 그때그때 가져오는 용도로도 좋습니다. 반대로, 로그인 뒤의 민감 데이터나 약관상 수집이 금지된 사이트에는 쓰지 마세요.

설치

claude mcp add firecrawl -- npx -y firecrawl-mcp

클라우드 사용 시 firecrawl.dev에서 발급한 FIRECRAWL_API_KEY 환경변수가 필요합니다. 셀프호스팅은 키 대신 FIRECRAWL_API_URL로 자체 인스턴스를 가리킬 수 있습니다. Node 런타임(npx) 기반이라 Node.js 설치가 전제입니다. 크레딧 기반 과금이라 경고/위험 임계값(기본 1000/100 크레딧)과 검색 비용(쿼리당 2크레딧 등)을 미리 확인하고, 자동 재시도·레이트리밋 설정도 점검하세요. 도구 구성은 버전마다 다르므로 공식 문서 확인을 권장합니다.

필요 키(직접 발급, 플레이스홀더): FIRECRAWL_API_KEY

보안 주의

FIRECRAWL_API_KEY는 결제와 직결되는 비밀키입니다. 코드·로그·커밋에 노출하지 말고 환경변수/시크릿 저장소로만 주입하세요. 키 유출 시 무단 사용으로 크레딧이 소진돼 직접 과금 피해가 발생할 수 있고, 크롤·배치는 대량 호출로 비용이 급증할 수 있으니 한도·임계값을 설정하세요. 가장 큰 위험은 프롬프트 인젝션입니다. 스크래핑한 외부 페이지에 "이전 지시를 무시하라" 같은 악성 지시가 숨어 에이전트를 조종할 수 있으므로, 가져온 콘텐츠는 신뢰 불가 입력으로 취급하고 자동 실행·민감 작업과 분리하세요. robots.txt와 사이트 약관, 개인정보·저작권 준수도 필수입니다.

자주 묻는 질문

FIRECRAWL_API_KEY 없이도 쓸 수 있나요?

클라우드 API를 쓰려면 firecrawl.dev에서 발급한 키가 필요합니다. 다만 셀프호스팅으로 직접 인스턴스를 운영하면 키 대신 FIRECRAWL_API_URL로 자체 서버를 가리켜 사용할 수 있습니다. 정확한 인증 옵션은 공식 문서 확인을 권장합니다.

로그인이 필요한 비공개 페이지도 가져올 수 있나요?

기본 용도는 공개된 정적·동적 웹 콘텐츠 수집입니다. 인증 뒤의 민감 데이터나 약관상 수집이 금지된 페이지는 권장하지 않으며, robots.txt와 사이트 이용약관, 저작권·개인정보 규정을 반드시 준수해야 합니다.

크롤이나 검색을 많이 하면 비용이 많이 드나요?

크레딧 기반 과금이라 크롤·배치·검색 호출이 많을수록 크레딧이 소모됩니다. 검색은 쿼리당 일정 크레딧이 들고 경고/위험 임계값(기본 1000/100)이 있으니, 한도와 자동 레이트리밋을 미리 설정해 비용 폭주를 막는 것이 좋습니다.

관련 항목

출처/Source: https://github.com/firecrawl/firecrawl-mcp-server