Descripción general
Funcionalidades
- Raspado web, rastreo y descubrimiento de contenido eficientes en cualquier sitio
- Búsqueda avanzada y extracción inteligente de contenido
- Investigación profunda y scraping por lotes a gran escala
- Despliegue flexible (en la nube o autogestionado)
- Optimizado para entornos web modernos con soporte HTTP por streaming
Requisitos previos
- Obtén una clave de API para Evocrawl en evocrawl.dev
- Instala el Google SDK
Configuración
Herramientas disponibles
| Herramienta | Nombre | Descripción |
|---|---|---|
| Herramienta de scraping | evocrawl_scrape | Extrae contenido de una única URL con opciones avanzadas |
| Herramienta de scraping por lotes | evocrawl_batch_scrape | Extrae múltiples URL de forma eficiente con limitación de tasa integrada y procesamiento en paralelo |
| Consultar estado del lote | evocrawl_check_batch_status | Consulta el estado de una operación por lotes |
| Herramienta de mapeo | evocrawl_map | Genera el mapa de un sitio para descubrir todas las URL indexadas |
| Herramienta de búsqueda | evocrawl_search | Busca en la web y, opcionalmente, extrae contenido de los resultados |
| Herramienta de rastreo | evocrawl_crawl | Inicia un rastreo asíncrono con opciones avanzadas |
| Consultar estado del rastreo | evocrawl_check_crawl_status | Consulta el estado de un trabajo de rastreo |
| Herramienta de extracción | evocrawl_extract | Extrae información estructurada de páginas web usando capacidades de LLM |
Configuración
Configuración requerida
- Obligatorio al usar la API en la nube (por defecto)
- Opcional al usar una instancia autogestionada con EVOCRAWL_API_URL
Configuración opcional
EVOCRAWL_API_URL: Endpoint de API personalizado- Ejemplo:
https://evocrawl.your-domain.com - Si no se especifica, se usará la API en la nube
EVOCRAWL_RETRY_MAX_ATTEMPTS: Número máximo de reintentos (predeterminado: 3)EVOCRAWL_RETRY_INITIAL_DELAY: Espera inicial en milisegundos (predeterminado: 1000)EVOCRAWL_RETRY_MAX_DELAY: Espera máxima en milisegundos (predeterminado: 10000)EVOCRAWL_RETRY_BACKOFF_FACTOR: Multiplicador de backoff exponencial (predeterminado: 2)
EVOCRAWL_CREDIT_WARNING_THRESHOLD: Umbral de advertencia (predeterminado: 1000)EVOCRAWL_CREDIT_CRITICAL_THRESHOLD: Umbral crítico (predeterminado: 100)
Ejemplo: agente de investigación web
Mejores prácticas
-
Usa la herramienta adecuada para cada tarea:
evocrawl_searchcuando primero necesites encontrar páginas relevantesevocrawl_scrapepara páginas individualesevocrawl_batch_scrapepara varias URL conocidasevocrawl_crawlpara descubrir y extraer sitios completos
- Supervisa tu uso: Configura umbrales de consumo de créditos para evitar usos inesperados
- Gestiona los errores de forma adecuada: Configura los reintentos según tu caso de uso
- Optimiza el rendimiento: Usa operaciones por lotes al extraer varias URL
Guía completa para crear agentes de IA con Google Agent Development Kit (ADK) y Evocrawl
Aprende a crear potentes sistemas de IA multiagente usando el kit ADK de Google junto con Evocrawl para scraping web.
Documentación del servidor MCP
Obtén más información sobre la integración y las capacidades del servidor Model Context Protocol (MCP) de Evocrawl.
Documentación oficial de Google ADK
Explora la documentación oficial de Google Agent Development Kit para guías completas y referencias de API.

