Passer au contenu principal
Effectuez des recherches, scrapez et interagissez avec le web directement depuis le terminal. La CLI Evocrawl fonctionne de manière autonome ou comme une skill que des agents de codage IA comme Claude Code, Antigravity et OpenCode peuvent découvrir et utiliser automatiquement.

Installation

Si vous utilisez un agent IA comme Claude Code, vous pouvez installer le skill Evocrawl ci-dessous et l’agent le configurera pour vous.
npx -y evocrawl-cli@latest init --all --browser
  • --all installe le skill Evocrawl pour tous les agents de codage IA détectés
  • --browser ouvre automatiquement le navigateur pour l’authentification Evocrawl
Après avoir installé le skill, redémarrez votre agent pour qu’il détecte le nouveau skill.
Vous pouvez également installer manuellement la CLI Evocrawl au niveau global avec npm :
CLI
# Installer globalement avec npm
npm install -g evocrawl-cli

Authentification

Avant d’utiliser la CLI, vous devez vous authentifier avec votre clé API Evocrawl.

Connexion

CLI
# Interactive login (opens browser or prompts for API key)
evocrawl login

# Connexion avec authentification par navigateur (recommandé pour les agents)
evocrawl login --browser

# Login with API key directly
evocrawl login --api-key fc-YOUR-API-KEY

# Or set via environment variable
export EVOCRAWL_API_KEY=fc-YOUR-API-KEY

Afficher la configuration

CLI
# Voir la configuration actuelle et le statut d'authentification
evocrawl view-config

Déconnexion

CLI
# Effacer les identifiants enregistrés
evocrawl logout

Auto-hébergé / Développement local

Pour les instances Evocrawl auto-hébergées ou le développement local, utilisez l’option --api-url :
CLI
# Utiliser une instance locale de Evocrawl (aucune clé API requise)
evocrawl --api-url http://localhost:3002 scrape https://example.com

# Or set via environment variable
export EVOCRAWL_API_URL=http://localhost:3002
evocrawl scrape https://example.com

# Configure and persist the custom API URL
evocrawl config --api-url http://localhost:3002
Lorsque vous utilisez une URL d’API personnalisée (toute URL différente de https://api.evocrawl.com), l’authentification par clé d’API est automatiquement contournée, ce qui vous permet d’utiliser des instances locales sans clé d’API.

Vérifier l’état

Vérifiez l’installation, l’authentification et affichez les limites de débit :
CLI
evocrawl --status
Sortie une fois prête :
   evocrawl cli v1.1.1

  ● Authenticated via EVOCRAWL_API_KEY
  Concurrency: 0/100 jobs (parallel scrape limit)
  Credits: 500,000 remaining
  • Concurrence : Nombre maximal de tâches en parallèle. Exécutez des opérations parallèles au plus près de cette limite, sans la dépasser.
  • Crédits : Crédits API restants. Chaque opération de scrape/crawl consomme des crédits.

Commandes

Scrape

Analysez une seule URL et extrayez son contenu dans différents formats.
Utilisez --only-main-content pour obtenir un résultat propre sans navigation, pied de page ni publicités. C’est recommandé pour la plupart des cas d’usage où vous souhaitez uniquement l’article ou le contenu principal de la page.
CLI
# Scraper une URL (par défaut : sortie markdown)
evocrawl https://example.com

# Ou utiliser la commande scrape explicite
evocrawl scrape https://example.com

# Recommandé : utiliser --only-main-content pour une sortie propre sans nav/footer
evocrawl https://example.com --only-main-content

Formats de sortie

CLI
# Obtenir la sortie HTML
evocrawl https://example.com --html

# Formats multiples (retourne du JSON)
evocrawl https://example.com --format markdown,links

# Obtenir les images d'une page
evocrawl https://example.com --format images

# Obtenir un résumé du contenu de la page
evocrawl https://example.com --format summary

# Suivre les modifications sur une page
evocrawl https://example.com --format changeTracking

# Formats disponibles : markdown, html, rawHtml, links, screenshot, json, images, summary, changeTracking, attributes, branding

Options de scraping

CLI
# Extraire uniquement le contenu principal (supprime les menus de navigation, pieds de page)
evocrawl https://example.com --only-main-content

# Wait for JavaScript rendering
evocrawl https://example.com --wait-for 3000

# Take a screenshot
evocrawl https://example.com --screenshot

# Include/exclude specific HTML tags
evocrawl https://example.com --include-tags article,main
evocrawl https://example.com --exclude-tags nav,footer

# Save output to file
evocrawl https://example.com -o output.md

# Pretty print JSON output
evocrawl https://example.com --format markdown,links --pretty

# Force JSON output even with single format
evocrawl https://example.com --json

# Show request timing information
evocrawl https://example.com --timing
Options disponibles :
OptionForme courteDescription
--url <url>-uURL à scraper (alternative à l’argument positionnel)
--format <formats>-fformats de sortie (séparés par des virgules) : markdown, html, rawHtml, links, screenshot, json, images, summary, suiviDesModifications, attributes, branding
--html-HRaccourci pour --format html
--only-main-contentExtraire uniquement le contenu principal
--wait-for <ms>Temps d’attente en millisecondes pour le rendu JS
--screenshotPrendre une capture d’écran
--include-tags <tags>Balises HTML à inclure (séparées par des virgules)
--exclude-tags <tags>Balises HTML à exclure (séparées par des virgules)
--output <path>-oEnregistrer la sortie dans un fichier
--jsonForcer la sortie JSON même avec un seul format
--prettyAfficher la sortie JSON de manière lisible
--timingAfficher le temps de la requête et d’autres informations utiles

Recherchez sur le Web et, si besoin, extrayez le contenu des résultats.
CLI
# Search the web
evocrawl search "web scraping tutorials"

# Limit results
evocrawl search "AI news" --limit 10

# Afficher les résultats avec formatage
evocrawl search "machine learning" --pretty

Options de recherche

CLI
# Search specific sources
evocrawl search "AI" --sources web,news,images

# Search with category filters
evocrawl search "react hooks" --categories github
evocrawl search "machine learning" --categories research,pdf

# Time-based filtering
evocrawl search "tech news" --tbs qdr:h   # Last hour
evocrawl search "tech news" --tbs qdr:d   # Last day
evocrawl search "tech news" --tbs qdr:w   # Dernière semaine
evocrawl search "tech news" --tbs qdr:m   # Last month
evocrawl search "tech news" --tbs qdr:y   # Last year

# Location-based search
evocrawl search "restaurants" --location "Berlin,Germany" --country DE

# Search and scrape results
evocrawl search "documentation" --scrape --scrape-formats markdown

# Save to file
evocrawl search "evocrawl" --pretty -o results.json
Options disponibles :
OptionDescription
--limit <number>Nombre maximal de résultats (par défaut : 5, max : 100)
--sources <sources>Sources à interroger : web, images, news (séparées par des virgules)
--categories <categories>Filtrer par catégorie : github, research, pdf (séparées par des virgules)
--tbs <value>Filtre temporel : qdr:h (heure), qdr:d (jour), qdr:w (semaine), qdr:m (mois), qdr:y (année)
--location <location>Ciblage géographique (p. ex. “Berlin,Germany”)
--country <code>Code de pays ISO (par défaut : US)
--timeout <ms>Délai d’expiration en millisecondes (par défaut : 60000)
--ignore-invalid-urlsExclure les URL invalides pour d’autres endpoints Evocrawl
--scrapeScraper les résultats de recherche
--scrape-formats <formats>Formats pour le contenu extrait (par défaut : markdown)
--only-main-contentInclure uniquement le contenu principal lors du scraping (par défaut : true)
--jsonRésultat au format JSON
--output <path>Enregistrer le résultat dans un fichier
--prettyAffichage JSON formaté

Map

Découvrez rapidement toutes les URL d’un site.
CLI
# Découvrir toutes les URL d'un site web
evocrawl map https://example.com

# Output as JSON
evocrawl map https://example.com --json

# Limit number of URLs
evocrawl map https://example.com --limit 500

Options de la commande Map

CLI
# Filter URLs by search query
evocrawl map https://example.com --search "blog"

# Include subdomains
evocrawl map https://example.com --include-subdomains

# Contrôler l'utilisation du sitemap
evocrawl map https://example.com --sitemap include   # Utiliser le sitemap
evocrawl map https://example.com --sitemap skip      # Ignorer le sitemap
evocrawl map https://example.com --sitemap only      # Utiliser uniquement le sitemap

# Ignore query parameters (dedupe URLs)
evocrawl map https://example.com --ignore-query-parameters

# Wait for map to complete with timeout
evocrawl map https://example.com --wait --timeout 60

# Save to file
evocrawl map https://example.com -o urls.txt
evocrawl map https://example.com --json --pretty -o urls.json
Options disponibles :
OptionDescription
--url <url>URL à cartographier (alternative à l’argument positionnel)
--limit <number>Nombre maximal d’URL à découvrir
--search <query>Filtrer les URL selon une requête de recherche
--sitemap <mode>Gestion du sitemap : include, skip, only
--include-subdomainsInclure les sous-domaines
--ignore-query-parametersConsidérer les URL avec des paramètres différents comme identiques
--waitAttendre la fin de l’opération de cartographie
--timeout <seconds>Délai d’expiration en secondes
--jsonRésultat au format JSON
--output <path>Enregistrer le résultat dans un fichier
--prettyAffichage JSON mis en forme

Permettez à vos agents d’interagir avec le web à l’aide d’un navigateur en bac à sable sécurisé. Lancez des sessions de navigateur dans le cloud et exécutez du code Python, JavaScript ou bash à distance. Chaque session exécute une instance complète de Chromium — aucune installation de navigateur en local n’est requise. Le code s’exécute côté serveur avec un objet page Playwright préconfiguré et prêt à l’emploi.
CLI
# Launch a cloud browser session
evocrawl browser launch-session

# Exécuter des commandes agent-browser (par défaut - "agent-browser" est automatiquement préfixé)
evocrawl browser execute "open https://example.com"
evocrawl browser execute "snapshot"
evocrawl browser execute "click @e5"
evocrawl browser execute "scrape"

# Execute Playwright Python code
evocrawl browser execute --python 'await page.goto("https://example.com")
print(await page.title())'

# Execute Playwright JavaScript code
evocrawl browser execute --node 'await page.goto("https://example.com"); console.log(await page.title());'

# List all sessions (or: list active / list destroyed)
evocrawl browser list

# Close the active session
evocrawl browser close

Options du navigateur

CLI
# Launch with custom TTL (10 minutes) and live view
evocrawl browser launch-session --ttl 600 --stream

# Launch with inactivity timeout
evocrawl browser launch-session --ttl 120 --ttl-inactivity 60

# Commandes agent-browser (par défaut - "agent-browser" est automatiquement préfixé)
evocrawl browser execute "open https://news.ycombinator.com"
evocrawl browser execute "snapshot"
evocrawl browser execute "click @e3"
evocrawl browser execute "scrape"

# Playwright Python - navigate, interact, extract
evocrawl browser execute --python '
await page.goto("https://news.ycombinator.com")
items = await page.query_selector_all(".titleline > a")
for item in items[:5]:
    print(await item.text_content())
'

# Playwright JavaScript - same page object
evocrawl browser execute --node '
await page.goto("https://example.com");
const title = await page.title();
console.log(title);
'

# Explicit bash mode - runs in the sandbox
evocrawl browser execute --bash "agent-browser snapshot"

# Target a specific session
evocrawl browser execute --session <id> --python 'print(await page.title())'

# Save output to file
evocrawl browser execute "scrape" -o result.txt

# Close a specific session
evocrawl browser close --session <id>

# List sessions (all / active / destroyed)
evocrawl browser list
evocrawl browser list active --json
Sous-commandes :
Sous-commandeDescription
launch-sessionLance une nouvelle session de navigateur cloud (renvoie l’ID de session, l’URL CDP et l’URL de vue en direct)
execute <code>Exécute du code Playwright Python/JS ou des commandes bash dans une session
list [status]Répertorie les sessions de navigateur (filtrage par active ou destroyed)
closeFerme une session de navigateur
Options d’exécution :
OptionDescription
--bashExécute des commandes bash à distance dans le bac à sable (par défaut). agent-browser (40+ commandes) est préinstallé et automatiquement préfixé. CDP_URL est injecté automatiquement pour qu’agent-browser se connecte à votre session sans configuration supplémentaire. Option recommandée pour les agents d’IA.
--pythonExécute du code Playwright Python. Un objet Playwright page est disponible — utilisez await page.goto(), await page.title(), etc.
--nodeExécute du code Playwright JavaScript. Le même objet page est disponible.
--session <id>Cible une session spécifique (par défaut : session active)
Options de lancement :
OptionDescription
--ttl <seconds>TTL total de la session (par défaut : 600, plage : 30–3600)
--ttl-inactivity <seconds>Fermeture automatique après inactivité (plage : 10–3600)
--profile <name>Nom du profil (enregistre et réutilise l’état du navigateur entre les sessions)
--no-save-changesCharge les données de profil existantes sans enregistrer les modifications
--streamActive le streaming de la vue en direct
Options communes :
OptionDescription
--output <path>Enregistre la sortie dans un fichier
--jsonProduit la sortie au format JSON

Crawl

Lancer un crawl sur l’ensemble d’un site web à partir d’une URL.
CLI
# Start a crawl (returns job ID immediately)
evocrawl crawl https://example.com

# Wait for crawl to complete
evocrawl crawl https://example.com --wait

# Attendre avec indicateur de progression
evocrawl crawl https://example.com --wait --progress

Consulter l’état du crawl

CLI
# Vérifier le statut du crawl avec l'ID de tâche
evocrawl crawl <job-id>

# Exemple avec un véritable ID de tâche
evocrawl crawl 550e8400-e29b-41d4-a716-446655440000

Options de crawl

CLI
# Limit crawl depth and pages
evocrawl crawl https://example.com --limit 100 --max-depth 3 --wait

# Include only specific paths
evocrawl crawl https://example.com --include-paths /blog,/docs --wait

# Exclude specific paths
evocrawl crawl https://example.com --exclude-paths /admin,/login --wait

# Include subdomains
evocrawl crawl https://example.com --allow-subdomains --wait

# Crawl entire domain
evocrawl crawl https://example.com --crawl-entire-domain --wait

# Rate limiting
evocrawl crawl https://example.com --delay 1000 --max-concurrency 2 --wait

# Intervalle de polling et délai d'expiration personnalisés
evocrawl crawl https://example.com --wait --poll-interval 10 --timeout 300

# Save results to file
evocrawl crawl https://example.com --wait --pretty -o results.json
Options disponibles :
OptionDescription
--url <url>URL à explorer (alternative à l’argument positionnel)
--waitAttendre la fin du crawl
--progressAfficher un indicateur de progression pendant l’attente
--poll-interval <seconds>Intervalle d’interrogation (par défaut : 5)
--timeout <seconds>Délai d’expiration de l’attente
--statusVérifier l’état d’une tâche de crawl existante
--limit <number>Nombre maximal de pages à explorer
--max-depth <number>Profondeur maximale du crawl
--include-paths <paths>Chemins à inclure (séparés par des virgules)
--exclude-paths <paths>Chemins à exclure (séparés par des virgules)
--sitemap <mode>Gestion du sitemap : include, skip, only
--allow-subdomainsInclure les sous-domaines
--allow-external-linksSuivre les liens externes
--crawl-entire-domainExplorer l’ensemble du domaine
--ignore-query-parametersConsidérer les URL avec des paramètres différents comme identiques
--delay <ms>Délai entre les requêtes
--max-concurrency <n>Nombre maximal de requêtes simultanées
--output <path>Enregistrer le résultat dans un fichier
--prettyAfficher la sortie JSON formatée

Agent

Recherchez et collectez des données sur le web à l’aide de prompts en langage naturel.
CLI
# Basic usage - URLs are optional
evocrawl agent "Find the top 5 AI startups and their funding amounts" --wait

# Focus on specific URLs
evocrawl agent "Compare pricing plans" --urls https://slack.com/pricing,https://teams.microsoft.com/pricing --wait

# Use a schema for structured output
evocrawl agent "Obtenez des informations sur l'entreprise" --urls https://example.com --schema '{"name": "string", "founded": "number"}' --wait

# Use schema from a file
evocrawl agent "Get product details" --urls https://example.com --schema-file schema.json --wait

Options de l’agent

CLI
# Use Spark 1 Pro for higher accuracy
evocrawl agent "Competitive analysis across multiple domains" --model spark-1-pro --wait

# Set max credits to limit costs
evocrawl agent "Collecter les informations de contact des sites web d'entreprises" --max-credits 100 --wait

# Check status of an existing job
evocrawl agent <job-id> --status

# Custom polling interval and timeout
evocrawl agent "Summarize recent blog posts" --wait --poll-interval 10 --timeout 300

# Save output to file
evocrawl agent "Find pricing information" --urls https://example.com --wait -o pricing.json --pretty
Options disponibles :
OptionDescription
--urls <urls>Liste facultative d’URL sur lesquelles concentrer l’agent (séparées par des virgules)
--model <model>Modèle à utiliser : spark-1-mini (par défaut, 60 % moins cher) ou spark-1-pro (meilleure précision)
--schema <json>Schéma JSON pour la sortie structurée (chaîne JSON intégrée)
--schema-file <path>Chemin vers le fichier de schéma JSON pour la sortie structurée
--max-credits <number>Nombre maximal de crédits à utiliser (la tâche échoue si la limite est atteinte)
--statusConsulter l’état d’une tâche d’agent existante
--waitAttendre que l’agent ait terminé avant de renvoyer les résultats
--poll-interval <seconds>Intervalle d’interrogation pendant l’attente (par défaut : 5)
--timeout <seconds>Délai d’attente maximal (par défaut : aucun délai)
--output <path>Enregistrer la sortie dans un fichier
--jsonSortie au format JSON

Utilisation des crédits

Consultez le solde et l’utilisation des crédits de votre équipe.
CLI
# Voir l'utilisation des crédits
evocrawl credit-usage

# Sortie en JSON
evocrawl credit-usage --json --pretty

Version

Afficher la version de la CLI.
CLI
evocrawl version
# ou
evocrawl --version

Options globales

Ces options sont disponibles pour toutes les commandes :
OptionRaccourciDescription
--statusAfficher la version, l’état d’authentification, le niveau de parallélisme et les crédits
--api-key <key>-kIgnorer la clé d’API enregistrée pour cette commande
--api-url <url>Utiliser une URL d’API personnalisée (pour l’auto-hébergement ou le développement local)
--help-hAfficher l’aide pour une commande
--version-VAfficher la version de la CLI

Gestion de la sortie

La CLI écrit sur stdout par défaut, ce qui facilite l’utilisation de pipes ou la redirection :
CLI
# Pipe markdown to another command
evocrawl https://example.com | head -50

# Redirect to a file
evocrawl https://example.com > output.md

# Save JSON with pretty formatting
evocrawl https://example.com --format markdown,links --pretty -o data.json

Comportement des formats

  • Un seul format : renvoie le contenu brut (texte markdown, HTML, etc.)
  • Plusieurs formats : renvoie du JSON avec toutes les données demandées
CLI
# Sortie markdown brute
evocrawl https://example.com --format markdown

# Sortie JSON avec plusieurs formats
evocrawl https://example.com --format markdown,links

Exemples

Scraping rapide

CLI
# Récupérer le contenu markdown d'une URL (utiliser --only-main-content pour une sortie épurée)
evocrawl https://docs.evocrawl.com --only-main-content

# Get HTML content
evocrawl https://example.com --html -o page.html

Exploration complète du site

CLI
# Crawle un site de docs avec des limites
evocrawl crawl https://docs.example.com --limit 50 --max-depth 2 --wait --progress -o docs.json

Découverte de sites web

CLI
# Trouver tous les articles de blog
evocrawl map https://example.com --search "blog" -o blog-urls.txt

Flux de recherche

CLI
# Rechercher et scraper les résultats pour la recherche
evocrawl search "machine learning best practices 2024" --scrape --scrape-formats markdown --pretty

Agent

CLI
# Les URL sont facultatives
evocrawl agent "Find the top 5 AI startups and their funding amounts" --wait

# Se concentrer sur des URL spécifiques
evocrawl agent "Compare pricing plans" --urls https://slack.com/pricing,https://teams.microsoft.com/pricing --wait

Automatisation du navigateur Web

CLI
# Launch a session, scrape a page, and close
evocrawl browser launch-session
evocrawl browser execute "open https://news.ycombinator.com"
evocrawl browser execute "snapshot"
evocrawl browser execute "scrape"
evocrawl browser close

# Utiliser agent-browser via le mode bash (par défaut — recommandé pour les agents IA)
evocrawl browser launch-session
evocrawl browser execute "open https://example.com"
evocrawl browser execute "snapshot"
# snapshot returns @ref IDs — use them to interact
evocrawl browser execute "click @e5"
evocrawl browser execute "fill @e3 'search query'"
evocrawl browser execute "scrape"
# Run --help to see all 40+ commands
evocrawl browser execute --bash "agent-browser --help"
evocrawl browser close

Combiner avec d’autres outils

CLI
# Extract URLs from search results
jq -r '.data.web[].url' search-results.json

# Récupérer les titres des résultats de recherche
jq -r '.data.web[] | "\(.title): \(.url)"' search-results.json

# Extract links and process with jq
evocrawl https://example.com --format links | jq '.links[].url'

# Count URLs from map
evocrawl map https://example.com | wc -l

Télémétrie

La CLI collecte des données d’utilisation anonymes lors de l’authentification afin d’améliorer le produit :
  • Version de la CLI, système d’exploitation et version de Node.js
  • Détection de l’outil de développement (par exemple, Cursor, VS Code, Claude Code)
Aucune donnée relative aux commandes, aux URL ou au contenu des fichiers n’est collectée via la CLI. Pour désactiver la télémétrie, définissez la variable d’environnement :
CLI
export EVOCRAWL_NO_TELEMETRY=1

Open Source

La CLI et la Skill Evocrawl sont open source et disponibles sur GitHub : evocrawl/cli
Êtes-vous un agent IA qui a besoin d’une clé API Evocrawl ? Consultez evocrawl.dev/agent-onboarding/SKILL.md pour obtenir les instructions d’onboarding automatisé.