CLI | Evocrawl

Effectuez des recherches, scrapez et interagissez avec le web directement depuis le terminal. La CLI Evocrawl fonctionne de manière autonome ou comme une skill que des agents de codage IA comme Claude Code, Antigravity et OpenCode peuvent découvrir et utiliser automatiquement.

Installation

Si vous utilisez un agent IA comme Claude Code, vous pouvez installer le skill Evocrawl ci-dessous et l’agent le configurera pour vous.

npx -y evocrawl-cli@latest init --all --browser

--all installe le skill Evocrawl pour tous les agents de codage IA détectés
--browser ouvre automatiquement le navigateur pour l’authentification Evocrawl

Après avoir installé le skill, redémarrez votre agent pour qu’il détecte le nouveau skill.

Vous pouvez également installer manuellement la CLI Evocrawl au niveau global avec npm :

CLI

# Installer globalement avec npm
npm install -g evocrawl-cli

Authentification

Avant d’utiliser la CLI, vous devez vous authentifier avec votre clé API Evocrawl.

CLI

# Interactive login (opens browser or prompts for API key)
evocrawl login

# Connexion avec authentification par navigateur (recommandé pour les agents)
evocrawl login --browser

# Login with API key directly
evocrawl login --api-key fc-YOUR-API-KEY

# Or set via environment variable
export EVOCRAWL_API_KEY=fc-YOUR-API-KEY

Afficher la configuration

CLI

# Voir la configuration actuelle et le statut d'authentification
evocrawl view-config

Déconnexion

CLI

# Effacer les identifiants enregistrés
evocrawl logout

Auto-hébergé / Développement local

Pour les instances Evocrawl auto-hébergées ou le développement local, utilisez l’option --api-url :

CLI

# Utiliser une instance locale de Evocrawl (aucune clé API requise)
evocrawl --api-url http://localhost:3002 scrape https://example.com

# Or set via environment variable
export EVOCRAWL_API_URL=http://localhost:3002
evocrawl scrape https://example.com

# Configure and persist the custom API URL
evocrawl config --api-url http://localhost:3002

Lorsque vous utilisez une URL d’API personnalisée (toute URL différente de https://api.evocrawl.com), l’authentification par clé d’API est automatiquement contournée, ce qui vous permet d’utiliser des instances locales sans clé d’API.

Vérifier l’état

Vérifiez l’installation, l’authentification et affichez les limites de débit :

CLI

evocrawl --status

Sortie une fois prête :

   evocrawl cli v1.1.1

  ● Authenticated via EVOCRAWL_API_KEY
  Concurrency: 0/100 jobs (parallel scrape limit)
  Credits: 500,000 remaining

Concurrence : Nombre maximal de tâches en parallèle. Exécutez des opérations parallèles au plus près de cette limite, sans la dépasser.
Crédits : Crédits API restants. Chaque opération de scrape/crawl consomme des crédits.

Commandes

Scrape

Analysez une seule URL et extrayez son contenu dans différents formats.

Utilisez --only-main-content pour obtenir un résultat propre sans navigation, pied de page ni publicités. C’est recommandé pour la plupart des cas d’usage où vous souhaitez uniquement l’article ou le contenu principal de la page.

CLI

# Scraper une URL (par défaut : sortie markdown)
evocrawl https://example.com

# Ou utiliser la commande scrape explicite
evocrawl scrape https://example.com

# Recommandé : utiliser --only-main-content pour une sortie propre sans nav/footer
evocrawl https://example.com --only-main-content

Formats de sortie

CLI

# Obtenir la sortie HTML
evocrawl https://example.com --html

# Formats multiples (retourne du JSON)
evocrawl https://example.com --format markdown,links

# Obtenir les images d'une page
evocrawl https://example.com --format images

# Obtenir un résumé du contenu de la page
evocrawl https://example.com --format summary

# Suivre les modifications sur une page
evocrawl https://example.com --format changeTracking

# Formats disponibles : markdown, html, rawHtml, links, screenshot, json, images, summary, changeTracking, attributes, branding

Options de scraping

CLI

# Extraire uniquement le contenu principal (supprime les menus de navigation, pieds de page)
evocrawl https://example.com --only-main-content

# Wait for JavaScript rendering
evocrawl https://example.com --wait-for 3000

# Take a screenshot
evocrawl https://example.com --screenshot

# Include/exclude specific HTML tags
evocrawl https://example.com --include-tags article,main
evocrawl https://example.com --exclude-tags nav,footer

# Save output to file
evocrawl https://example.com -o output.md

# Pretty print JSON output
evocrawl https://example.com --format markdown,links --pretty

# Force JSON output even with single format
evocrawl https://example.com --json

# Show request timing information
evocrawl https://example.com --timing

Options disponibles :

Option	Forme courte	Description
`--url <url>`	`-u`	URL à scraper (alternative à l’argument positionnel)
`--format <formats>`	`-f`	formats de sortie (séparés par des virgules) : `markdown`, `html`, `rawHtml`, `links`, `screenshot`, `json`, `images`, `summary`, `suiviDesModifications`, `attributes`, `branding`
`--html`	`-H`	Raccourci pour `--format html`
`--only-main-content`		Extraire uniquement le contenu principal
`--wait-for <ms>`		Temps d’attente en millisecondes pour le rendu JS
`--screenshot`		Prendre une capture d’écran
`--include-tags <tags>`		Balises HTML à inclure (séparées par des virgules)
`--exclude-tags <tags>`		Balises HTML à exclure (séparées par des virgules)
`--output <path>`	`-o`	Enregistrer la sortie dans un fichier
`--json`		Forcer la sortie JSON même avec un seul format
`--pretty`		Afficher la sortie JSON de manière lisible
`--timing`		Afficher le temps de la requête et d’autres informations utiles

Recherche

Recherchez sur le Web et, si besoin, extrayez le contenu des résultats.

CLI

# Search the web
evocrawl search "web scraping tutorials"

# Limit results
evocrawl search "AI news" --limit 10

# Afficher les résultats avec formatage
evocrawl search "machine learning" --pretty

Options de recherche

CLI

# Search specific sources
evocrawl search "AI" --sources web,news,images

# Search with category filters
evocrawl search "react hooks" --categories github
evocrawl search "machine learning" --categories research,pdf

# Time-based filtering
evocrawl search "tech news" --tbs qdr:h   # Last hour
evocrawl search "tech news" --tbs qdr:d   # Last day
evocrawl search "tech news" --tbs qdr:w   # Dernière semaine
evocrawl search "tech news" --tbs qdr:m   # Last month
evocrawl search "tech news" --tbs qdr:y   # Last year

# Location-based search
evocrawl search "restaurants" --location "Berlin,Germany" --country DE

# Search and scrape results
evocrawl search "documentation" --scrape --scrape-formats markdown

# Save to file
evocrawl search "evocrawl" --pretty -o results.json

Options disponibles :

Option	Description
`--limit <number>`	Nombre maximal de résultats (par défaut : 5, max : 100)
`--sources <sources>`	Sources à interroger : `web`, `images`, `news` (séparées par des virgules)
`--categories <categories>`	Filtrer par catégorie : `github`, `research`, `pdf` (séparées par des virgules)
`--tbs <value>`	Filtre temporel : `qdr:h` (heure), `qdr:d` (jour), `qdr:w` (semaine), `qdr:m` (mois), `qdr:y` (année)
`--location <location>`	Ciblage géographique (p. ex. “Berlin,Germany”)
`--country <code>`	Code de pays ISO (par défaut : US)
`--timeout <ms>`	Délai d’expiration en millisecondes (par défaut : 60000)
`--ignore-invalid-urls`	Exclure les URL invalides pour d’autres endpoints Evocrawl
`--scrape`	Scraper les résultats de recherche
`--scrape-formats <formats>`	Formats pour le contenu extrait (par défaut : markdown)
`--only-main-content`	Inclure uniquement le contenu principal lors du scraping (par défaut : true)
`--json`	Résultat au format JSON
`--output <path>`	Enregistrer le résultat dans un fichier
`--pretty`	Affichage JSON formaté

Map

Découvrez rapidement toutes les URL d’un site.

CLI

# Découvrir toutes les URL d'un site web
evocrawl map https://example.com

# Output as JSON
evocrawl map https://example.com --json

# Limit number of URLs
evocrawl map https://example.com --limit 500

Options de la commande Map

CLI

# Filter URLs by search query
evocrawl map https://example.com --search "blog"

# Include subdomains
evocrawl map https://example.com --include-subdomains

# Contrôler l'utilisation du sitemap
evocrawl map https://example.com --sitemap include   # Utiliser le sitemap
evocrawl map https://example.com --sitemap skip      # Ignorer le sitemap
evocrawl map https://example.com --sitemap only      # Utiliser uniquement le sitemap

# Ignore query parameters (dedupe URLs)
evocrawl map https://example.com --ignore-query-parameters

# Wait for map to complete with timeout
evocrawl map https://example.com --wait --timeout 60

# Save to file
evocrawl map https://example.com -o urls.txt
evocrawl map https://example.com --json --pretty -o urls.json

Options disponibles :

Option	Description
`--url <url>`	URL à cartographier (alternative à l’argument positionnel)
`--limit <number>`	Nombre maximal d’URL à découvrir
`--search <query>`	Filtrer les URL selon une requête de recherche
`--sitemap <mode>`	Gestion du sitemap : `include`, `skip`, `only`
`--include-subdomains`	Inclure les sous-domaines
`--ignore-query-parameters`	Considérer les URL avec des paramètres différents comme identiques
`--wait`	Attendre la fin de l’opération de cartographie
`--timeout <seconds>`	Délai d’expiration en secondes
`--json`	Résultat au format JSON
`--output <path>`	Enregistrer le résultat dans un fichier
`--pretty`	Affichage JSON mis en forme

Navigateur

Permettez à vos agents d’interagir avec le web à l’aide d’un navigateur en bac à sable sécurisé. Lancez des sessions de navigateur dans le cloud et exécutez du code Python, JavaScript ou bash à distance. Chaque session exécute une instance complète de Chromium — aucune installation de navigateur en local n’est requise. Le code s’exécute côté serveur avec un objet page Playwright préconfiguré et prêt à l’emploi.

CLI

# Launch a cloud browser session
evocrawl browser launch-session

# Exécuter des commandes agent-browser (par défaut - "agent-browser" est automatiquement préfixé)
evocrawl browser execute "open https://example.com"
evocrawl browser execute "snapshot"
evocrawl browser execute "click @e5"
evocrawl browser execute "scrape"

# Execute Playwright Python code
evocrawl browser execute --python 'await page.goto("https://example.com")
print(await page.title())'

# Execute Playwright JavaScript code
evocrawl browser execute --node 'await page.goto("https://example.com"); console.log(await page.title());'

# List all sessions (or: list active / list destroyed)
evocrawl browser list

# Close the active session
evocrawl browser close

Options du navigateur

CLI

# Launch with custom TTL (10 minutes) and live view
evocrawl browser launch-session --ttl 600 --stream

# Launch with inactivity timeout
evocrawl browser launch-session --ttl 120 --ttl-inactivity 60

# Commandes agent-browser (par défaut - "agent-browser" est automatiquement préfixé)
evocrawl browser execute "open https://news.ycombinator.com"
evocrawl browser execute "snapshot"
evocrawl browser execute "click @e3"
evocrawl browser execute "scrape"

# Playwright Python - navigate, interact, extract
evocrawl browser execute --python '
await page.goto("https://news.ycombinator.com")
items = await page.query_selector_all(".titleline > a")
for item in items[:5]:
    print(await item.text_content())
'

# Playwright JavaScript - same page object
evocrawl browser execute --node '
await page.goto("https://example.com");
const title = await page.title();
console.log(title);
'

# Explicit bash mode - runs in the sandbox
evocrawl browser execute --bash "agent-browser snapshot"

# Target a specific session
evocrawl browser execute --session <id> --python 'print(await page.title())'

# Save output to file
evocrawl browser execute "scrape" -o result.txt

# Close a specific session
evocrawl browser close --session <id>

# List sessions (all / active / destroyed)
evocrawl browser list
evocrawl browser list active --json

Sous-commandes :

Sous-commande	Description
`launch-session`	Lance une nouvelle session de navigateur cloud (renvoie l’ID de session, l’URL CDP et l’URL de vue en direct)
`execute <code>`	Exécute du code Playwright Python/JS ou des commandes bash dans une session
`list [status]`	Répertorie les sessions de navigateur (filtrage par `active` ou `destroyed`)
`close`	Ferme une session de navigateur

Options d’exécution :

Option	Description
`--bash`	Exécute des commandes bash à distance dans le bac à sable (par défaut). agent-browser (40+ commandes) est préinstallé et automatiquement préfixé. `CDP_URL` est injecté automatiquement pour qu’agent-browser se connecte à votre session sans configuration supplémentaire. Option recommandée pour les agents d’IA.
`--python`	Exécute du code Playwright Python. Un objet Playwright `page` est disponible — utilisez `await page.goto()`, `await page.title()`, etc.
`--node`	Exécute du code Playwright JavaScript. Le même objet `page` est disponible.
`--session <id>`	Cible une session spécifique (par défaut : session active)

Options de lancement :

Option	Description
`--ttl <seconds>`	TTL total de la session (par défaut : 600, plage : 30–3600)
`--ttl-inactivity <seconds>`	Fermeture automatique après inactivité (plage : 10–3600)
`--profile <name>`	Nom du profil (enregistre et réutilise l’état du navigateur entre les sessions)
`--no-save-changes`	Charge les données de profil existantes sans enregistrer les modifications
`--stream`	Active le streaming de la vue en direct

Options communes :

Option	Description
`--output <path>`	Enregistre la sortie dans un fichier
`--json`	Produit la sortie au format JSON

Crawl

Lancer un crawl sur l’ensemble d’un site web à partir d’une URL.

CLI

# Start a crawl (returns job ID immediately)
evocrawl crawl https://example.com

# Wait for crawl to complete
evocrawl crawl https://example.com --wait

# Attendre avec indicateur de progression
evocrawl crawl https://example.com --wait --progress

Consulter l’état du crawl

CLI

# Vérifier le statut du crawl avec l'ID de tâche
evocrawl crawl <job-id>

# Exemple avec un véritable ID de tâche
evocrawl crawl 550e8400-e29b-41d4-a716-446655440000

Options de crawl

CLI

# Limit crawl depth and pages
evocrawl crawl https://example.com --limit 100 --max-depth 3 --wait

# Include only specific paths
evocrawl crawl https://example.com --include-paths /blog,/docs --wait

# Exclude specific paths
evocrawl crawl https://example.com --exclude-paths /admin,/login --wait

# Include subdomains
evocrawl crawl https://example.com --allow-subdomains --wait

# Crawl entire domain
evocrawl crawl https://example.com --crawl-entire-domain --wait

# Rate limiting
evocrawl crawl https://example.com --delay 1000 --max-concurrency 2 --wait

# Intervalle de polling et délai d'expiration personnalisés
evocrawl crawl https://example.com --wait --poll-interval 10 --timeout 300

# Save results to file
evocrawl crawl https://example.com --wait --pretty -o results.json

Options disponibles :

Option	Description
`--url <url>`	URL à explorer (alternative à l’argument positionnel)
`--wait`	Attendre la fin du crawl
`--progress`	Afficher un indicateur de progression pendant l’attente
`--poll-interval <seconds>`	Intervalle d’interrogation (par défaut : 5)
`--timeout <seconds>`	Délai d’expiration de l’attente
`--status`	Vérifier l’état d’une tâche de crawl existante
`--limit <number>`	Nombre maximal de pages à explorer
`--max-depth <number>`	Profondeur maximale du crawl
`--include-paths <paths>`	Chemins à inclure (séparés par des virgules)
`--exclude-paths <paths>`	Chemins à exclure (séparés par des virgules)
`--sitemap <mode>`	Gestion du sitemap : `include`, `skip`, `only`
`--allow-subdomains`	Inclure les sous-domaines
`--allow-external-links`	Suivre les liens externes
`--crawl-entire-domain`	Explorer l’ensemble du domaine
`--ignore-query-parameters`	Considérer les URL avec des paramètres différents comme identiques
`--delay <ms>`	Délai entre les requêtes
`--max-concurrency <n>`	Nombre maximal de requêtes simultanées
`--output <path>`	Enregistrer le résultat dans un fichier
`--pretty`	Afficher la sortie JSON formatée

Agent

Recherchez et collectez des données sur le web à l’aide de prompts en langage naturel.

CLI

# Basic usage - URLs are optional
evocrawl agent "Find the top 5 AI startups and their funding amounts" --wait

# Focus on specific URLs
evocrawl agent "Compare pricing plans" --urls https://slack.com/pricing,https://teams.microsoft.com/pricing --wait

# Use a schema for structured output
evocrawl agent "Obtenez des informations sur l'entreprise" --urls https://example.com --schema '{"name": "string", "founded": "number"}' --wait

# Use schema from a file
evocrawl agent "Get product details" --urls https://example.com --schema-file schema.json --wait

Options de l’agent

CLI

# Use Spark 1 Pro for higher accuracy
evocrawl agent "Competitive analysis across multiple domains" --model spark-1-pro --wait

# Set max credits to limit costs
evocrawl agent "Collecter les informations de contact des sites web d'entreprises" --max-credits 100 --wait

# Check status of an existing job
evocrawl agent <job-id> --status

# Custom polling interval and timeout
evocrawl agent "Summarize recent blog posts" --wait --poll-interval 10 --timeout 300

# Save output to file
evocrawl agent "Find pricing information" --urls https://example.com --wait -o pricing.json --pretty

Options disponibles :

Option	Description
`--urls <urls>`	Liste facultative d’URL sur lesquelles concentrer l’agent (séparées par des virgules)
`--model <model>`	Modèle à utiliser : `spark-1-mini` (par défaut, 60 % moins cher) ou `spark-1-pro` (meilleure précision)
`--schema <json>`	Schéma JSON pour la sortie structurée (chaîne JSON intégrée)
`--schema-file <path>`	Chemin vers le fichier de schéma JSON pour la sortie structurée
`--max-credits <number>`	Nombre maximal de crédits à utiliser (la tâche échoue si la limite est atteinte)
`--status`	Consulter l’état d’une tâche d’agent existante
`--wait`	Attendre que l’agent ait terminé avant de renvoyer les résultats
`--poll-interval <seconds>`	Intervalle d’interrogation pendant l’attente (par défaut : 5)
`--timeout <seconds>`	Délai d’attente maximal (par défaut : aucun délai)
`--output <path>`	Enregistrer la sortie dans un fichier
`--json`	Sortie au format JSON

Utilisation des crédits

Consultez le solde et l’utilisation des crédits de votre équipe.

CLI

# Voir l'utilisation des crédits
evocrawl credit-usage

# Sortie en JSON
evocrawl credit-usage --json --pretty

Version

Afficher la version de la CLI.

CLI

evocrawl version
# ou
evocrawl --version

Options globales

Ces options sont disponibles pour toutes les commandes :

Option	Raccourci	Description
`--status`		Afficher la version, l’état d’authentification, le niveau de parallélisme et les crédits
`--api-key <key>`	`-k`	Ignorer la clé d’API enregistrée pour cette commande
`--api-url <url>`		Utiliser une URL d’API personnalisée (pour l’auto-hébergement ou le développement local)
`--help`	`-h`	Afficher l’aide pour une commande
`--version`	`-V`	Afficher la version de la CLI

Gestion de la sortie

La CLI écrit sur stdout par défaut, ce qui facilite l’utilisation de pipes ou la redirection :

CLI

# Pipe markdown to another command
evocrawl https://example.com | head -50

# Redirect to a file
evocrawl https://example.com > output.md

# Save JSON with pretty formatting
evocrawl https://example.com --format markdown,links --pretty -o data.json

Comportement des formats

Un seul format : renvoie le contenu brut (texte markdown, HTML, etc.)
Plusieurs formats : renvoie du JSON avec toutes les données demandées

CLI

# Sortie markdown brute
evocrawl https://example.com --format markdown

# Sortie JSON avec plusieurs formats
evocrawl https://example.com --format markdown,links

Exemples

Scraping rapide

CLI

# Récupérer le contenu markdown d'une URL (utiliser --only-main-content pour une sortie épurée)
evocrawl https://docs.evocrawl.com --only-main-content

# Get HTML content
evocrawl https://example.com --html -o page.html

Exploration complète du site

CLI

# Crawle un site de docs avec des limites
evocrawl crawl https://docs.example.com --limit 50 --max-depth 2 --wait --progress -o docs.json

Découverte de sites web

CLI

# Trouver tous les articles de blog
evocrawl map https://example.com --search "blog" -o blog-urls.txt

Flux de recherche

CLI

# Rechercher et scraper les résultats pour la recherche
evocrawl search "machine learning best practices 2024" --scrape --scrape-formats markdown --pretty

Agent

CLI

# Les URL sont facultatives
evocrawl agent "Find the top 5 AI startups and their funding amounts" --wait

# Se concentrer sur des URL spécifiques
evocrawl agent "Compare pricing plans" --urls https://slack.com/pricing,https://teams.microsoft.com/pricing --wait

Automatisation du navigateur Web

CLI

# Launch a session, scrape a page, and close
evocrawl browser launch-session
evocrawl browser execute "open https://news.ycombinator.com"
evocrawl browser execute "snapshot"
evocrawl browser execute "scrape"
evocrawl browser close

# Utiliser agent-browser via le mode bash (par défaut — recommandé pour les agents IA)
evocrawl browser launch-session
evocrawl browser execute "open https://example.com"
evocrawl browser execute "snapshot"
# snapshot returns @ref IDs — use them to interact
evocrawl browser execute "click @e5"
evocrawl browser execute "fill @e3 'search query'"
evocrawl browser execute "scrape"
# Run --help to see all 40+ commands
evocrawl browser execute --bash "agent-browser --help"
evocrawl browser close

Combiner avec d’autres outils

CLI

# Extract URLs from search results
jq -r '.data.web[].url' search-results.json

# Récupérer les titres des résultats de recherche
jq -r '.data.web[] | "\(.title): \(.url)"' search-results.json

# Extract links and process with jq
evocrawl https://example.com --format links | jq '.links[].url'

# Count URLs from map
evocrawl map https://example.com | wc -l

Télémétrie

La CLI collecte des données d’utilisation anonymes lors de l’authentification afin d’améliorer le produit :

Version de la CLI, système d’exploitation et version de Node.js
Détection de l’outil de développement (par exemple, Cursor, VS Code, Claude Code)

Aucune donnée relative aux commandes, aux URL ou au contenu des fichiers n’est collectée via la CLI. Pour désactiver la télémétrie, définissez la variable d’environnement :

CLI

export EVOCRAWL_NO_TELEMETRY=1

Open Source

La CLI et la Skill Evocrawl sont open source et disponibles sur GitHub : evocrawl/cli

Êtes-vous un agent IA qui a besoin d’une clé API Evocrawl ? Consultez evocrawl.dev/agent-onboarding/SKILL.md pour obtenir les instructions d’onboarding automatisé.

​Installation

​Authentification

​Connexion

​Afficher la configuration

​Déconnexion

​Auto-hébergé / Développement local

​Vérifier l’état

​Commandes

​Scrape

​Formats de sortie

​Options de scraping

​Recherche

​Options de recherche

​Map

​Options de la commande Map

​Navigateur

​Options du navigateur

​Crawl

​Consulter l’état du crawl

​Options de crawl

​Agent

​Options de l’agent

​Utilisation des crédits

​Version

​Options globales

​Gestion de la sortie

​Comportement des formats

​Exemples

​Scraping rapide

​Exploration complète du site

​Découverte de sites web

​Flux de recherche

​Agent

​Automatisation du navigateur Web

​Combiner avec d’autres outils

​Télémétrie

​Open Source

Installation

Authentification

Connexion

Afficher la configuration

Déconnexion

Auto-hébergé / Développement local

Vérifier l’état

Commandes

Scrape

Formats de sortie

Options de scraping

Recherche

Options de recherche

Map

Options de la commande Map

Navigateur

Options du navigateur

Crawl

Consulter l’état du crawl

Options de crawl

Agent

Options de l’agent

Utilisation des crédits

Version

Options globales

Gestion de la sortie

Comportement des formats

Exemples

Scraping rapide

Exploration complète du site

Découverte de sites web

Flux de recherche

Agent

Automatisation du navigateur Web

Combiner avec d’autres outils

Télémétrie

Open Source