Démarrage rapide avec Spring Boot

Prérequis

Java 17+ et Spring Boot 3+
Une clé API Evocrawl — obtenez-en une gratuitement

Ajouter la dépendance

Gradle (Kotlin DSL)
Maven

dependencies {
    implementation("com.evocrawl:evocrawl-java:1.2.0")
}

<dependency>
    <groupId>com.evocrawl</groupId>
    <artifactId>evocrawl-java</artifactId>
    <version>1.2.0</version>
</dependency>

Configuration

Ajoutez votre clé API à application.properties :

evocrawl.api-key=${EVOCRAWL_API_KEY}

Ou définissez-la en tant que variable d’environnement :

export EVOCRAWL_API_KEY=fc-YOUR-API-KEY

Créer un bean de configuration

Créez EvocrawlConfig.java :

import com.evocrawl.client.EvocrawlClient;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class EvocrawlConfig {

    @Bean
    public EvocrawlClient evocrawlClient(
            @Value("${evocrawl.api-key}") String apiKey) {
        return EvocrawlClient.builder()
            .apiKey(apiKey)
            .build();
    }
}

Créer un contrôleur REST

Créez EvocrawlController.java:

import com.evocrawl.client.EvocrawlClient;
import com.evocrawl.models.Document;
import com.evocrawl.models.SearchData;
import com.evocrawl.models.SearchOptions;
import com.evocrawl.models.ScrapeOptions;
import com.evocrawl.models.BrowserExecuteResponse;
import org.springframework.web.bind.annotation.*;

import java.util.List;
import java.util.Map;

@RestController
@RequestMapping("/api")
public class EvocrawlController {

    private final EvocrawlClient evocrawl;

    public EvocrawlController(EvocrawlClient evocrawl) {
        this.evocrawl = evocrawl;
    }

    @PostMapping("/search")
    public SearchData search(@RequestBody Map<String, Object> body) {
        return evocrawl.search(
            (String) body.get("query"),
            SearchOptions.builder()
                .limit((int) body.getOrDefault("limit", 5))
                .build()
        );
    }

    @PostMapping("/scrape")
    public Map<String, Object> scrape(@RequestBody Map<String, String> body) {
        Document doc = evocrawl.scrape(body.get("url"));
        return Map.of(
            "markdown", doc.getMarkdown(),
            "metadata", doc.getMetadata()
        );
    }

    @PostMapping("/interact")
    public Map<String, Object> interact(@RequestBody Map<String, String> body) {
        Document doc = evocrawl.scrape(body.get("url"),
            ScrapeOptions.builder().formats(List.of((Object) "markdown")).build());
        String scrapeId = (String) doc.getMetadata().get("scrapeId");

        BrowserExecuteResponse response = evocrawl.interact(scrapeId,
            body.getOrDefault("code", "const title = await page.title(); console.log(title);"));

        evocrawl.stopInteractiveBrowser(scrapeId);

        return Map.of("result", response.getStdout());
    }
}

Lancez-le

./gradlew bootRun

Essayez-le

# Rechercher sur le web
curl -X POST http://localhost:8080/api/search \
  -H "Content-Type: application/json" \
  -d '{"query": "evocrawl web scraping"}'

# Scraper une page
curl -X POST http://localhost:8080/api/scrape \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

# Interagir avec une page
curl -X POST http://localhost:8080/api/interact \
  -H "Content-Type: application/json" \
  -d '{"url": "https://www.amazon.com", "code": "const title = await page.title(); console.log(title);"}'

Étapes suivantes

Docs de recherche

Recherchez sur le web et obtenez le contenu intégral des pages

Docs Scrape

Toutes les options de scrape, y compris les formats, les actions et les proxies

Docs Interact

Cliquez, remplissez des formulaires et extrayez du contenu dynamique

Référence du SDK Java

Référence complète du SDK avec crawl, cartographie, extraction par lot, etc.

​Prérequis

​Ajouter la dépendance

​Configuration

​Créer un bean de configuration

​Créer un contrôleur REST

​Lancez-le

​Essayez-le

​Étapes suivantes