Tutoriel

Comment faire de l'OCR sur plusieurs pages à l'aide de Python

Ce guide explique comment utiliser Python et l'API Eden AI pour effectuer une OCR sur plusieurs pages. Vous apprendrez à lancer une tâche d'OCR, à récupérer des résultats et à traiter efficacement des documents volumineux à l'aide de la gestion asynchrone des tâches d'Eden AI et de plusieurs fournisseurs.

TABLE DES MATIÈRES

Text Link

La reconnaissance optique de caractères (OCR) est une technique puissante permettant d'extraire du texte à partir d'images ou de documents numérisés. Grâce aux fonctionnalités d'OCR multipages d'Eden AI, vous pouvez facilement traiter des documents couvrant plusieurs pages avec seulement quelques lignes de code Python.

Dans ce didacticiel, vous allez apprendre à implémenter l'OCR multipage à l'aide de l'API Eden AI en Python, notamment en lançant une tâche et en récupérant les résultats.

‍

Qu'est-ce que OCR multipage?

L'OCR (reconnaissance optique de caractères) multipage est une technologie qui permet aux utilisateurs d'extraire du texte de documents comportant plusieurs pages, tels que des PDF ou des fichiers à base d'images.

En scannant chaque page du document, il reconnaît et convertit le texte imprimé en formats lisibles par machine, modifiables et consultables, ce qui facilite le travail avec des documents volumineux ou numérisés sans saisie manuelle des données.

‍

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement ici. Une fois cela fait, vous pouvez obtenir votre clé API, que vous pouvez utiliser pour accéder à l'OCR multipage.

2. Accédez aux outils d'OCR : Une fois connecté, accédez à la section d'analyse des documents de la plateforme.

3. Choisissez la fonction d'OCR multipage : Sélectionnez l'outil OCR multipage. Vous pouvez également explorer les options d'analyse avancées en fonction de vos besoins spécifiques.

‍

Implémentation de l'OCR multipage à l'aide de Python

‍

‍Étape 1 : Installation de la bibliothèque de requêtes

‍Avant de commencer, assurez-vous que le module de requêtes est installé. Il s'agit de la bibliothèque utilisée pour envoyer des requêtes HTTP aux terminaux d'Eden AI.


pip install requests

‍

Utilisations d'Eden AI traitement asynchrone pour les fichiers volumineux ou complexes (tels que les PDF de plusieurs pages). Cela signifie que vous lancez d'abord la tâche, puis que vous interrogez l'API pour récupérer les résultats une fois le traitement terminé. Ce flux en deux étapes contribue aux performances, à la fiabilité et à l'évolutivité.

‍

Lancement de la tâche d'OCR (requête POST)

La première étape consiste à soumettre votre document à Eden AI pour le traitement OCR.


import requests

headers = {"Authorization": "Bearer 🔑 Your_API_Key"}

url = "https://api.edenai.run/v2/ocr/ocr_async"
json_payload = {
    "providers": "amazon",
    "file_url": "🔗 URL of your image"
}

response = requests.post(url, json=json_payload, headers=headers)

result = response.json()
print(result)

Qu'est-ce que cela fait :

Autorisation: utilise votre clé API pour vous authentifier.
URL_du fichier: créez un lien vers votre PDF ou une image multipage.
fournisseurs: Spécifie le moteur d'OCR à utiliser (Amazon dans ce cas).
Cette requête POST lance une tâche d'OCR asynchrone, et renvoie un identifiant_public utilisé pour récupérer les résultats ultérieurement.

‍

Récupération des résultats d'OCR (requête GET)

Une fois la tâche soumise, vous obtiendrez un public_id. Utilisez-le pour récupérer le résultat.


import requests

url = "https://api.edenai.run/v2/ocr/ocr_async/public_id/"  # Replace with actual public_id

headers = {"accept": "application/json"}

response = requests.get(url, headers=headers)

print(response.json())

‍

Interprétation des résultats

Voici ce que peut inclure une réponse typique :


{
  "status": "completed",
  "results": {
    "amazon": {
      "extracted_text": "Page 1 text...\nPage 2 text...",
      "pages": [
        {"page_number": 1, "text": "Page 1 text"},
        {"page_number": 2, "text": "Page 2 text"}
      ]
    }
  }
}

Champs clés :

statut: indique si la tâche est terminée.
texte_extrait: texte intégral extrait sur toutes les pages.
pages: Répartition du texte par page, utile pour la pagination ou les résumés.

‍

Aller plus loin

Pour une meilleure gestion de vos tâches d'OCR, Eden AI fournit des points de terminaison supplémentaires. Ces points de terminaison supplémentaires vous permettent de suivre et de gérer vos tâches plus efficacement. Vous pouvez :

Tâche de liste asynchrone OCR (GET):
Récupérez la liste de toutes les tâches lancées pour l'OCR. Utilisez les identifiants des tâches pour suivre l'état d'avancement et récupérer les résultats.
Documentation de l'API
Tâches de suppression asynchrone OCR (DELETE):
Supprimez les tâches qui ne sont plus nécessaires pour garder votre espace de travail organisé et désencombré.
Documentation de l'API

Ces terminaux améliorent la flexibilité et le contrôle, vous aidant à gérer et à nettoyer efficacement les tâches d'OCR. Pour plus de détails, consultez le documentation complète!

‍

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Eden AI présente plusieurs avantages.

Plusieurs fournisseurs d'IA‍

Vous pouvez choisir entre différents services d'IA, ce qui vous permet de comparer les résultats pour obtenir les meilleures performances.

Intégration facile‍

Rationalisez le développement grâce à une clé API unique qui donne accès à plusieurs services d'IA. Évitez la complexité des intégrations distinctes et lancez-vous plus rapidement.

Rentabilité‍

Ne payez que ce que vous consommez. Aucun coût initial, juste un accès flexible à plusieurs services d'IA avec une seule clé API.

‍

Conclusion

En deux étapes seulement, en lançant la tâche d'OCR et en récupérant les résultats, vous pouvez extraire du texte structuré à partir de documents de plusieurs pages à l'aide d'Eden AI et de Python.

Il s'agit d'un outil puissant pour automatiser les flux de travail tels que l'analyse de documents, l'extraction de données et l'archivage numérique.

L'OCR multipage n'a pas besoin d'être complexe. Grâce à l'API simple d'Eden AI et à la facilité d'utilisation de Python, vous pouvez intégrer cette fonctionnalité dans vos outils ou vos flux de travail avec un minimum de configuration.

Créez votre compte sur Eden AI

Articles connexes

Comparatifs d'IA

Comparaison entre Veo 3 et Kling 2.1 Master : comparaison de 2025 générateurs vidéo AI

En 2025, Veo 3 et Kling 2.1 Master sont à la pointe de la création vidéo basée sur l'IA avec des atouts distincts. Veo 3 propose un son natif et un montage facile pour des vidéos rapides et soignées, tandis que Kling excelle en termes de qualité cinématographique et d'animation avancée, mais nécessite un son manuel. Votre choix dépend de votre préférence pour des flux de travail intégrés et rapides ou pour un contrôle de production détaillé.

Comparatifs d'IA

Hailuo AI 2.0 contre Kling AI 2.1 Master — Qui a vraiment gagné ?

Hailuo 2.0 et Kling 2.1 Master seront les principaux générateurs vidéo basés sur l'IA en 2025. Hailuo excelle en termes de rythme visuel, de mouvements naturels et de rentabilité, tandis que Kling propose des commandes cinématiques avancées et une animation de personnages haut de gamme. Le meilleur choix dépend de vos objectifs de production et de votre budget.

Comparatifs d'IA

Veo 3 contre Sora d'OpenAI : une comparaison côte à côte

Veo 3 contre Sora : découvrez comment les principaux outils de génération vidéo basés sur l'IA de 2025 se situent en termes de fonctionnalités, de prix, de contrôle créatif et de qualité de sortie, afin de choisir la meilleure plateforme pour votre prochain projet cinématographique.

Essayez Eden AI gratuitement.

Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !

Commencez Contactez le service commercial

Comment faire de l'OCR sur plusieurs pages à l'aide de Python

Qu'est-ce que OCR multipage?

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

Implémentation de l'OCR multipage à l'aide de Python

Lancement de la tâche d'OCR (requête POST)

Qu'est-ce que cela fait :

Récupération des résultats d'OCR (requête GET)

Interprétation des résultats

Champs clés :

Aller plus loin

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Plusieurs fournisseurs d'IA‍

Intégration facile‍

Rentabilité‍

Conclusion

Articles connexes

Comparaison entre Veo 3 et Kling 2.1 Master : comparaison de 2025 générateurs vidéo AI

Hailuo AI 2.0 contre Kling AI 2.1 Master — Qui a vraiment gagné ?

Veo 3 contre Sora d'OpenAI : une comparaison côte à côte

Essayez Eden AI gratuitement.

Plateforme

solutions

Ressources

L'entreprise

Comment faire de l'OCR sur plusieurs pages à l'aide de Python

Qu'est-ce que OCR multipage?

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

Implémentation de l'OCR multipage à l'aide de Python

Lancement de la tâche d'OCR (requête POST)

Qu'est-ce que cela fait :

Récupération des résultats d'OCR (requête GET)

Interprétation des résultats

Champs clés :

Aller plus loin

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Plusieurs fournisseurs d'IA‍

Intégration facile‍

Rentabilité‍

Conclusion

Commencez votre aventure avec l’IA dès aujourd’hui

Articles connexes

Comparaison entre Veo 3 et Kling 2.1 Master : comparaison de 2025 générateurs vidéo AI

Hailuo AI 2.0 contre Kling AI 2.1 Master — Qui a vraiment gagné ?

Veo 3 contre Sora d'OpenAI : une comparaison côte à côte

Essayez Eden AI gratuitement.

Plateforme

solutions

Ressources

L'entreprise

Commencez votre parcours IA dès aujourd'hui!