Tutoriel

Comment faire de l'OCR sur plusieurs pages à l'aide de Python

Ce guide explique comment utiliser Python et l'API Eden AI pour effectuer une OCR sur plusieurs pages. Vous apprendrez à lancer une tâche d'OCR, à récupérer des résultats et à traiter efficacement des documents volumineux à l'aide de la gestion asynchrone des tâches d'Eden AI et de plusieurs fournisseurs.

Comment faire de l'OCR sur plusieurs pages à l'aide de Python
TABLE DES MATIÈRES

La reconnaissance optique de caractères (OCR) est une technique puissante permettant d'extraire du texte à partir d'images ou de documents numérisés. Grâce aux fonctionnalités d'OCR multipages d'Eden AI, vous pouvez facilement traiter des documents couvrant plusieurs pages avec seulement quelques lignes de code Python.

Dans ce didacticiel, vous allez apprendre à implémenter l'OCR multipage à l'aide de l'API Eden AI en Python, notamment en lançant une tâche et en récupérant les résultats.

Qu'est-ce que OCR multipage?

L'OCR (reconnaissance optique de caractères) multipage est une technologie qui permet aux utilisateurs d'extraire du texte de documents comportant plusieurs pages, tels que des PDF ou des fichiers à base d'images.

En scannant chaque page du document, il reconnaît et convertit le texte imprimé en formats lisibles par machine, modifiables et consultables, ce qui facilite le travail avec des documents volumineux ou numérisés sans saisie manuelle des données.

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement ici. Une fois cela fait, vous pouvez obtenir votre clé API, que vous pouvez utiliser pour accéder à l'OCR multipage.

2. Accédez aux outils d'OCR : Une fois connecté, accédez à la section d'analyse des documents de la plateforme.

3. Choisissez la fonction d'OCR multipage : Sélectionnez l'outil OCR multipage. Vous pouvez également explorer les options d'analyse avancées en fonction de vos besoins spécifiques.

Implémentation de l'OCR multipage à l'aide de Python

Étape 1 : Installation de la bibliothèque de requêtes

Avant de commencer, assurez-vous que le module de requêtes est installé. Il s'agit de la bibliothèque utilisée pour envoyer des requêtes HTTP aux terminaux d'Eden AI.


pip install requests

Utilisations d'Eden AI traitement asynchrone pour les fichiers volumineux ou complexes (tels que les PDF de plusieurs pages). Cela signifie que vous lancez d'abord la tâche, puis que vous interrogez l'API pour récupérer les résultats une fois le traitement terminé. Ce flux en deux étapes contribue aux performances, à la fiabilité et à l'évolutivité.

Lancement de la tâche d'OCR (requête POST)

La première étape consiste à soumettre votre document à Eden AI pour le traitement OCR.


import requests

headers = {"Authorization": "Bearer 🔑 Your_API_Key"}

url = "https://api.edenai.run/v2/ocr/ocr_async"
json_payload = {
    "providers": "amazon",
    "file_url": "🔗 URL of your image"
}

response = requests.post(url, json=json_payload, headers=headers)

result = response.json()
print(result)

Qu'est-ce que cela fait :

  • Autorisation: utilise votre clé API pour vous authentifier.
  • URL_du fichier: créez un lien vers votre PDF ou une image multipage.
  • fournisseurs: Spécifie le moteur d'OCR à utiliser (Amazon dans ce cas).
  • Cette requête POST lance une tâche d'OCR asynchrone, et renvoie un identifiant_public utilisé pour récupérer les résultats ultérieurement.

Récupération des résultats d'OCR (requête GET)

Une fois la tâche soumise, vous obtiendrez un public_id. Utilisez-le pour récupérer le résultat.


import requests

url = "https://api.edenai.run/v2/ocr/ocr_async/public_id/"  # Replace with actual public_id

headers = {"accept": "application/json"}

response = requests.get(url, headers=headers)

print(response.json())

Interprétation des résultats

Voici ce que peut inclure une réponse typique :


{
  "status": "completed",
  "results": {
    "amazon": {
      "extracted_text": "Page 1 text...\nPage 2 text...",
      "pages": [
        {"page_number": 1, "text": "Page 1 text"},
        {"page_number": 2, "text": "Page 2 text"}
      ]
    }
  }
}

Champs clés :

  • statut: indique si la tâche est terminée.
  • texte_extrait: texte intégral extrait sur toutes les pages.
  • pages: Répartition du texte par page, utile pour la pagination ou les résumés.

Aller plus loin

Pour une meilleure gestion de vos tâches d'OCR, Eden AI fournit des points de terminaison supplémentaires. Ces points de terminaison supplémentaires vous permettent de suivre et de gérer vos tâches plus efficacement. Vous pouvez :

  1. Tâche de liste asynchrone OCR (GET):
    Récupérez la liste de toutes les tâches lancées pour l'OCR. Utilisez les identifiants des tâches pour suivre l'état d'avancement et récupérer les résultats.
    Documentation de l'API
  2. Tâches de suppression asynchrone OCR (DELETE):
    Supprimez les tâches qui ne sont plus nécessaires pour garder votre espace de travail organisé et désencombré.
    Documentation de l'API

Ces terminaux améliorent la flexibilité et le contrôle, vous aidant à gérer et à nettoyer efficacement les tâches d'OCR. Pour plus de détails, consultez le documentation complète!

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Eden AI présente plusieurs avantages.

Plusieurs fournisseurs d'IA

Vous pouvez choisir entre différents services d'IA, ce qui vous permet de comparer les résultats pour obtenir les meilleures performances.

Intégration facile

Rationalisez le développement grâce à une clé API unique qui donne accès à plusieurs services d'IA. Évitez la complexité des intégrations distinctes et lancez-vous plus rapidement.

Rentabilité

Ne payez que ce que vous consommez. Aucun coût initial, juste un accès flexible à plusieurs services d'IA avec une seule clé API.

Conclusion

En deux étapes seulement, en lançant la tâche d'OCR et en récupérant les résultats, vous pouvez extraire du texte structuré à partir de documents de plusieurs pages à l'aide d'Eden AI et de Python.

Il s'agit d'un outil puissant pour automatiser les flux de travail tels que l'analyse de documents, l'extraction de données et l'archivage numérique.

L'OCR multipage n'a pas besoin d'être complexe. Grâce à l'API simple d'Eden AI et à la facilité d'utilisation de Python, vous pouvez intégrer cette fonctionnalité dans vos outils ou vos flux de travail avec un minimum de configuration.

Start Your AI Journey Today

  • Access 100+ AI APIs in a single platform.
  • Compare and deploy AI models effortlessly.
  • Pay-as-you-go with no upfront fees.
Start building FREE

Articles connexes

Essayez Eden AI gratuitement.

Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !

CommencezContactez le service commercial
X

Commencez votre parcours IA dès aujourd'hui!

Inscrivez-vous dès maintenant avec des crédits gratuits pour explorer plus de 100 API d'IA.
Obtenir mes crédits maintenant