Résumez cet article avec :
La reconnaissance optique de caractères (OCR) est une technique puissante permettant d'extraire du texte à partir d'images ou de documents numérisés. Grâce aux fonctionnalités d'OCR multipages d'Eden AI, vous pouvez facilement traiter des documents couvrant plusieurs pages avec seulement quelques lignes de code Python.
Dans ce didacticiel, vous allez apprendre à implémenter l'OCR multipage à l'aide de l'API Eden AI en Python, notamment en lançant une tâche et en récupérant les résultats.
Qu'est-ce que OCR multipage?
.avif)
L'OCR (reconnaissance optique de caractères) multipage est une technologie qui permet aux utilisateurs d'extraire du texte de documents comportant plusieurs pages, tels que des PDF ou des fichiers à base d'images.
En scannant chaque page du document, il reconnaît et convertit le texte imprimé en formats lisibles par machine, modifiables et consultables, ce qui facilite le travail avec des documents volumineux ou numérisés sans saisie manuelle des données.
Comment utiliser l'OCR multipage
Configurez votre compte Eden AI
1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement ici. Une fois cela fait, vous pouvez obtenir votre clé API, que vous pouvez utiliser pour accéder à l'OCR multipage.

2. Accédez aux outils d'OCR : Une fois connecté, accédez à la section d'analyse des documents de la plateforme.
3. Choisissez la fonction d'OCR multipage : Sélectionnez l'outil OCR multipage. Vous pouvez également explorer les options d'analyse avancées en fonction de vos besoins spécifiques.
Implémentation de l'OCR multipage à l'aide de Python
Étape 1 : Installation de la bibliothèque de requêtes
Avant de commencer, assurez-vous que le module de requêtes est installé. Il s'agit de la bibliothèque utilisée pour envoyer des requêtes HTTP aux terminaux d'Eden AI.
Utilisations d'Eden AI traitement asynchrone pour les fichiers volumineux ou complexes (tels que les PDF de plusieurs pages). Cela signifie que vous lancez d'abord la tâche, puis que vous interrogez l'API pour récupérer les résultats une fois le traitement terminé. Ce flux en deux étapes contribue aux performances, à la fiabilité et à l'évolutivité.
Lancement de la tâche d'OCR (requête POST)
La première étape consiste à soumettre votre document à Eden AI pour le traitement OCR.
Qu'est-ce que cela fait :
- Autorisation: utilise votre clé API pour vous authentifier.
- URL_du fichier: créez un lien vers votre PDF ou une image multipage.
- fournisseurs: Spécifie le moteur d'OCR à utiliser (Amazon dans ce cas).
- Cette requête POST lance une tâche d'OCR asynchrone, et renvoie un identifiant_public utilisé pour récupérer les résultats ultérieurement.
Récupération des résultats d'OCR (requête GET)
Une fois la tâche soumise, vous obtiendrez un public_id. Utilisez-le pour récupérer le résultat.
Interprétation des résultats
Voici ce que peut inclure une réponse typique :
Champs clés :
- statut: indique si la tâche est terminée.
- texte_extrait: texte intégral extrait sur toutes les pages.
- pages: Répartition du texte par page, utile pour la pagination ou les résumés.
Aller plus loin
Pour une meilleure gestion de vos tâches d'OCR, Eden AI fournit des points de terminaison supplémentaires. Ces points de terminaison supplémentaires vous permettent de suivre et de gérer vos tâches plus efficacement. Vous pouvez :
- Tâche de liste asynchrone OCR (GET):
Récupérez la liste de toutes les tâches lancées pour l'OCR. Utilisez les identifiants des tâches pour suivre l'état d'avancement et récupérer les résultats.
Documentation de l'API - Tâches de suppression asynchrone OCR (DELETE):
Supprimez les tâches qui ne sont plus nécessaires pour garder votre espace de travail organisé et désencombré.
Documentation de l'API
Ces terminaux améliorent la flexibilité et le contrôle, vous aidant à gérer et à nettoyer efficacement les tâches d'OCR. Pour plus de détails, consultez le documentation complète!
Pourquoi Eden AI est le meilleur outil pour l'OCR multipage
Eden AI présente plusieurs avantages.

Plusieurs fournisseurs d'IA
Vous pouvez choisir entre différents services d'IA, ce qui vous permet de comparer les résultats pour obtenir les meilleures performances.
Intégration facile
Rationalisez le développement grâce à une clé API unique qui donne accès à plusieurs services d'IA. Évitez la complexité des intégrations distinctes et lancez-vous plus rapidement.
Rentabilité
Ne payez que ce que vous consommez. Aucun coût initial, juste un accès flexible à plusieurs services d'IA avec une seule clé API.
Conclusion
En deux étapes seulement, en lançant la tâche d'OCR et en récupérant les résultats, vous pouvez extraire du texte structuré à partir de documents de plusieurs pages à l'aide d'Eden AI et de Python.
Il s'agit d'un outil puissant pour automatiser les flux de travail tels que l'analyse de documents, l'extraction de données et l'archivage numérique.
L'OCR multipage n'a pas besoin d'être complexe. Grâce à l'API simple d'Eden AI et à la facilité d'utilisation de Python, vous pouvez intégrer cette fonctionnalité dans vos outils ou vos flux de travail avec un minimum de configuration.


.avif)
.avif)