Résumez cet article avec :
La reconnaissance optique de caractères (OCR) est une méthode puissante pour convertir le texte d'images ou de documents numérisés en contenu modifiable et consultable. Grâce à la fonction OCR multipage d'Eden AI, la gestion de documents qui s'étendent sur plusieurs pages devient simple et efficace.
Dans ce didacticiel, vous allez apprendre à implémenter l'OCR multipage en JavaScript à l'aide de l'API Eden AI, en expliquant à la fois comment démarrer une tâche et comment récupérer les résultats.
Qu'est-ce que OCR multipage?
.avif)
L'OCR (reconnaissance optique de caractères) multipage est une technologie qui permet aux utilisateurs d'extraire du texte de documents comportant plusieurs pages, tels que des PDF ou des fichiers à base d'images.
En scannant chaque page du document, il reconnaît et convertit le texte imprimé en formats lisibles par machine, modifiables et consultables, ce qui facilite le travail avec des documents volumineux ou numérisés sans saisie manuelle des données.
Comment utiliser l'OCR multipage
Configurez votre compte Eden AI
1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement ici. Une fois cela fait, vous pouvez obtenir votre clé API, que vous pouvez utiliser pour accéder à l'OCR multipage.

2. Accédez aux outils d'OCR : Une fois connecté, accédez à la section d'analyse des documents de la plateforme.
3. Choisissez la fonction d'OCR multipage : Sélectionnez l'outil OCR multipage. Vous pouvez également explorer les options d'analyse avancées en fonction de vos besoins spécifiques.
Implémentation de l'OCR multipage à l'aide de JavaScript
Installer le module de requêtes JavaScript
Pour interagir avec les API en JavaScript, nous utiliserons Axios, un client HTTP basé sur des promesses.
Axios simplifie l'envoi de requêtes HTTP et la gestion des réponses, ce qui le rend idéal pour appeler des API RESTful comme Eden AI.
Étape 1 : Lancer la tâche d'OCR (requête POST)
Utilisations d'Eden AI traitement asynchrone pour les fichiers volumineux ou complexes (tels que les PDF de plusieurs pages). Cela signifie que vous lancez d'abord la tâche, puis que vous interrogez l'API pour récupérer les résultats une fois le traitement terminé. Ce flux en deux étapes contribue aux performances, à la fiabilité et à l'évolutivité.
Cette première étape télécharge le fichier sur Eden AI et lance le processus d'OCR.
Explication du code :
URL_DU_FICHIER : URL de votre document (il peut s'agir d'un PDF de plusieurs pages).
fournisseurs : Eden AI prend en charge plusieurs fournisseurs d'OCR (comme Amazon Textract).
Cet appel démarre la tâche d'OCR et renvoie un public_id utilisé pour vérifier l'état de la tâche et récupérer les résultats.
Étape 2 : récupérer les résultats de l'OCR (requête GET)
Une fois la tâche d'OCR terminée, utilisez le public_id pour récupérer les résultats.
Explication du code :
- La requête GET vérifie l'état de la tâche et récupère la sortie OCR complète.
- Le résultat inclut toutes les pages et tous les blocs de texte identifiés dans le document.
Interprétation des résultats
Voici ce que peut inclure une réponse typique :
Explication des champs de sortie :
- statut : Indique si la tâche a réussi.
- texte : Texte OCR consolidé de toutes les pages.
- pages : Contient des résultats individuels par page (idéal pour les documents de plusieurs pages).
- fournisseur : Indique quel moteur d'OCR a produit le résultat.
Aller plus loin
Pour une meilleure gestion de vos tâches d'OCR, Eden AI fournit des points de terminaison supplémentaires. Ces points de terminaison supplémentaires vous permettent de suivre et de gérer vos tâches plus efficacement. Vous pouvez :
- Tâche de liste asynchrone OCR (GET):
Récupérez la liste de toutes les tâches lancées pour l'OCR. Utilisez les identifiants des tâches pour suivre l'état d'avancement et récupérer les résultats.
Documentation de l'API - Tâches de suppression asynchrone OCR (DELETE):
Supprimez les tâches qui ne sont plus nécessaires pour garder votre espace de travail organisé et désencombré.
Documentation de l'API
Ces terminaux améliorent la flexibilité et le contrôle, vous aidant à gérer et à nettoyer efficacement les tâches d'OCR. Pour plus de détails, consultez le documentation complète!
Pourquoi Eden AI est le meilleur outil pour l'OCR multipage
Eden AI présente plusieurs avantages.

Plusieurs fournisseurs d'IA
Vous pouvez choisir entre différents services d'IA, ce qui vous permet de comparer les résultats pour obtenir les meilleures performances.
Intégration facile
Simplifiez le développement grâce à une clé API unique qui donne accès à plusieurs services d'IA. Éliminez les tracas liés à la gestion d'intégrations distinctes et accélérez votre lancement.
Rentabilité
Ne payez que ce que vous consommez. Aucun coût initial, juste un accès flexible à plusieurs services d'IA avec une seule clé API.
Conclusion
L'utilisation de JavaScript avec l'API Eden AI pour l'OCR de plusieurs pages fournit une solution efficace et évolutive pour le traitement de documents volumineux ou complexes.
En utilisant la gestion asynchrone des tâches d'Eden AI et les multiples fournisseurs d'OCR, vous pouvez automatiser facilement l'extraction de texte à partir de documents de plusieurs pages, ce qui vous permet d'économiser du temps et des efforts tout en améliorant la précision.
Que ce soit pour un usage personnel ou pour des applications à grande échelle, cette approche garantit un traitement fluide des documents à chaque fois.
.avif)

.avif)
.avif)