Tutoriel

Comment faire de l'OCR sur plusieurs pages à l'aide de JavaScript

Dans ce guide, vous découvrirez comment effectuer une OCR de plusieurs pages à l'aide de JavaScript et de l'API Eden AI. Nous expliquerons comment lancer une tâche d'OCR, récupérer les résultats et traiter efficacement des documents volumineux à l'aide du flux de travail asynchrone d'Eden AI et de la prise en charge de plusieurs fournisseurs d'OCR.

TABLE DES MATIÈRES

Text Link

La reconnaissance optique de caractères (OCR) est une méthode puissante pour convertir le texte d'images ou de documents numérisés en contenu modifiable et consultable. Grâce à la fonction OCR multipage d'Eden AI, la gestion de documents qui s'étendent sur plusieurs pages devient simple et efficace.

Dans ce didacticiel, vous allez apprendre à implémenter l'OCR multipage en JavaScript à l'aide de l'API Eden AI, en expliquant à la fois comment démarrer une tâche et comment récupérer les résultats.

‍

Qu'est-ce que OCR multipage?

L'OCR (reconnaissance optique de caractères) multipage est une technologie qui permet aux utilisateurs d'extraire du texte de documents comportant plusieurs pages, tels que des PDF ou des fichiers à base d'images.

En scannant chaque page du document, il reconnaît et convertit le texte imprimé en formats lisibles par machine, modifiables et consultables, ce qui facilite le travail avec des documents volumineux ou numérisés sans saisie manuelle des données.

‍

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement ici. Une fois cela fait, vous pouvez obtenir votre clé API, que vous pouvez utiliser pour accéder à l'OCR multipage.

2. Accédez aux outils d'OCR : Une fois connecté, accédez à la section d'analyse des documents de la plateforme.

3. Choisissez la fonction d'OCR multipage : Sélectionnez l'outil OCR multipage. Vous pouvez également explorer les options d'analyse avancées en fonction de vos besoins spécifiques.

‍

Implémentation de l'OCR multipage à l'aide de JavaScript

‍

Installer le module de requêtes JavaScript

Pour interagir avec les API en JavaScript, nous utiliserons Axios, un client HTTP basé sur des promesses.


npm install axios

Axios simplifie l'envoi de requêtes HTTP et la gestion des réponses, ce qui le rend idéal pour appeler des API RESTful comme Eden AI.

‍

Étape 1 : Lancer la tâche d'OCR (requête POST)

Utilisations d'Eden AI traitement asynchrone pour les fichiers volumineux ou complexes (tels que les PDF de plusieurs pages). Cela signifie que vous lancez d'abord la tâche, puis que vous interrogez l'API pour récupérer les résultats une fois le traitement terminé. Ce flux en deux étapes contribue aux performances, à la fiabilité et à l'évolutivité.

Cette première étape télécharge le fichier sur Eden AI et lance le processus d'OCR.


const axios = require('axios');

const API_TOKEN = 'Your_API_Key'; // Replace with your actual API token
const fileUrl = '🔗 URL of your image'; // Replace with the actual URL of the document

const headers = {
  "Authorization": `Bearer ${API_TOKEN}`,
  "Content-Type": "application/json"
};

const jsonPayload = {
  "providers": ["amazon"], // You can also use others like 'google', 'microsoft', etc.
  "file_url": fileUrl
};

axios.post('https://api.edenai.run/v2/ocr/ocr_async', jsonPayload, { headers })
  .then(response => {
    console.log(response.data); // Contains the public_id
  })
  .catch(error => {
    console.error('Error launching OCR job:', error);
  });

Explication du code :

‍URL_DU_FICHIER : URL de votre document (il peut s'agir d'un PDF de plusieurs pages).

fournisseurs : Eden AI prend en charge plusieurs fournisseurs d'OCR (comme Amazon Textract).

Cet appel démarre la tâche d'OCR et renvoie un public_id utilisé pour vérifier l'état de la tâche et récupérer les résultats.

‍

Étape 2 : récupérer les résultats de l'OCR (requête GET)

Une fois la tâche d'OCR terminée, utilisez le public_id pour récupérer les résultats.


const axios = require('axios');

const publicId = 'your_public_id_here'; // Replace with your actual public_id
const API_TOKEN = 'Your_API_Key'; // Reuse your API token

const headers = {
  "Authorization": `Bearer ${API_TOKEN}`,
  "Accept": "application/json"
};

axios.get(`https://api.edenai.run/v2/ocr/ocr_async/${publicId}/`, { headers })
  .then(response => {
    console.log(response.data); // OCR results here
  })
  .catch(error => {
    console.error('Error retrieving OCR results:', error);
  });

Explication du code :

La requête GET vérifie l'état de la tâche et récupère la sortie OCR complète.
Le résultat inclut toutes les pages et tous les blocs de texte identifiés dans le document.

‍

Interprétation des résultats

Voici ce que peut inclure une réponse typique :


{
  "status": "success",
  "results": {
    "amazon": {
      "text": "Page 1 content...\nPage 2 content...",
      "pages": [
        {
          "page_number": 1,
          "text": "Page 1 content..."
        },
        {
          "page_number": 2,
          "text": "Page 2 content..."
        }
      ]
    }
  }
}

Explication des champs de sortie :

statut : Indique si la tâche a réussi.
texte : Texte OCR consolidé de toutes les pages.
pages : Contient des résultats individuels par page (idéal pour les documents de plusieurs pages).
fournisseur : Indique quel moteur d'OCR a produit le résultat.

‍

Aller plus loin

Pour une meilleure gestion de vos tâches d'OCR, Eden AI fournit des points de terminaison supplémentaires. Ces points de terminaison supplémentaires vous permettent de suivre et de gérer vos tâches plus efficacement. Vous pouvez :

Tâche de liste asynchrone OCR (GET):
Récupérez la liste de toutes les tâches lancées pour l'OCR. Utilisez les identifiants des tâches pour suivre l'état d'avancement et récupérer les résultats.
Documentation de l'API
Tâches de suppression asynchrone OCR (DELETE):
Supprimez les tâches qui ne sont plus nécessaires pour garder votre espace de travail organisé et désencombré.
Documentation de l'API

Ces terminaux améliorent la flexibilité et le contrôle, vous aidant à gérer et à nettoyer efficacement les tâches d'OCR. Pour plus de détails, consultez le documentation complète!

‍

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Eden AI présente plusieurs avantages.

Plusieurs fournisseurs d'IA‍

Vous pouvez choisir entre différents services d'IA, ce qui vous permet de comparer les résultats pour obtenir les meilleures performances.

Intégration facile‍

Simplifiez le développement grâce à une clé API unique qui donne accès à plusieurs services d'IA. Éliminez les tracas liés à la gestion d'intégrations distinctes et accélérez votre lancement.

Rentabilité‍

Ne payez que ce que vous consommez. Aucun coût initial, juste un accès flexible à plusieurs services d'IA avec une seule clé API.

‍

Conclusion

L'utilisation de JavaScript avec l'API Eden AI pour l'OCR de plusieurs pages fournit une solution efficace et évolutive pour le traitement de documents volumineux ou complexes.

En utilisant la gestion asynchrone des tâches d'Eden AI et les multiples fournisseurs d'OCR, vous pouvez automatiser facilement l'extraction de texte à partir de documents de plusieurs pages, ce qui vous permet d'économiser du temps et des efforts tout en améliorant la précision.

Que ce soit pour un usage personnel ou pour des applications à grande échelle, cette approche garantit un traitement fluide des documents à chaque fois.

Créez votre compte sur Eden AI

Articles connexes

Science

Qu'est-ce qu'un ingénieur en IA ?

Un ingénieur en IA est un spécialiste du génie logiciel qui se concentre sur la création, le déploiement et la maintenance de systèmes d'IA en production. Ils font le lien entre la science des données et le développement de logiciels, en garantissant que les modèles d'apprentissage automatique sont évolutifs, fiables et intégrés aux applications. Ce rôle nécessite une base solide en génie logiciel, en MLOps et en infrastructure cloud.

Science

How to Automate AI Model Selection in Production: A Practical Guide

Déployer des modèles d'IA en production ne se limite pas à choisir le meilleur. Il s'agit de sélectionner en permanence celui qui convient à chaque cas d'utilisation, à chaque contexte et à chaque contrainte de coût. Cet article explore des moyens pratiques d'automatiser la sélection de modèles à l'aide de la surveillance des performances, de la logique de routage et d'outils tels que l'API unifiée d'Eden AI pour l'optimisation dynamique.

Science

OpenAI, Anthropic, Mistral : quel modèle d'IA fonctionne le mieux pour votre cas d'utilisation ?

Choisir entre OpenAI, Anthropic et Mistral peut s'avérer difficile pour les développeurs et les équipes produit. Chaque modèle excelle dans différents domaines, qu'il s'agisse du raisonnement, de la créativité, de la rapidité ou de la rentabilité. Cet article compare leurs points forts, aborde les principaux indicateurs d'évaluation et montre comment une approche multimodèle basée sur Eden AI vous permet de tirer le meilleur parti de chaque fournisseur sans intégration complexe.

Essayez Eden AI dès maintenant.

Vous pouvez commencer à construire tout de suite. Si vous avez des questions, n'hésitez pas à discuter avec nous !

Commencez Contactez le service commercial

Comment faire de l'OCR sur plusieurs pages à l'aide de JavaScript

Qu'est-ce que OCR multipage?

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

Implémentation de l'OCR multipage à l'aide de JavaScript

Étape 1 : Lancer la tâche d'OCR (requête POST)

Explication du code :

Étape 2 : récupérer les résultats de l'OCR (requête GET)

Explication du code :

Interprétation des résultats

Explication des champs de sortie :

Aller plus loin

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Plusieurs fournisseurs d'IA‍

Intégration facile‍

Rentabilité‍

Conclusion

Articles connexes

Qu'est-ce qu'un ingénieur en IA ?

How to Automate AI Model Selection in Production: A Practical Guide

OpenAI, Anthropic, Mistral : quel modèle d'IA fonctionne le mieux pour votre cas d'utilisation ?

Essayez Eden AI dès maintenant.

Plateforme

solutions

Ressources

L'entreprise

Comment faire de l'OCR sur plusieurs pages à l'aide de JavaScript

Qu'est-ce que OCR multipage?

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

Implémentation de l'OCR multipage à l'aide de JavaScript

Étape 1 : Lancer la tâche d'OCR (requête POST)

Explication du code :

Étape 2 : récupérer les résultats de l'OCR (requête GET)

Explication du code :

Interprétation des résultats

Explication des champs de sortie :

Aller plus loin

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Plusieurs fournisseurs d'IA‍

Intégration facile‍

Rentabilité‍

Conclusion

Commencez votre aventure avec l’IA dès aujourd’hui

Articles connexes

Qu'est-ce qu'un ingénieur en IA ?

How to Automate AI Model Selection in Production: A Practical Guide

OpenAI, Anthropic, Mistral : quel modèle d'IA fonctionne le mieux pour votre cas d'utilisation ?

Essayez Eden AI dès maintenant.

Plateforme

solutions

Ressources

L'entreprise

Commencez votre parcours IA dès aujourd'hui!

Commencez votre parcours IA dès aujourd'hui!