Tutoriel

Comment faire de l'OCR sur plusieurs pages à l'aide de JavaScript

Dans ce guide, vous découvrirez comment effectuer une OCR de plusieurs pages à l'aide de JavaScript et de l'API Eden AI. Nous expliquerons comment lancer une tâche d'OCR, récupérer les résultats et traiter efficacement des documents volumineux à l'aide du flux de travail asynchrone d'Eden AI et de la prise en charge de plusieurs fournisseurs d'OCR.

Comment faire de l'OCR sur plusieurs pages à l'aide de JavaScript
TABLE DES MATIÈRES

La reconnaissance optique de caractères (OCR) est une méthode puissante pour convertir le texte d'images ou de documents numérisés en contenu modifiable et consultable. Grâce à la fonction OCR multipage d'Eden AI, la gestion de documents qui s'étendent sur plusieurs pages devient simple et efficace.

Dans ce didacticiel, vous allez apprendre à implémenter l'OCR multipage en JavaScript à l'aide de l'API Eden AI, en expliquant à la fois comment démarrer une tâche et comment récupérer les résultats.

Qu'est-ce que OCR multipage?

L'OCR (reconnaissance optique de caractères) multipage est une technologie qui permet aux utilisateurs d'extraire du texte de documents comportant plusieurs pages, tels que des PDF ou des fichiers à base d'images.

En scannant chaque page du document, il reconnaît et convertit le texte imprimé en formats lisibles par machine, modifiables et consultables, ce qui facilite le travail avec des documents volumineux ou numérisés sans saisie manuelle des données.

Comment utiliser l'OCR multipage

Configurez votre compte Eden AI

1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement ici. Une fois cela fait, vous pouvez obtenir votre clé API, que vous pouvez utiliser pour accéder à l'OCR multipage.

2. Accédez aux outils d'OCR : Une fois connecté, accédez à la section d'analyse des documents de la plateforme.

3. Choisissez la fonction d'OCR multipage : Sélectionnez l'outil OCR multipage. Vous pouvez également explorer les options d'analyse avancées en fonction de vos besoins spécifiques.

Implémentation de l'OCR multipage à l'aide de JavaScript

Installer le module de requêtes JavaScript

Pour interagir avec les API en JavaScript, nous utiliserons Axios, un client HTTP basé sur des promesses.


npm install axios

Axios simplifie l'envoi de requêtes HTTP et la gestion des réponses, ce qui le rend idéal pour appeler des API RESTful comme Eden AI.

Étape 1 : Lancer la tâche d'OCR (requête POST)

Utilisations d'Eden AI traitement asynchrone pour les fichiers volumineux ou complexes (tels que les PDF de plusieurs pages). Cela signifie que vous lancez d'abord la tâche, puis que vous interrogez l'API pour récupérer les résultats une fois le traitement terminé. Ce flux en deux étapes contribue aux performances, à la fiabilité et à l'évolutivité.

Cette première étape télécharge le fichier sur Eden AI et lance le processus d'OCR.


const axios = require('axios');

const API_TOKEN = 'Your_API_Key'; // Replace with your actual API token
const fileUrl = '🔗 URL of your image'; // Replace with the actual URL of the document

const headers = {
  "Authorization": `Bearer ${API_TOKEN}`,
  "Content-Type": "application/json"
};

const jsonPayload = {
  "providers": ["amazon"], // You can also use others like 'google', 'microsoft', etc.
  "file_url": fileUrl
};

axios.post('https://api.edenai.run/v2/ocr/ocr_async', jsonPayload, { headers })
  .then(response => {
    console.log(response.data); // Contains the public_id
  })
  .catch(error => {
    console.error('Error launching OCR job:', error);
  });

Explication du code :

URL_DU_FICHIER : URL de votre document (il peut s'agir d'un PDF de plusieurs pages).

fournisseurs : Eden AI prend en charge plusieurs fournisseurs d'OCR (comme Amazon Textract).

Cet appel démarre la tâche d'OCR et renvoie un public_id utilisé pour vérifier l'état de la tâche et récupérer les résultats.

Étape 2 : récupérer les résultats de l'OCR (requête GET)

Une fois la tâche d'OCR terminée, utilisez le public_id pour récupérer les résultats.


const axios = require('axios');

const publicId = 'your_public_id_here'; // Replace with your actual public_id
const API_TOKEN = 'Your_API_Key'; // Reuse your API token

const headers = {
  "Authorization": `Bearer ${API_TOKEN}`,
  "Accept": "application/json"
};

axios.get(`https://api.edenai.run/v2/ocr/ocr_async/${publicId}/`, { headers })
  .then(response => {
    console.log(response.data); // OCR results here
  })
  .catch(error => {
    console.error('Error retrieving OCR results:', error);
  });

Explication du code :

  • La requête GET vérifie l'état de la tâche et récupère la sortie OCR complète.
  • Le résultat inclut toutes les pages et tous les blocs de texte identifiés dans le document.

Interprétation des résultats

Voici ce que peut inclure une réponse typique :


{
  "status": "success",
  "results": {
    "amazon": {
      "text": "Page 1 content...\nPage 2 content...",
      "pages": [
        {
          "page_number": 1,
          "text": "Page 1 content..."
        },
        {
          "page_number": 2,
          "text": "Page 2 content..."
        }
      ]
    }
  }
}

Explication des champs de sortie :

  • statut : Indique si la tâche a réussi.
  • texte : Texte OCR consolidé de toutes les pages.
  • pages : Contient des résultats individuels par page (idéal pour les documents de plusieurs pages).
  • fournisseur : Indique quel moteur d'OCR a produit le résultat.

Aller plus loin

Pour une meilleure gestion de vos tâches d'OCR, Eden AI fournit des points de terminaison supplémentaires. Ces points de terminaison supplémentaires vous permettent de suivre et de gérer vos tâches plus efficacement. Vous pouvez :

  1. Tâche de liste asynchrone OCR (GET):
    Récupérez la liste de toutes les tâches lancées pour l'OCR. Utilisez les identifiants des tâches pour suivre l'état d'avancement et récupérer les résultats.
    Documentation de l'API
  2. Tâches de suppression asynchrone OCR (DELETE):
    Supprimez les tâches qui ne sont plus nécessaires pour garder votre espace de travail organisé et désencombré.
    Documentation de l'API

Ces terminaux améliorent la flexibilité et le contrôle, vous aidant à gérer et à nettoyer efficacement les tâches d'OCR. Pour plus de détails, consultez le documentation complète!

Pourquoi Eden AI est le meilleur outil pour l'OCR multipage

Eden AI présente plusieurs avantages.

Plusieurs fournisseurs d'IA

Vous pouvez choisir entre différents services d'IA, ce qui vous permet de comparer les résultats pour obtenir les meilleures performances.

Intégration facile

Simplifiez le développement grâce à une clé API unique qui donne accès à plusieurs services d'IA. Éliminez les tracas liés à la gestion d'intégrations distinctes et accélérez votre lancement.

Rentabilité

Ne payez que ce que vous consommez. Aucun coût initial, juste un accès flexible à plusieurs services d'IA avec une seule clé API.

Conclusion

L'utilisation de JavaScript avec l'API Eden AI pour l'OCR de plusieurs pages fournit une solution efficace et évolutive pour le traitement de documents volumineux ou complexes.

En utilisant la gestion asynchrone des tâches d'Eden AI et les multiples fournisseurs d'OCR, vous pouvez automatiser facilement l'extraction de texte à partir de documents de plusieurs pages, ce qui vous permet d'économiser du temps et des efforts tout en améliorant la précision.

Que ce soit pour un usage personnel ou pour des applications à grande échelle, cette approche garantit un traitement fluide des documents à chaque fois.

Start Your AI Journey Today

  • Access 100+ AI APIs in a single platform.
  • Compare and deploy AI models effortlessly.
  • Pay-as-you-go with no upfront fees.
Start building FREE

Articles connexes

Essayez Eden AI gratuitement.

Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !

CommencezContactez le service commercial
X

Commencez votre parcours IA dès aujourd'hui!

Inscrivez-vous dès maintenant avec des crédits gratuits pour explorer plus de 100 API d'IA.
Obtenir mes crédits maintenant