Tutoriel

API de réception OCR : la meilleure solution à choisir pour l'analyse des reçus ?

Dans cet article, nous présentons une comparaison des API OCR Receipt (analyseurs de reçus) disponibles sur le marché en les testant sur des données réelles

API de réception OCR : la meilleure solution à choisir pour l'analyse des reçus ?
TABLE DES MATIÈRES

En raison du besoin de numérisation qui s'est imposé ces dernières années, certaines entreprises souhaitent désormais traiter automatiquement les centaines de reçus qu'elles reçoivent. Traditionnellement, cela était réalisé en demandant à un humain de regarder un reçu papier et d'extraire manuellement les informations pertinentes puis de les saisir dans une base de données. Ce processus est laborieux et coûteux. La technologie d'extraction des reçus accélère ce processus en utilisant la technologie OCR et en permettant directement au logiciel de numériser une photo du reçu et d'extraire ces données en quelques secondes seulement. C'est un moyen d'automatiser la numérisation et l'extraction des reçus pour collecter des informations plus rapidement.

Qu'est-ce que l'OCR Receipt :

L'OCR des reçus est un outil basé sur l'OCR qui permet d'extraire et de numériser des données pertinentes à partir de reçus numérisés ou PDF. Les champs couramment saisis par un reçu OCR incluent la description, la quantité, la date d'échéance, les articles en ligne, les informations sur le commerçant et le magasin, le prix unitaire, la facture à, le numéro de reçu, le montant total, le montant des taxes, etc.

Digitize Receipts with Receipt OCR | Automated Receipt OCR
Eden AI (www.edenai.co) - Analyseur de réceptions/reçus OCR

Cette technologie repose sur plusieurs étapes, la première étape consiste à prétraiter l'image. Généralement, les reçus scannés sont bruyants, un prétraitement avec suppression du bruit et mise en niveaux de gris est donc nécessaire. Cette étape est nécessaire au bon fonctionnement des moteurs d'extraction de texte. L'étape suivante est la détection de texte avec OCR (pour Reconnaissance optique de caractères). Il extrait un texte à partir de différents types de fichiers : pdf, Docx, JPEG, PNG, etc. Leur objectif est uniquement de récupérer les textes du document sans avoir à modifier la structure du document.

La dernière étape consiste en l'extraction et la catégorisation des données, au cours desquelles le texte extrait est classé en clés et en balises, telles que la taxe et le montant total, sur la base d'algorithmes d'apprentissage en profondeur et de NER (reconnaissance d'entités nommées). Le résultat final de l'analyse est un formulaire structuré lisible par l'ordinateur. Il s'agit souvent d'un fichier JSON, XML ou même CSV, ce qui facilite son stockage dans une base de données et son analyse automatique.

Cas d'utilisation :

Les reçus OCR sont principalement utilisés dans le processus d'automatisation et d'optimisation de la gestion de la chaîne d'approvisionnement, car ils constituent l'épine dorsale de nombreuses entreprises. La gestion des tâches, des informations et de la production est très importante pour garantir le contrôle des coûts de production. Une chaîne d'approvisionnement numérisée bénéficierait à ces entreprises en garantissant les délais de livraison. La clé de la numérisation réside dans l'automatisation de la saisie des données et de la gestion d'une grande partie de ces données, sous forme de reçus et factures. Le fait qu'un employé saisisse manuellement les reçus a un impact négatif sur l'ensemble de la chaîne d'approvisionnement et entraîne des retards inutiles. La numérisation de ce traitement des reçus peut entraîner des gains de temps et d'efficacité substantiels.

Moteurs d'API OCR Receipt :

Au cours de notre étude sur les API OCR Receipts, nous avons décidé de choisir 8 fournisseurs d'API offrant des performances élevées selon de nombreux articles de blog et classements.

  • Base 64
  • Berceau
  • Léon de données
  • Mindee
  • ScanDocFlow
  • Scanneur d'onglets
  • Taggun
  • Très bon

Voici la liste des API des fournisseurs que nous allons tester. Il est intéressant de noter qu'il existe d'autres API et solutions open source.

Eden AI - API de réception OCR/analyseur de reçus

Cas d'utilisation testé :

Comme mentionné précédemment, les API de reçus OCR sont principalement utilisées pour la gestion de la chaîne d'approvisionnement et l'automatisation des créances, car leur objectif est de disposer d'une chaîne d'approvisionnement entièrement numérisée. Dans ce cas d'utilisation, nous avons reçu 11 reçus provenant de différents magasins, chaque reçu étant une image numérisée. Nous allons tester différentes API de réception OCR et comparer les résultats. Pour chacun des 11 documents, nous avons testé les 8 API. Bien sûr, pour un projet réel, vous devrez effectuer des tests sur une partie représentative de votre base de données pour obtenir des résultats fiables.

Dans notre benchmark, nous voulions comparer les performances des API dans différents domaines : informations sur les clients et les magasins (nom complet, adresse), numéro de facture, reçu total, taxes et articles de ligne. Notez que certains fournisseurs extraient d'autres champs du reçu, mais comme nous ne voulons que des informations spécifiques sur le reçu, nous nous concentrons uniquement sur celles-ci. La réponse de l'API est une réponse json qui sera utilisée pour extraire des informations spécifiques.

Défis liés aux API d'analyse des reçus (Eden AI) :

En utilisant différentes API pour la numérisation des reçus, nous avons relevé certains défis. Certains fournisseurs peuvent obtenir de bons résultats sur les informations de base telles que le nom, l'adresse et le total, mais ne récupèrent pas les rubriques et les taxes, tandis que d'autres obtiennent de bons résultats sur les taxes et les articles, mais pas sur le terrain, la facture et les informations de base. Certains fournisseurs peuvent même récupérer la majorité des champs mais pas la ligne d'éléments.

Un autre défi concerne les clés renvoyées ; certaines API renvoient à la fois le nom et le titre de la boutique, tandis que d'autres ont directement une clé complète avec le nom de la boutique qui inclut les deux champs. Pour vous faciliter la tâche et contourner ces défis, nous avons utilisé Eden AI solution permettant d'utiliser les API de différents fournisseurs. Eden AI nous permet d'obtenir les résultats de plusieurs API d'analyseur de reçus avec une seule requête simple et de renvoyer une réponse standardisée pour chacune d'entre elles.

Vous n'avez pas besoin de formater les réponses pour les comparer. Par conséquent, si vous souhaitez combiner un résultat provenant de plusieurs fournisseurs, vous pouvez le faire facilement en quelques lignes de code.

URL = "https://api.edenai.run/v2/ocr/receipt_parser"
receipt_path ="test.pdf"
header = {
    'Authorization': 'Bearer ' + key
    }
multipart_form_data = {
         'providers':str([tabscanner]),
	   'language':str([en-US])
    }
files = {
    'files':open(receipt_path,'rb'),
}
response = requests.post(URL,data=multipart_form_data,files=files,headers=header)

Ou utilisez simplement l'interface Web dans laquelle vous importez le reçu et choisissez les fournisseurs que vous souhaitez tester.

Eden AI (www.edenai.co) - Reçu OCR

Vous pouvez également gérer et évaluer vos propres coûts pour chaque fournisseur disponible pour l'analyse des reçus. Cela vous donne une idée de votre projet car cela inclut le prix par demande.

Eden AI (www.edenai.co) - Gestion des coûts

Résultats :

Voici les résultats que nous avons obtenus pour ce cas d'utilisation (pourcentage de reconnaissance) :

Comparaison des API Eden AI et OCR Receipt

Veuillez noter que les résultats représentent le pourcentage de recettes dont le résultat est exact ; une prédiction proche du champ réel sans être exacte sera considérée comme une mauvaise prédiction, c'est-à-dire une prédiction du nom du magasin comme titre du magasin. Avertissement : Ces résultats ne sont pas une représentation précise des performances, ils dépendront toujours de votre ensemble de données. Vous ne pouvez même pas savoir quels fournisseurs seront les meilleurs pour vos données et votre cas d'utilisation. Tous ces fournisseurs fournissent de bons résultats avec certains types de reçus et certaines langues.

Conclusion :

Selon les données utilisées, la meilleure façon d'obtenir les meilleures performances est toujours différente. Pour certains cas d'utilisation, une API de fournisseur A sera le meilleur, pour un autre cas d'utilisation fournisseur B L'API est meilleure. Pour un cas d'utilisation plus complexe, une combinaison est peut-être nécessaire et fournisseur C + fournisseur D sera la meilleure option.

Avec Eden AI, vous pouvez accéder rapidement à divers résultats provenant de différents fournisseurs. Vous pouvez ainsi avoir une meilleure idée de la solution qui vous convient le mieux.

La prise de décision est la suivante :

1- Vous exécutez d'abord vos données sur Eden AI pour comparer les API disponibles sur le marché.

2 - Ensuite, vous pouvez soit trouver un résultat qui vous pousse à choisir une API qui correspond à vos besoins, soit différents fournisseurs qui vous donnent de bons résultats dans différents domaines afin que vous puissiez créer votre propre modèle personnalisé en combinant plusieurs fournisseurs.

3- Ce processus vous garantit de faire le bon choix pour réussir votre projet. Eden AI est l'API universelle qui vous permet d'utiliser de manière flexible tous ces moteurs de réception COR pour toujours obtenir le meilleur rapport performances/coûts.

Vous pouvez créer un compte sur Eden AI ici et automatisez rapidement l'extraction des reçus pour votre entreprise. Vous pouvez également nous contacter si vous avez besoin d'aide pour l'intégration de votre API de réception OCR.

Commencez votre aventure avec l’IA dès aujourd’hui

  • Accédez à plus de 100 API d’IA sur une seule plateforme.
  • Comparez et déployez des modèles d’IA en toute simplicité.
  • Paiement à l’usage, sans frais initiaux.
Commencez à créer GRATUITEMENT

Articles connexes

Essayez Eden AI gratuitement.

Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !

CommencezContactez le service commercial
X

Commencez votre parcours IA dès aujourd'hui!

Inscrivez-vous dès maintenant avec des crédits gratuits pour explorer plus de 100 API d'IA.
Commencer