
Commencez votre aventure avec l’IA dès aujourd’hui
- Accédez à plus de 100 API d’IA sur une seule plateforme.
- Comparez et déployez des modèles d’IA en toute simplicité.
- Paiement à l’usage, sans frais initiaux.
Comment extraire des tableaux en images/PDF avec Python en 5 minutes ?
Dans ce tutoriel, vous allez apprendre à utiliser l'API OCR Table en 5 minutes à l'aide de Python et de l'API Eden AI OCR Table. Eden AI fournit une API simple et conviviale pour les développeurs qui vous permet d'extraire des tableaux dans vos fichiers.
L'OCR de tableaux vous permet d'extraire des données tabulaires de fichiers PDF et d'images en une seule fois. Il utilise une combinaison de Reconnaissance optique de caractères (OCR) et des modèles d'apprentissage automatique qui vous permettent de sélectionner et d'extraire des tableaux entiers à partir d'images pour une analyse ultérieure, ce qui en fait un outil précieux pour les entreprises qui gèrent de gros volumes de documents. D'autres types de documents tels que reçus, factures, reprend, les identifiants, etc., suivent également la même mise en page et bénéficient des fonctionnalités de Table OCR.
La première étape pour démarrer avec OCR Table consiste à installer le package de requêtes de Python, qui vous permettra d'appeler l'API Eden AI.
Ensuite, vous devrez installer le package JSON de Python pour pouvoir lire et imprimer le résultat de la demande d'API.
Vous êtes maintenant prêt à traiter votre fichier dans l'API Eden AI OCR Table. Vous pouvez traiter des fichiers au format .pdf, .jpg, .png ou .jpeg et documents dans de nombreuses langues.
Pour exécuter OCR Table, vous devez créer un compte sur Eden AI gratuitement. Ensuite, vous pourrez obtenir votre Clé API directement depuis la page d'accueil avec des crédits gratuits offerts par Eden AI.
Maintenant que vous avez importé des packages sur Python et obtenu votre clé API, vous pouvez extraire du texte dans votre fichier. Avec Eden AI, vous pouvez choisir parmi une large gamme de moteurs différents que vous souhaitez pour OCR Table. Vous pouvez voir les fournisseurs de tables OCR disponibles sur Eden AI sur notre documentation ici.
Voici le script Python que vous devez écrire sur votre bloc-notes :
Par exemple, nous avons appelé deux moteurs de table OCR différents. L'API Eden AI renverra ensuite dans ses réponses JSON les résultats de ces fournisseurs.
L'API Eden AI OCR Table est une API asynchrone. Cela signifie que vous recevrez en réponse un identifiant :
Vous devrez ensuite effectuer une requête GET pour vérifier l'état de la demande d'API (succès, traitement, échec) :
Vous obtiendrez d'abord cette réponse :
Une fois la demande terminée (statut : terminée), vous pourrez obtenir le résultat avec cette impression :
Voici un exemple de résultat pour la tâche OCR Table :
L'utilisation de l'extraction de tableaux avec l'API Eden AI est simple et rapide.
Nous proposons une API unifiée pour tous les fournisseurs : simple et standard à utiliser, avec un changement rapide d'un fournisseur à l'autre et un accès aux fonctionnalités spécifiques de chaque fournisseur.
Le format de sortie JSON est le même pour tous les fournisseurs grâce au travail de standardisation d'Eden AI. Les éléments de réponse sont également standardisés grâce aux puissants algorithmes de correspondance d'Eden AI.
Avec Eden AI, vous avez la possibilité d'intégrer une plateforme tierce : nous pouvons développer rapidement des connecteurs. Pour aller plus loin et personnaliser votre demande de table OCR avec des paramètres spécifiques, consultez notre documentation.
Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !
CommencezContactez le service commercial