Résumez cet article avec :
Dans ce didacticiel, vous apprendrez à utiliser l'API Speech-to-Text en 5 minutes à l'aide de Python. Eden AI fournit une API simple et conviviale pour les développeurs qui vous permet de transcrire vos fichiers audio.
Qu'est-ce que Parole-texte API ?
L'API Speech-to-Text (STT) permet aux utilisateurs de convertir facilement les mots prononcés en texte écrit. À l'aide d'algorithmes de traitement du langage naturel (NLP) et d'apprentissage automatique, l'API STT peut analyser votre entrée audio et la transcrire en texte écrit, que vous parliez en temps réel ou que vous disposiez d'un fichier audio enregistré. Cette technologie est utilisée dans diverses applications, des appareils à commande vocale aux assistants virtuels en passant par les services de transcription.

Commencez à utiliser l'API Speech-to-Text à l'aide de Python
La première étape consiste à installer le package de requêtes de Python, qui vous permettra d'appeler l'API Eden AI.

Ensuite, vous devrez installer le package JSON de Python afin de lire et d'imprimer le résultat de la demande d'API.

Comment transcrire un fichier audio avec Python
Vous êtes maintenant prêt à traiter votre fichier audio dans l'API Speech-to-Text Eden AI. Vous pouvez accéder à la liste des langues prises en charge dans notre documentation ici.
1. Obtenez une clé d'API Speech-to-Text sur Eden AI
Pour exécuter Speech-to-Text, vous devez créer un compte sur Eden AI gratuitement. Ensuite, vous pourrez obtenir votre Clé API directement depuis la page d'accueil avec des crédits gratuits offerts par Eden AI.

2. Transcrivons votre fichier audio
Maintenant que vous avez importé des packages sur Python et que vous avez obtenu votre clé API, vous pouvez transcrire votre fichier audio. Avec Eden AI, vous pouvez choisir parmi une large gamme de moteurs que vous souhaitez pour la synthèse vocale. Vous pouvez accéder à la liste des fournisseurs de reconnaissance vocale disponibles sur Eden AI directement sur notre documentation.
Voici le script Python que vous devez écrire sur votre bloc-notes :

Par exemple, nous avons appelé deux moteurs Speech-to-Text différents. L'API Eden AI renverra ensuite dans ses réponses JSON les résultats de ces fournisseurs.
L'API Speech-to-Text d'Eden AI est une API asynchrone. Cela signifie que vous recevrez en réponse un identifiant :

Vous devrez ensuite effectuer une requête GET pour vérifier l'état de la demande d'API (succès, traitement, échec) :

Vous obtiendrez d'abord cette réponse :

Une fois la demande terminée (statut : terminée), vous pourrez obtenir le résultat avec cette impression :

Avantages de l'utilisation Parole-texte API avec Eden AI
Comme vous pouvez le constater, l'utilisation de Speech-to-Text avec l'API Eden AI est simple et rapide.

Économisez du temps et de l'argent
Nous proposons une API unifiée pour tous les fournisseurs : simple et standard à utiliser, avec un changement rapide d'un fournisseur à l'autre et un accès aux fonctionnalités spécifiques de chaque fournisseur.
Facile à intégrer
Le format de sortie JSON est le même pour tous les fournisseurs grâce au travail de standardisation d'Eden AI. Les éléments de réponse sont également standardisés grâce aux puissants algorithmes de correspondance d'Eden AI.
Personnalisation
Avec Eden AI, vous avez la possibilité d'intégrer une plateforme tierce : nous pouvons développer rapidement des connecteurs. Pour aller plus loin et personnaliser votre requête Speech-to-Text avec des paramètres spécifiques, consultez notre documentation.
.avif)

.avif)
.avif)