Tutoriel

VIDÉO | Comment générer de la voix (synthèse vocale) à l'aide de Python

TABLE DES MATIÈRES

Bienvenue dans notre didacticiel complet sur la génération de voix à partir de texte à l'aide de l'IA et de Python ! Que vous souhaitiez créer un assistant virtuel, créer du contenu audio ou explorer les possibilités de la synthèse vocale pilotée par l'IA, ce didacticiel vous fournira les connaissances et les outils dont vous avez besoin.

‍

Qu'est-ce que Synthèse vocale (génération vocale)?

‍

Synthèse vocale (TTS), également connue sous le nom de génération vocale, est une technologie qui convertit le texte écrit en mots parlés. Grâce à des algorithmes avancés et à l'apprentissage automatique, les systèmes TTS peuvent lire le texte à haute voix avec une voix naturelle. Cette technologie a de nombreuses applications, qu'il s'agisse d'aider les personnes malvoyantes ou de permettre une interaction mains libres avec des appareils numériques.

‍

Applications de la synthèse vocale

Accessibilité: Le TTS est largement utilisé pour aider les personnes malvoyantes ou ayant des difficultés de lecture, en leur fournissant des versions audio de contenus écrits.
Assistants virtuels: les assistants numériques tels que Siri, Alexa et Google Assistant utilisent le TTS pour interagir avec les utilisateurs.
Création de contenu: Le TTS peut être utilisé pour générer des versions audio d'articles, de livres et d'autres contenus textuels.
Service à la clientèle: Les systèmes téléphoniques automatisés et les chatbots utilisent souvent le TTS pour fournir des informations et une assistance aux clients.

‍

Comment générer une voix à partir d'un texte ?

‍

Étape 1 : Configurez votre compte Eden AI

‍

1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement en utilisant ce qui suit lien.

2. Accédez à Speech Technologies: Une fois connecté, accédez à la section vocale de la plateforme.

3. Sélectionnez Synthèse vocale: choisissez la fonction de synthèse vocale. Vous pouvez également explorer la synthèse vocale asynchrone en fonction de vos besoins.

‍

Étape 2 : Testez en direct les modèles TTS sur Eden AI

Choisissez les fournisseurs: faites défiler la page vers le bas pour voir les différents fournisseurs sur le côté droit et la section des tests en direct en bas de page.
Configurer les paramètres: Sélectionnez votre langue préférée et le sexe du locuteur (homme ou femme).
Texte d'entrée: Entrez un exemple de texte, par exemple : « Bonjour, je suis assistant. Comment puis-je t'aider ? »
Téléchargez ou visualisez: Lancez le test et téléchargez les fichiers audio ou visualisez les résultats.

‍

Étape 3 : Implémentation de la synthèse vocale en Python

Maintenant, implémentons cela en Python. Nous allons vous montrer comment jouer synthèse synchrone de la synthèse vocale et de manière asynchrone.

‍

Synchronisation synchrone de la synthèse vocale

‍

1. Installation des bibliothèques requises: Assurez-vous que les bibliothèques nécessaires sont installées. Utiliser demandes pour effectuer des appels d'API.

requêtes d'installation pip

‍

2. Exemple de code‍


import requests
import base64

API_KEY = 'YOUR_EDEN_AI_API_KEY'
ENDPOINT = 'https://api.edenai.run/v2/audio/text_to_speech'

headers = {
		'Authorization': f'Bearer {API_KEY}',
    'Content-Type': 'application/json'
}

data = {
		'providers': 'openai',
    'language': 'en-US',
    'text': "Hi, how can I help you?"
    }

response = requests.post(ENDPOINT, headers=headers, json=data)

if response.status_code == 200:
		result = response.json()
    audio_base64 = result'openai''audio'
    audio_data = base64.b64decode(audio_base64)
    
    with open('output.wav', 'wb') as audio_file:
    		audio_file.write(audio_data)
    print("Audio saved as output.wav")
else:
		print(f"Error: {response.status_code}")

‍

‍3. Explication:

Ce script envoie une requête POST au point de terminaison de l'API Eden AI avec votre clé d'API.
La réponse contient l'audio au format Base64, que nous décodons et enregistrons au format .wav dossier.

‍

Synthèse vocale asynchrone

‍

1. Exemple de code:


import requests
import time

API_KEY = 'YOUR_EDEN_AI_API_KEY'
ENDPOINT = 'https://api.edenai.run/v2/audio/text_to_speech_async'

headers = {
    'Authorization': f'Bearer {API_KEY}',
    'Content-Type': 'application/json'
}

data = {
    'providers': 'openai',
    'language': 'en-US',
    'text': "Hi, how could I help you?"
}

# Initiate the job
response = requests.post(ENDPOINT, headers=headers, json=data)

if response.status_code == 200:
    job_id = response.json()['job_id']
    
    # Polling the job status
    status_endpoint = f'{ENDPOINT}/{job_id}'
    while True:
        status_response = requests.get(status_endpoint, headers=headers)
        if status_response.status_code == 200:
            status_data = status_response.json()
            if status_data['status'] == 'completed':
                audio_url = status_data['result']['audio_url']
                break
            else:
                print("Waiting for the job to complete...")
                time.sleep(5)  # Wait for 5 seconds before checking again
        else:
            print(f"Error: {status_response.status_code}")
            break

    # Download the audio file
    audio_response = requests.get(audio_url)
    with open('output_async.wav', 'wb') as audio_file:
        audio_file.write(audio_response.content)
    print("Asynchronous audio saved as output_async.wav")
else:
    print(f"Error: {response.status_code}")

‍‍

‍2. Explication:

Ce script lance une tâche de synthèse vocale asynchrone et récupère l'ID de la tâche.
Il interroge ensuite périodiquement l'état de la tâche jusqu'à ce que celle-ci soit terminée.
Une fois terminé, il télécharge le fichier audio à l'aide de l'URL fournie.

‍

Conclusion

Vous avez maintenant appris à utiliser Eden AI pour générer de la voix à partir de texte de manière synchrone et asynchrone à l'aide de Python. Ce puissant outil vous permet de créer des flux de travail d'IA qui intègrent les meilleurs modèles de synthèse vocale.

N'hésitez pas à essayer différents fournisseurs et paramètres pour trouver celui qui répond le mieux à vos besoins. Bon codage !

‍

Avantages de l'utilisation de l'API unique d'Eden AI

L'utilisation de l'API Eden AI est simple et rapide.

‍

Économisez du temps et de l'argent

Nous proposons une API unifiée pour tous les fournisseurs : simple et standard à utiliser, avec un switch rapide qui vous permet d'accéder très facilement à toutes les fonctionnalités spécifiques (diarisation, horodatage, filtre de bruit, etc.).

‍

Facile à intégrer

Le format de sortie JSON est le même pour tous les fournisseurs grâce au travail de standardisation d'Eden AI. Les éléments de réponse sont également standardisés grâce aux puissants algorithmes de correspondance d'Eden AI.

‍

Personnalisation

Avec Eden AI, vous pouvez intégrer une plateforme tierce : nous pouvons développer rapidement des connecteurs. Pour aller plus loin et personnaliser votre demande d'API avec des paramètres spécifiques, consultez notre documentation.

‍

Prochaine étape de votre projet

L'équipe d'Eden AI peut vous aider dans votre projet d'intégration d'Image Similarity Search. Cela peut être fait en :

‍

Organisation d'une démonstration du produit et d'une discussion pour mieux comprendre vos besoins. Vous pouvez réserver un créneau horaire sur ce lien : Contacter
En testant gratuitement la version publique d'Eden AI : toutefois, tous les fournisseurs ne sont pas disponibles sur cette version. Certains ne sont disponibles que sur la version Enterprise.
En bénéficiant du soutien et des conseils d'une équipe d'experts pour trouver la combinaison optimale de prestataires en fonction des spécificités de vos besoins
Possibilité d'intégration sur une plateforme tierce : nous pouvons développer rapidement des connecteurs.

‍

Créez votre compte sur Eden AI

Articles connexes

Tutoriel

Comment générer des intégrations de texte à l'aide de Python

Un guide rapide pour créer des intégrations de texte avec Python et Eden AI. Comprend la configuration, un exemple de code et une explication de sortie pour les utilisations courantes de la PNL.

Tutoriel

Comment générer des intégrations d'images à l'aide de JavaScript

Ce guide explique comment générer des intégrations d'images à l'aide de JavaScript et d'Axios avec l'API Eden AI. Il aborde l'importance de l'intégration d'images, explique comment obtenir une clé API, configurer votre code, envoyer des demandes et interpréter les résultats, ce qui facilite l'intégration de la compréhension des images basée sur l'IA dans vos applications.

Tutoriel

Comment générer des intégrations d'images à l'aide de Python

Cet article fournit un guide étape par étape sur la façon de générer des intégrations d'images à l'aide de l'API Eden AI en Python. Il explique le concept et l'importance des intégrations d'images, montre comment démarrer avec Eden AI et décrit le code Python pour obtenir des intégrations à partir d'un exemple d'image à l'aide d'une API unifiée.

Essayez Eden AI gratuitement.

Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !

Commencez Contactez le service commercial

VIDÉO | Comment générer de la voix (synthèse vocale) à l'aide de Python

Qu'est-ce que Synthèse vocale (génération vocale)?

Applications de la synthèse vocale

Comment générer une voix à partir d'un texte ?

Étape 1 : Configurez votre compte Eden AI

Étape 2 : Testez en direct les modèles TTS sur Eden AI