Bienvenue dans notre didacticiel complet sur la génération de voix à partir de texte à l'aide de l'IA et de Python ! Que vous souhaitiez créer un assistant virtuel, créer du contenu audio ou explorer les possibilités de la synthèse vocale pilotée par l'IA, ce didacticiel vous fournira les connaissances et les outils dont vous avez besoin.
Synthèse vocale (TTS), également connue sous le nom de génération vocale, est une technologie qui convertit le texte écrit en mots parlés. Grâce à des algorithmes avancés et à l'apprentissage automatique, les systèmes TTS peuvent lire le texte à haute voix avec une voix naturelle. Cette technologie a de nombreuses applications, qu'il s'agisse d'aider les personnes malvoyantes ou de permettre une interaction mains libres avec des appareils numériques.
Applications de la synthèse vocale
Accessibilité: Le TTS est largement utilisé pour aider les personnes malvoyantes ou ayant des difficultés de lecture, en leur fournissant des versions audio de contenus écrits.
Assistants virtuels: les assistants numériques tels que Siri, Alexa et Google Assistant utilisent le TTS pour interagir avec les utilisateurs.
Création de contenu: Le TTS peut être utilisé pour générer des versions audio d'articles, de livres et d'autres contenus textuels.
Service à la clientèle: Les systèmes téléphoniques automatisés et les chatbots utilisent souvent le TTS pour fournir des informations et une assistance aux clients.
Comment générer une voix à partir d'un texte ?
Étape 1 : Configurez votre compte Eden AI
1. INSCRIVEZ-VOUS: Si vous n'avez pas de compte Eden AI, créez-en un gratuitement en utilisant ce qui suit lien.
2. Accédez à Speech Technologies: Une fois connecté, accédez à la section vocale de la plateforme.
3. Sélectionnez Synthèse vocale: choisissez la fonction de synthèse vocale. Vous pouvez également explorer la synthèse vocale asynchrone en fonction de vos besoins.
Étape 2 : Testez en direct les modèles TTS sur Eden AI
Choisissez les fournisseurs: faites défiler la page vers le bas pour voir les différents fournisseurs sur le côté droit et la section des tests en direct en bas de page.
Configurer les paramètres: Sélectionnez votre langue préférée et le sexe du locuteur (homme ou femme).
Texte d'entrée: Entrez un exemple de texte, par exemple : « Bonjour, je suis assistant. Comment puis-je t'aider ? »
Téléchargez ou visualisez: Lancez le test et téléchargez les fichiers audio ou visualisez les résultats.
Étape 3 : Implémentation de la synthèse vocale en Python
Maintenant, implémentons cela en Python. Nous allons vous montrer comment jouer synthèse synchrone de la synthèse vocale et de manière asynchrone.
Synchronisation synchrone de la synthèse vocale
1. Installation des bibliothèques requises: Assurez-vous que les bibliothèques nécessaires sont installées. Utiliser demandes pour effectuer des appels d'API.
requêtes d'installation pip
2. Exemple de code
import requests
import base64
API_KEY = 'YOUR_EDEN_AI_API_KEY'
ENDPOINT = 'https://api.edenai.run/v2/audio/text_to_speech'
headers = {
'Authorization': f'Bearer {API_KEY}',
'Content-Type': 'application/json'
}
data = {
'providers': 'openai',
'language': 'en-US',
'text': "Hi, how can I help you?"
}
response = requests.post(ENDPOINT, headers=headers, json=data)
if response.status_code == 200:
result = response.json()
audio_base64 = result'openai''audio'
audio_data = base64.b64decode(audio_base64)
with open('output.wav', 'wb') as audio_file:
audio_file.write(audio_data)
print("Audio saved as output.wav")
else:
print(f"Error: {response.status_code}")
3. Explication:
Ce script envoie une requête POST au point de terminaison de l'API Eden AI avec votre clé d'API.
La réponse contient l'audio au format Base64, que nous décodons et enregistrons au format .wav dossier.
Synthèse vocale asynchrone
1. Exemple de code:
import requests
import time
API_KEY = 'YOUR_EDEN_AI_API_KEY'
ENDPOINT = 'https://api.edenai.run/v2/audio/text_to_speech_async'
headers = {
'Authorization': f'Bearer {API_KEY}',
'Content-Type': 'application/json'
}
data = {
'providers': 'openai',
'language': 'en-US',
'text': "Hi, how could I help you?"
}
# Initiate the job
response = requests.post(ENDPOINT, headers=headers, json=data)
if response.status_code == 200:
job_id = response.json()['job_id']
# Polling the job status
status_endpoint = f'{ENDPOINT}/{job_id}'
while True:
status_response = requests.get(status_endpoint, headers=headers)
if status_response.status_code == 200:
status_data = status_response.json()
if status_data['status'] == 'completed':
audio_url = status_data['result']['audio_url']
break
else:
print("Waiting for the job to complete...")
time.sleep(5) # Wait for 5 seconds before checking again
else:
print(f"Error: {status_response.status_code}")
break
# Download the audio file
audio_response = requests.get(audio_url)
with open('output_async.wav', 'wb') as audio_file:
audio_file.write(audio_response.content)
print("Asynchronous audio saved as output_async.wav")
else:
print(f"Error: {response.status_code}")
2. Explication:
Ce script lance une tâche de synthèse vocale asynchrone et récupère l'ID de la tâche.
Il interroge ensuite périodiquement l'état de la tâche jusqu'à ce que celle-ci soit terminée.
Une fois terminé, il télécharge le fichier audio à l'aide de l'URL fournie.
Conclusion
Vous avez maintenant appris à utiliser Eden AI pour générer de la voix à partir de texte de manière synchrone et asynchrone à l'aide de Python. Ce puissant outil vous permet de créer des flux de travail d'IA qui intègrent les meilleurs modèles de synthèse vocale.
N'hésitez pas à essayer différents fournisseurs et paramètres pour trouver celui qui répond le mieux à vos besoins. Bon codage !
Avantages de l'utilisation de l'API unique d'Eden AI
L'utilisation de l'API Eden AI est simple et rapide.
Économisez du temps et de l'argent
Nous proposons une API unifiée pour tous les fournisseurs : simple et standard à utiliser, avec un switch rapide qui vous permet d'accéder très facilement à toutes les fonctionnalités spécifiques (diarisation, horodatage, filtre de bruit, etc.).
Facile à intégrer
Le format de sortie JSON est le même pour tous les fournisseurs grâce au travail de standardisation d'Eden AI. Les éléments de réponse sont également standardisés grâce aux puissants algorithmes de correspondance d'Eden AI.
Personnalisation
Avec Eden AI, vous pouvez intégrer une plateforme tierce : nous pouvons développer rapidement des connecteurs. Pour aller plus loin et personnaliser votre demande d'API avec des paramètres spécifiques, consultez notre documentation.
Prochaine étape de votre projet
L'équipe d'Eden AI peut vous aider dans votre projet d'intégration d'Image Similarity Search. Cela peut être fait en :
Organisation d'une démonstration du produit et d'une discussion pour mieux comprendre vos besoins. Vous pouvez réserver un créneau horaire sur ce lien : Contacter
En testant gratuitement la version publique d'Eden AI : toutefois, tous les fournisseurs ne sont pas disponibles sur cette version. Certains ne sont disponibles que sur la version Enterprise.
En bénéficiant du soutien et des conseils d'une équipe d'experts pour trouver la combinaison optimale de prestataires en fonction des spécificités de vos besoins
Possibilité d'intégration sur une plateforme tierce : nous pouvons développer rapidement des connecteurs.