
Commencez votre aventure avec l’IA dès aujourd’hui
- Accédez à plus de 100 API d’IA sur une seule plateforme.
- Comparez et déployez des modèles d’IA en toute simplicité.
- Paiement à l’usage, sans frais initiaux.
Nous sommes heureux d'annoncer que Gladia's API de synthèse vocale la technologie a été intégrée à l'API Eden AI.
Jean-Louis Quéguiner a fondé Gladia à Paris, en France, en 2022 pour démocratiser les outils d'IA de pointe pour les développeurs. L'entreprise a élargi son champ d'action pour remédier à la sous-utilisation de jusqu'à 90 % des données audio des entreprises.
La plateforme de Gladia fournit divers outils d'intelligence artificielle, notamment la transcription de la parole en texte (asynchrone et en direct) et des informations audio telles que la traduction, la séparation des locuteurs, etc. Ces fonctionnalités permettent aux développeurs de logiciels de trouver des modèles d'API d'IA adaptés à leurs besoins spécifiques.
En collaborant actuellement avec des centres d'appels, des services de réunions virtuelles et des éditeurs de vidéos tels que Claap, Livestorm et Selectra, Gladia a levé 4 millions de dollars en financement de démarrage dirigé par New Wave. Leurs objectifs futurs incluent la synthèse et la chapterisation.
Eden AI propose les solutions Speech-to-Text de Gladia sur sa plateforme, parmi plusieurs autres Technologies de reconnaissance vocale automatique. Nous voulons que nos utilisateurs aient accès à plusieurs moteurs d'IA et les gèrent en un seul endroit afin qu'ils puissent atteindre des performances élevées, optimiser les coûts et couvrir tous leurs besoins.
Il existe de nombreuses raisons d'utiliser plusieurs API d'IA :
Vous devez configurer une API d'IA qui est demandée si et seulement si l'API d'IA principale ne fonctionne pas correctement (ou est en panne). Vous pouvez utiliser le score de confiance renvoyé ou d'autres méthodes pour vérifier l'exactitude du fournisseur.
Après la phase de test, vous serez en mesure de créer une cartographie des performances des fournisseurs d'IA en fonction des critères que vous avez choisis. Chaque donnée que vous devez traiter sera ensuite envoyée à la meilleure API.
Cette méthode vous permet de choisir le fournisseur le moins cher qui fonctionne le mieux pour vos données. Imaginons que vous choisissiez l'API Google Cloud pour le client « A » car elles sont toutes performantes et c'est la moins chère. Vous choisirez ensuite Microsoft Azure pour le client « B », une API plus onéreuse mais les performances de Google ne sont pas satisfaisantes pour le client « B ». (il s'agit d'un exemple aléatoire)
Cette approche est requise si vous recherchez une précision extrêmement élevée. Cette combinaison entraîne des coûts plus élevés mais permet à votre service d'IA d'être sûr et précis, car les API d'IA se valideront et s'invalideront mutuellement pour chaque élément de données.
Nous avons eu la chance de nous entretenir avec Anna Jelezovskaia, responsable marketing de Gladia, qui a accepté de répondre à certaines de nos questions :
Fondée en 2022 par Jean-Louis Quéguiner (ancien vice-président de l'IA chez OVHcloud) et Jonathan Soto (ancien vice-président de l'ingénierie chez Sigfox), la mission de Gladia était de mettre l'IA la plus avancée à la disposition de tous les développeurs. Depuis lors, notre API a évolué pour devenir un produit d'IA linguistique de niveau professionnel, permettant la transcription parole-texte (asynchrone et en temps réel) et l'intelligence audio (traduction, séparation des locuteurs, etc.).
Nous travaillons actuellement sur une série de fonctionnalités d'intelligence audio, notamment la synthèse et l'analyse des sentiments.
Chez Gladia, nous proposons une API prête à l'emploi unique, qui débloque toute une gamme de fonctionnalités de transcription et d'analyse audio et vidéo pour aider les entreprises à exploiter pleinement le potentiel inexploité de leurs données non structurées.
Voici quelques facteurs qui nous distinguent :
1. Performances de haut niveau : Nous fournissons une précision de transcription quasiment sans erreur sans compromettre la vitesse (1h audio <60 secondes) tout en restant l'un des fournisseurs d'API les plus abordables du marché.
2. Fonctionnalités multilingues : Contrairement à tout autre fournisseur sur le marché, l'API prend déjà en charge 99 langues pour la transcription, la diarisation des locuteurs et la traduction. Toutes nos fonctionnalités sont conçues pour être entièrement multilingues.
3. Sécurité : Nous prenons très au sérieux la confidentialité de nos clients. Notre hébergement de données est entièrement conforme au RGPD.
4. Évolutivité : Une tarification flexible à l'utilisation qui permet d'augmenter facilement les volumes de transcription.
Notre API est adaptée aux cas d'utilisation les plus demandés, tels que la traduction et l'analyse de réunions virtuelles, la transcription de podcasts, le sous-titrage de vidéos, ainsi que l'assistance des centres d'appels. Nos clients proviennent des secteurs des médias, du SaaS et des centres d'appels correspondants, notamment Livestorm, Selectra, Musixmatch et Claap.
Actuellement, jusqu'à 90 % des données audio des entreprises sont perdues ou inutilisées en raison du manque d'outils de transcription et d'intelligence audio abordables et de haute qualité. Notre API aide nos clients à mieux comprendre leurs données audio et vidéo et à intégrer de nouvelles fonctionnalités à leurs applications afin d'améliorer l'expérience utilisateur et la fidélisation. Cela peut également aider à la création de contenu et au référencement, entre autres.
Eden AI est un partenaire clé pour Gladia, étant la ressource #1 permettant aux développeurs d'accéder aux modèles d'IA les plus avancés. L'équipe de Gladia a rapidement identifié Eden AI comme étant le bon endroit à intégrer. Le partenariat avec l'équipe a été très simple, avec une intégration à la vitesse de l'éclair.
Tous les utilisateurs d'Eden AI peuvent désormais tirer parti de la transcription de Gladia, et nous sommes très fiers de faire désormais partie du paysage. Gladia souhaite participer à la mission Eden AI, qui vise à accélérer l'adoption de l'IA au sein des entreprises.
Nous avons de nombreuses sorties super excitantes à venir cet automne. Nous allons étendre notre support leader du marché pour la transcription dans 99 langues à la traduction, permettant à nos utilisateurs de transcrire des fichiers audio de n'importe quelle langue vers n'importe quelle langue.
Nous proposerons ensuite un ensemble de modules complémentaires d'intelligence audio, tels que la synthèse et la chapterisation, tous entièrement multilingues. Notre objectif est de fournir une API véritablement mondiale adaptée à une variété de cas d'utilisation réels et à des environnements complexes. Il existe actuellement un réel besoin de solutions d'IA polyvalentes. Le volume de données non structurées augmentant de façon exponentielle, il est également nécessaire de disposer d'outils optimisés pour en extraire des informations exploitables. Nous nous concentrons initialement sur l'audio, en raison de l'énorme problème de « données obscures » mentionné précédemment, mais à long terme, nous prévoyons de nous étendre à d'autres sources de données.
Il vous en faudra documentation pour utiliser les technologies vocales de Gladia sur Eden AI. Ensuite, appelez l'API :
Eden AI représente l'avenir de l'utilisation de l'IA dans les entreprises. Notre plateforme vous permet non seulement d'appeler plusieurs API d'IA, mais vous offre également :
Vous pouvez consulter la documentation d'Eden AI ici.
Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !
CommencezContactez le service commercial