Comparatifs d'IA

API d'analyse des sentiments ou classification de texte personnalisée : laquelle choisir ?

L'analyse des sentiments (ou exploration d'opinions) est une technique de traitement du langage naturel utilisée pour déterminer si les données sont...

TABLE DES MATIÈRES

Text Link

Dans cet article, nous allons comparer les performances d'extraction des sentiments entre les moteurs d'analyse des sentiments et les moteurs de classification des textes personnalisés. L'idée est de montrer les avantages et les inconvénients de ces deux types de moteurs sur un jeu de données concret.

Définitions :

L'analyse des sentiments (ou exploration d'opinions) est une technique de traitement du langage naturel utilisée pour déterminer si les données sont positives, négatives ou neutres. L'analyse des sentiments est souvent réalisée sur des données textuelles pour aider les entreprises à suivre l'opinion des clients sur la marque et le produit dans les commentaires des clients et à comprendre leurs besoins.

La classification de texte est une technique d'apprentissage automatique qui attribue un ensemble de catégories prédéfinies à un ensemble de textes. Les classificateurs de texte peuvent être utilisés pour organiser, structurer et classer à peu près n'importe quel type de texte. Il doit être entraîné à l'aide d'un ensemble de textes étiquetés.

Les moteurs d'analyse des sentiments sont des moteurs entraînés, tandis que les moteurs de classification de texte personnalisés sont des moteurs « AutoML » (Automated Machine Learning).

Il est très important de faire la distinction entre les API entraînées et les API AutoML :

Les API entraînées sont basées sur des modèles déjà entraînés par les fournisseurs à l'aide de leurs bases de données. Ces modèles sont généralement utilisés pour gérer des cas d'utilisation courants tels que : l'analyse des sentiments, la reconnaissance d'entités nommées, la traduction, etc. Cependant, il est toujours pertinent d'essayer ces API avant les modèles personnalisés car elles sont de plus en plus compétitives et efficaces.
Pour des cas d'utilisation spécifiques nécessitant une très haute précision, il peut être préférable d'utiliser les API AutoML. Ces API sont fournies par plusieurs fournisseurs tels que Google Cloud Platform, Amazon Web Services, Microsoft Azure, IBM Watson et bien d'autres. Les API AutoML permettent aux utilisateurs de créer leur propre modèle personnalisé, formé sur la base de données de l'utilisateur. Ces modèles sont préalablement entraînés sur plusieurs ensembles de données par les fournisseurs.

Cet article compare les API Trained Sentiment déjà utilisées et les API de classification de texte personnalisées. L'objectif est de vous donner un aperçu de ce qu'il faut choisir en fonction du prix, des performances, de l'intégration, etc.

Prestataires :

Au cours de notre étude, nous avons utilisé différents moteurs d'analyse des sentiments et de classification de texte personnalisée. Pour accéder facilement à ces moteurs, nous avons utilisé Eden AI qui centralise plusieurs moteurs NLP provenant de différents fournisseurs.

Pour l'analyse des sentiments, nous avons utilisé :

Pour la classification de texte personnalisée, nous avons utilisé :

C'est l'attraction des API des fournisseurs que nous avons testées. Il est intéressant de noter qu'il existe de nombreuses autres solutions propriétaires et open source. On peut citer Singe Learn, Deux mots, Connexun, etc.

Cas d'utilisation :

Comme indiqué précédemment, l'analyse des sentiments est utilisée dans des centaines de domaines, pour de nombreux cas d'utilisation. Dans cet article, nous avons choisi un cas d'utilisation très courant :

Vous êtes une entreprise qui souhaite extraire des tweets sur notre support et nos produits. Vous souhaitez extraire le sentiment de ces tweets afin d'analyser les commentaires négatifs et d'améliorer nos services.

Pour illustrer ce cas d'utilisation, la comparaison a été réalisée sur ce jeu de données Kaggle : https://www.kaggle.com/sureshmecad/identify-the-sentiments-analytics-vidhya?select=train.csv

Nous conservons les 1000 dernières lignes de l'ensemble de données d'entraînement en tant que jeu de données de test pour comparer les prévisions issues de l'analyse des sentiments et des moteurs de classification de texte personnalisés. Le reste de l'ensemble de données est utilisé pour entraîner des moteurs de classification de texte personnalisés.

Épreuves :

Classification de texte personnalisée

Tout d'abord, nous avons commencé à former des modèles de classification de texte personnalisés avec les moteurs Google Cloud et AWS. Nous avons utilisé directement le Eden AI plateforme qui nous permet d'entraîner à la fois les modèles GCP et AWS sur une plateforme unique :

Eden AI : créer un projet de classification de texte personnalisé

Eden AI : importation de données pour une classification de texte personnalisée

La création est très simple, il suffit de sélectionner la langue, le type de classification et d'importer notre jeu de données. Une fois le projet créé, nous pouvons entraîner les moteurs GCP et AWS :

Eden AI : modèles de classification de texte personnalisés entraînés

Une fois les modèles entraînés, vous pouvez générer des prédictions directement depuis la plateforme à l'aide de notre ensemble de données de test :

Eden AI : prédiction de classification de texte personnalisée

API d'analyse des sentiments

Pour la prédiction à l'aide d'API d'analyse des sentiments entraînées, nous utilisons Kit de développement logiciel Eden AI Python. Il nous permet d'utiliser un script unique pour générer des prévisions avec les moteurs GCP, AWS et Azure :

Le code est le même pour les moteurs AWS et Azure, nous avons juste dû changer le paramètre « provider » en « amazon » et « microsoft ».

Représentations :

Voici la précision de nos formations, il ne s'agit que d'une métrique indicative :

Eden AI : métrique des modèles de classification de texte personnalisés

Maintenant, nous générons des prédictions avec notre ensemble de données de test (1000 prédictions) et nous calculons la précision.

Après avoir obtenu des performances pour la classification personnalisée des textes, nous répétons la même opération pour les moteurs d'analyse des sentiments.

Les moteurs AWS et Azure utilisent des pourcentages pour les valeurs positives, négatives et neutres (équivalent à une valeur mixte pour AWS). Nous montrons donc ici les résultats lorsque nous conservons des prédictions et des résultats « neutres » et « mixtes » sans les conserver :

Précision (plus de 1000 prédictions par lot) :

Classification personnalisée des textes et performances d'analyse des sentiments

Tarification :

La tarification entre les API d'analyse des sentiments et la classification de texte personnalisée est très différente. En fait, pour les API d'analyse des sentiments, vous ne paierez que pour les inférences que vous faites (base de tarification des caractères), alors que pour la classification de texte personnalisée, vous devrez payer pour la formation du modèle, le déployer et effectuer des inférences.

Voici les tarifs :

Analyse des sentiments :

Tarification de l'analyse des sentiments pour GCP, AWS et Azure

Il s'agit des prix correspondant à la limite de consommation la plus basse. Avec des volumes plus élevés, vous pouvez obtenir de meilleurs prix.

Classification de texte personnalisée

Tarification de classification de texte personnalisée pour GCP et AWS

Le prix de l'inférence est de 1 dollar par million de caractères pour l'analyse des sentiments et de 5 dollars par million de caractères pour la classification personnalisée des textes.

L'API d'analyse des sentiments est 5 fois moins chère que la classification de texte personnalisée, sans tenir compte des coûts de formation et de déploiement.

Conclusion :

Les deux solutions sont viables. Le choix entre l'API d'analyse des sentiments et la classification de texte personnalisée doit être fait en fonction des performances attendues et du budget alloué. Vous pouvez certainement obtenir de meilleures performances grâce à la classification de texte personnalisée, mais les performances d'analyse des sentiments restent acceptables. Comme le montre l'article, l'analyse des sentiments est beaucoup moins chère que la classification de texte personnalisée.

Pour conclure, nous pouvons vous conseiller d'essayer d'abord l'analyse des sentiments et d'utiliser une classification de texte personnalisée si vous souhaitez obtenir une meilleure précision.

‍

Créez votre compte sur Eden AI

Articles connexes

Science

Qu'est-ce qu'un ingénieur en IA ?

Un ingénieur en IA est un spécialiste du génie logiciel qui se concentre sur la création, le déploiement et la maintenance de systèmes d'IA en production. Ils font le lien entre la science des données et le développement de logiciels, en garantissant que les modèles d'apprentissage automatique sont évolutifs, fiables et intégrés aux applications. Ce rôle nécessite une base solide en génie logiciel, en MLOps et en infrastructure cloud.

Science

How to Automate AI Model Selection in Production: A Practical Guide

Déployer des modèles d'IA en production ne se limite pas à choisir le meilleur. Il s'agit de sélectionner en permanence celui qui convient à chaque cas d'utilisation, à chaque contexte et à chaque contrainte de coût. Cet article explore des moyens pratiques d'automatiser la sélection de modèles à l'aide de la surveillance des performances, de la logique de routage et d'outils tels que l'API unifiée d'Eden AI pour l'optimisation dynamique.

Science

OpenAI, Anthropic, Mistral : quel modèle d'IA fonctionne le mieux pour votre cas d'utilisation ?

Choisir entre OpenAI, Anthropic et Mistral peut s'avérer difficile pour les développeurs et les équipes produit. Chaque modèle excelle dans différents domaines, qu'il s'agisse du raisonnement, de la créativité, de la rapidité ou de la rentabilité. Cet article compare leurs points forts, aborde les principaux indicateurs d'évaluation et montre comment une approche multimodèle basée sur Eden AI vous permet de tirer le meilleur parti de chaque fournisseur sans intégration complexe.

Essayez Eden AI dès maintenant.

Vous pouvez commencer à construire tout de suite. Si vous avez des questions, n'hésitez pas à discuter avec nous !

Commencez Contactez le service commercial

API d'analyse des sentiments ou classification de texte personnalisée : laquelle choisir ?

Définitions :

Prestataires :

Cas d'utilisation :

Épreuves :

Représentations :

Tarification :

Conclusion :

Articles connexes

Qu'est-ce qu'un ingénieur en IA ?

How to Automate AI Model Selection in Production: A Practical Guide

OpenAI, Anthropic, Mistral : quel modèle d'IA fonctionne le mieux pour votre cas d'utilisation ?

Essayez Eden AI dès maintenant.

Plateforme

solutions

Ressources

L'entreprise

API d'analyse des sentiments ou classification de texte personnalisée : laquelle choisir ?

Définitions :

Prestataires :

Cas d'utilisation :

Épreuves :

Représentations :

Tarification :

Conclusion :

Commencez votre aventure avec l’IA dès aujourd’hui

Articles connexes

Qu'est-ce qu'un ingénieur en IA ?

How to Automate AI Model Selection in Production: A Practical Guide

OpenAI, Anthropic, Mistral : quel modèle d'IA fonctionne le mieux pour votre cas d'utilisation ?

Essayez Eden AI dès maintenant.

Plateforme

solutions

Ressources

L'entreprise

Commencez votre parcours IA dès aujourd'hui!

Commencez votre parcours IA dès aujourd'hui!