
Commencez votre aventure avec l’IA dès aujourd’hui
- Accédez à plus de 100 API d’IA sur une seule plateforme.
- Comparez et déployez des modèles d’IA en toute simplicité.
- Paiement à l’usage, sans frais initiaux.
Dans cet article, nous testons plusieurs API de reconnaissance faciale pré-entraînées. Nous testons ces solutions sur différents cas d'utilisation pertinents.
Ces dernières années, dans le monde de l'intelligence artificielle, l'une des applications les plus populaires est la vision par ordinateur. Cette popularité est due à la grande diversité des applications et des besoins : imagerie médicale, industrie, transport, surveillance, sécurité, etc. De nos jours, tous les domaines utilisent des caméras et des images dans leurs activités.
La vision par ordinateur inclut diverses fonctionnalités :
Ce tableau ne constitue pas une liste exhaustive de toutes les fonctionnalités de vision par ordinateur. De nombreuses solutions reposent sur la combinaison de plusieurs fonctionnalités.
Il est très important de faire la distinction entre les API pré-entraînées et les API AutoML :
Cet article traite brièvement des API de reconnaissance faciale pré-entraînées. L'objectif est d'indiquer quels problèmes peuvent être résolus avec ce type d'API. Quels sont les principaux fournisseurs du marché ? Quel est le processus optimal lors de l'utilisation d'API pré-entraînées ?
Au cours de notre étude sur les API pré-entraînées pour la reconnaissance faciale, nous avons décidé de choisir 5 fournisseurs d'API offrant des performances élevées, selon de nombreux articles de blog et classements.
C'est l'attraction des API des fournisseurs que nous allons tester. Il est intéressant de noter que d'autres solutions existent et que des solutions open source existent. On peut citer ChooChai, Facex, Clarifai, Eyedea, Sightcorp, Eyerecognize, Ayonix, Microsoft Azure, etc.
Comme indiqué précédemment, les API de détection de visages sont utilisées dans des centaines de domaines, pour de nombreux cas d'utilisation. Dans cet article, nous allons tester différentes API de reconnaissance faciale avec différents types d'images représentant des cas d'utilisation courants.
Nous avons choisi 3 cas d'utilisation issus de différents domaines, représentés par 3 images, et nous analysons ces fonctionnalités :
Les attributs du visage dépendent des prestataires, il peut s'agir de l'âge, du sexe, du sourire, des lunettes, des émotions, de l'origine ethnique, etc.
Pour chaque cas d'utilisation, nous avons testé l'API de détection des visages des 5 fournisseurs, avec une image par cas d'utilisation. Bien entendu, pour un projet réel, vous devrez effectuer des tests sur une partie représentative de votre base de données (et non sur une seule image) pour avoir une vision correcte des différentes performances.
Plutôt que de comparer les résultats de différentes API, Eden AI fournit la fonctionnalité Genius. Cette fonctionnalité renvoie une combinaison intelligente de tous les résultats. Pour nos exemples, nous allons voir ce que nous pouvons obtenir avec ce résultat combiné.
La réponse de l'API n'est qu'une réponse textuelle. Cette réponse (souvent au format json) sera utilisée pour développer des applications. Pour notre exemple, la façon de procéder est la suivante :
1- API de détection et d'analyse des visages de référence disponibles sur le marché
2- Choisissez le fournisseur d'API qui correspond le mieux à votre projet OU combinez les résultats des API de plusieurs fournisseurs
3- Intégrez l'API finale dans votre projet/logiciel
Enfin, selon le projet, les résultats visuels avec des cadres de délimitation imprimés sur les images peuvent être utiles ou non. Mais pour le benchmark, c'est le moyen le plus efficace et le plus rapide de trouver et de visualiser les performances.
Google, BetaFaceAPI, AWS et Face++ fournissent une API pour de multiples fonctionnalités de vision par ordinateur. Ils fournissent également une interface graphique uniquement pour tester et calculer quelques images.
Le premier test concerne une photo prise lors d'un salon où nous avons exposé la solution Eden AI. La difficulté réside dans le fait que les visages sont masqués.
Résultats de Google et Amazon
Résultat de l'API BetaFace :
Samy Mélaine (à gauche, CTO d'Eden AI) :
Ombre à 5 heures : oui (4 %), âge : 47 ans (60 %), sourcils cambrés : non (92 %), beaux : non (86 %), poches sous les yeux : non (57 %), chauve : non (3 %), frange : non, barbe : oui (39 %), grandes lèvres : non (72 %), gros nez : non (22 %), cheveux noirs : non (24 %), cheveux blonds : non, flous : oui (32 %), cheveux bruns : non (61 %), sourcils touffus : non (2 %), potelé : non (14 %), double menton : non (44 %), expression : neutre (77 %), sexe : homme, lunettes : non, barbichette : oui (10 %), cheveux gris : non (35 %), maquillage épais : non (97 %), pommettes hautes : non (87 %), bouche ouverte : non (54 %), moustache : oui (17 %), yeux étroits : oui (4 %), visage ovale : non (19 %), peau pâle : non (21 %), hauteur : -8,27, nez pointu : non (55 %), race : blanche (89 %), racine des cheveux reculée : non (5 %), joues roses : non, favoris : non (10 %), cheveux raides : non (36 %), cheveux ondulés : non (88 %), boucles d'oreilles : non (88 %), chapeau : non (2 %), rouge à lèvres : non, porter un collier : non, porter une cravate : non (9 %), lacet : -1,05, jeune : non (12 %),
Taha Zemmouri (à droite, PDG d'Eden AI) :
Ombre à 5 heures : non (60 %), âge : 17 ans (60 %), sourcils cambrés : non, attrayants : non (45 %), poches sous les yeux : non (96 %), chauve : non (93 %), frange : non (33 %), barbe : non (70 %), grandes lèvres : non (69 %), gros nez : non (91 %), cheveux noirs : non (18 %), cheveux blonds : non, flous : oui (30 %), cheveux bruns : non (8 %), sourcils touffus : oui (14 %), potelé : non (89 %), double menton : non, expression : neutre (77 %), sexe : homme (47 %), lunettes : non, barbichette : non, cheveux gris : non, maquillage épais : non (90 %), pommettes hautes : non (77 %), bouche ouverte : non (55 %), moustache : non (96 %), yeux étroits : non (2 %), visage ovale : oui (15 %), pâle peau : non (8 %), hauteur : -7,32, nez pointu : non (46 %), race : asiatique (96 %), racine des cheveux reculée : non, joues roses : non, favoris : non, cheveux raides : non (40 %), cheveux ondulés : non (36 %), porter des boucles d'oreilles : non (66 %), chapeau : oui (15 %), rouge à lèvres : non (93 %), collier : non (98 %), portant une cravate : non (77 %), lacet : 14,14, jeune : oui (91 %),
Résultat Face++ :
Résultat de l'image :
Bilan du cas d'utilisation n°1 :
Tout d'abord, ce cas d'utilisation est basé sur une photo de 2 membres de notre équipe lors d'un salon. La difficulté était qu'ils sont masqués mais tous les fournisseurs ont détecté les deux visages à l'exception de Microsoft Azure.
Imagga, BetaFaceAPI, AWS, GCP et Face++ prédisent le bon sexe pour les deux visages. En ce qui concerne les lunettes de Samy, Face++ est le seul à les avoir détectées, les autres non et Imagga ne fournit pas les informations.
Pour l'âge, Taha a 27 ans et Samy en a 28. Imagga ne prédit que des catégories, et elle prédit des bébés pour l'un et des enfants pour l'autre, ce qui est faux. Google ne prédit pas l'âge. Voici les prévisions pour BetaFaceAPI, AWS et Face++ :
N'importe quel fournisseur parvient à obtenir une bonne précision quant à l'âge avec cette image, mais Face++ donne les résultats les plus pertinents.
Ce second cas d'utilisation concerne une photo plus classique prise à la caisse d'un supermarché.
Résultats de Google et Amazon :
Eden AI : API de détection de visages GCP et AWS
Résultat de l'API BetaFace :
Résultat Face++ :
Résultat de l'image :
Bilan du cas d'utilisation n°2 :
Dans ce cas d'utilisation, la qualité d'image n'est pas optimale. BetaFaceAPI ne détecte pas les 4 visages. Face++ et AWS ont trouvé les trois visages masculins et un visage féminin. Imagga a trouvé 2 mâles et 2 femelles. Lunettes pour femmes détectées par Face++. Nous pouvons remarquer que Face++ a détecté une bonne valeur de sourire (neutre et négative) et que GCP a détecté le couvre-chef de l'homme.
Il s'agit dans ce dernier cas d'une photo d'une course ayant la particularité d'avoir beaucoup de visages.
Résultats de Google et Amazon :
Résultat de l'API BetaFace :
Résultat Face++ :
Résultat de l'image :
Bilan du cas d'utilisation n°3 :
Betaface a trouvé 1 visage, Google en a trouvé 9, Face++ en a trouvé 16 et Imagga en a trouvé 20. Les performances d'AWS sont proches de celles de la reconnaissance de tous les visages de l'image, 33 visages ayant été détectés. Il semble qu'AWS soit très puissant pour détecter tous les visages sur les photos, même si Imagga offre également de bonnes performances. Il est important de noter qu'AWS et Face++ ont détecté des lunettes sur les coureurs à l'avant.
En ce qui concerne les coûts des API, ils sont définis en fonction de seuils de durée avec des prix dégressifs.
Nous considérons une entreprise qui doit traiter 2 millions d'images par mois :
BetaFace et Imagga ne proposent pas de tarification à l'utilisation, mais uniquement des abonnements mensuels. Pour cette quantité de données, le client devra les contacter.
Nous avons délibérément choisi 3 images correspondant à des cas d'utilisation très différents : une avec des masques, une avec des visages de faible qualité et des visages de profil, une avec de nombreux visages à détecter. Nous avons pu constater que chaque fournisseur présente des forces et des faiblesses spécifiques. Certaines API sont meilleures pour la détection des visages, d'autres pour détecter les lunettes ou les couvre-chefs, d'autres pour prédire l'âge ou le sexe, d'autres pour les émotions, etc.
Pour GCP et AWS, nous n'avons pas besoin d'utiliser directement leur API. En fait, l'API Eden AI Face Detection permet d'obtenir les résultats des API des 2 fournisseurs (ainsi que le résultat Microsoft Azure) en une seule demande. Avec quelques lignes de code, nous pouvons accéder aux résultats de plusieurs fournisseurs. Imagga, BetaFaceAPI et Face++ ne sont pas implémentés sur AI-Compare pour le moment, nous utilisons donc directement leur API ou leur interface.
Avec Eden AI, vous pouvez accéder rapidement à divers résultats provenant de différents fournisseurs. Vous pouvez ainsi avoir une meilleure idée de la solution qui vous convient le mieux.
La prise de décision est la suivante :
Tout d'abord, vous analysez vos données sur Eden AI pour comparer les solutions disponibles sur le marché. Trois options s'offrent alors à vous :
a. Vous trouvez un résultat qui vous pousse à choisir une API adaptée à votre tentative de performance
b. Les différents fournisseurs donnent de bons résultats. Vous pouvez donc utiliser la fonctionnalité Genius pour rassembler les forces et obtenir un résultat combiné, meilleur que n'importe quel résultat unique d'un fournisseur.
c. Les API préformées ne peuvent pas fournir de bons résultats pour votre projet :
Ce processus vous garantit de faire le bon choix pour réussir votre projet. Eden AI n'est qu'un outil qui permet de réaliser un benchmark très facilement et rapidement. Enfin, il est possible d'utiliser l'API Eden AI pour réaliser l'ensemble du projet en évitant les comptes et les facturations de nombreux fournisseurs, et en conservant la flexibilité de ne pas choisir un seul fournisseur.
Vous êtes fournisseur de solutions et souhaitez intégrer Eden AI, contactez-nous à l'adresse : contact@ai-compare.com
Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !
CommencezContactez le service commercial