Tutoriel

Vision par ordinateur et détection d'objets : quel fournisseur choisir ?

Vision par ordinateur et détection d'objets : quel fournisseur choisir ?
TABLE DES MATIÈRES

Dans cet article, nous testons plusieurs API de détection d'objets pré-entraînées. Nous testons ces solutions sur différents cas d'utilisation pertinents.


Qu'est-ce que la vision par ordinateur et la détection d'objets ?

Ces dernières années, dans le monde de l'intelligence artificielle (IA), l'une des applications les plus populaires est la vision par ordinateur. Cette popularité est due à la grande diversité des applications et des besoins : imagerie médicale, industrie, transport, surveillance, etc. De nos jours, tous les domaines utilisent des caméras et des images dans leurs activités. La vision par ordinateur inclut diverses fonctionnalités :

A table of different Compute Vision functionalities
Eden AI - Vision par ordinateur et détection d'objets : fonctionnalités de vision par ordinateur

Ce tableau ne constitue pas une liste exhaustive de toutes les fonctionnalités de vision par ordinateur. De nombreuses solutions reposent sur la combinaison de plusieurs fonctionnalités.


Il est très important de faire la distinction entre les API pré-entraînées et les API AutoML :

  • Les API pré-entraînées sont des API basées sur des modèles qui ont été préalablement entraînés à l'aide des bases de données des fournisseurs. Les objets courants, les personnes, les animaux, les situations, les voitures, les visages et les autres cas d'utilisation impliquant des objets et des personnes courants sont généralement gérés par ces modèles. Cependant, comme les fournisseurs améliorent constamment leurs API, il est toujours essentiel de tester ces API avant d'utiliser des modèles sur mesure.
  • Il peut être préférable d'utiliser les API AutoML pour certains scénarios nécessitant une précision extrêmement élevée. Google Cloud Platform, Amazon Web Services, Microsoft Azure, IBM Watson, Clarifai, Chooch AI et quelques autres sociétés proposent ces API. Les utilisateurs utilisant les API AutoML peuvent créer des modèles uniques qui sont entraînés uniquement sur les bases de données utilisateur. Il permet de créer des modèles sur mesure spécialement conçus pour un projet donné.

Cet article traite brièvement des API de détection d'objets pré-entraînées. L'objectif est d'indiquer quels problèmes peuvent être résolus avec ce type d'API. Quels sont les principaux fournisseurs du marché ? Quel est le processus optimal lors de l'utilisation d'API pré-entraînées ?


Quels sont les fournisseurs d'API de détection d'objets ?

Au cours de notre étude sur les API pré-entraînées pour la détection d'objets, nous avons décidé de choisir 6 fournisseurs d'API offrant des performances élevées, selon de nombreux articles de blog et les classements de Gartner et Forrester :


Logos of Google Cloud, AWS, Microsoft Azure, IBM Watson, Clarifai & Chooch AI
Eden AI - Vision par ordinateur et détection d'objets : Google Cloud, AWS, Microsoft Azure, IBM Watson, Clarifai et Chooch AI

Voici la liste des API des fournisseurs que nous allons tester. Il est intéressant de noter que d'autres solutions et solutions open source existent.


Quels sont les cas d'utilisation de l'API de détection d'objets ?

Comme indiqué précédemment, les API de détection d'objets sont utilisées dans des centaines de domaines, pour de nombreux cas d'utilisation. Dans cet article, nous allons tester différentes API de détection d'objets avec différents types d'images représentant des cas d'utilisation courants.

Nous avons choisi 3 cas d'utilisation issus de différents domaines, représentés par 3 images :

  • Comptage de personnes : un parc souhaite compter les personnes à un endroit précis en analysant des photos prises à intervalles réguliers
  • détection d'animaux : certains chercheurs veulent savoir quels animaux vivent à un endroit précis
  • analyse d'images à domicile : exemple : une entreprise de haute technologie souhaite vérifier les photos envoyées par ses techniciens si les téléviseurs étaient bien installés

Pour chaque cas d'utilisation, nous avons testé l'API de détection d'objets des 6 fournisseurs, avec une image par cas d'utilisation. Bien entendu, pour un projet réel, vous devrez effectuer des tests sur une partie représentative de votre base de données (et non sur une seule image) pour avoir une vision correcte des différentes performances.


Mieux que de comparer les résultats de différentes API, Eden AI fournit la fonctionnalité Genius. Cette fonctionnalité renvoie une combinaison intelligente de tous les résultats. Pour nos exemples, nous allons voir ce que nous pouvons obtenir avec ce résultat combiné.



Tests de détection d'objets

La réponse de l'API n'est qu'une réponse textuelle. Cette réponse (souvent au format json) sera utilisée pour développer des applications. Pour notre exemple, la façon de procéder est la suivante :

1- Les API de détection d'objets de référence disponibles sur le marché

  • Recherche de fournisseurs
  • Solutions de test avec quelques photos en fonction du projet
  • Analyser les prix

2- Choisissez le fournisseur d'API qui correspond le mieux à votre projet (OCR), combinez plusieurs fournisseurs (API, résultats).

3- Intégrez l'API finale dans votre projet/logiciel

  • Découvrez comment gérer les API en production
  • Ajoutez le prétraitement et le post-traitement en fonction de votre projet

Enfin, selon le projet, les résultats visuels avec des cadres de délimitation imprimés sur les images peuvent être utiles ou non. Mais pour le benchmark, c'est le moyen le plus efficace et le plus rapide de trouver et de visualiser les performances.

Google, IBM, Clarifai, AWS, Azure et Chooch fournissent une API pour de multiples fonctionnalités de vision par ordinateur. Ils fournissent également une interface graphique uniquement pour tester et calculer quelques images.


Étui pour animaux :

Object detection by different providers on a photo of animals
Eden AI — Benchmark de l'API de détection d'objets (Google, Amazon, Microsoft et IBM)

Object detection by Genius on a photo of animals
Eden AI — Benchmark de l'API de détection d'objets (Google, Amazon, Microsoft et IBM)


Pour Clarifai, voici le résultat :

Object Detection API for Clarifai
Eden AI — Benchmark de l'API de détection d'objets (Clarifai)

Choisissez les résultats de l'IA :

Object Detection API for Chooch AI
Eden AI — Analyse comparative de l'API de détection d'objets (Chooch) (AI)

L'API Eden AI renvoie des réponses pour les API AWS, GCP, IBM et Azure :

AWS, GCP, IBM and Azure APIs coding by Eden AI
Eden AI — API de détection d'objets Eden AI

Pour Clarifai, voici la réponse de l'API :

Clarifai's response coding
Eden AI — Clarifier l'API

Pour Chooch AI, voici la réponse de l'API :

Chooch's response coding
Eden AI — API Chooch

Avec les résultats visuels, nous pouvons voir que Google, Chooch et Microsoft sont les API les plus efficaces, mais elles peuvent toutes être complémentaires. Ici, la fonctionnalité Genius semble donner les meilleurs résultats.

Vous pouvez également consulter les demandes d'API en Python et les réponses json. Ces données de réponse seront utilisées pour réaliser les projets.


Cas d'utilisation personnel :

Object detection by different providers on a photo of a group of people
Eden AI — Benchmark de l'API de détection d'objets (Google, Amazon, Microsoft et IBM)

Object detection by Genius on a photo of a group of people
Eden AI — Benchmark de l'API de détection d'objets (Genius)

Précisez :

People Detection by Clarifai API
Eden AI — Clarifier l'API

Choisissez l'API :

People Detection by Chooch API
Eden AI — API Chooch

Pour ce cas d'utilisation, nous pouvons noter que l'API Google Cloud est vraiment performante. Sur cette photo, toute personne est détectée par un fournisseur mais pas par Google. La fonctionnalité Genius est intéressante ici dans la mesure où à la détection de personnes que Google fait très bien, elle va ajouter les éléments de contexte (parc, arbres, etc.) qui sont mieux détectés par d'autres fournisseurs (Chooch AI, AWS et IBM notamment).


Cas d'utilisation de la détection TV :

Object detection by different providers on a photo of a television
Eden AI — Benchmark de l'API de détection d'objets (Google, Amazon, Microsoft et IBM)

Précisez :

TV Detection by Clarifai API
Eden AI — Clarifier l'API


Choisissez l'API :

TV Detection by Chooch API
Eden AI — API Chooch

Pour ce cas d'utilisation, toutes les API des fournisseurs semblent offrir de bonnes performances. Dans ce cas, la fonctionnalité Genius validera essentiellement que les fournisseurs d'IA prédisent la même chose et sécurisera donc ces prédictions.. De plus, le choix du fournisseur d'API sera basé sur :

  • tarification
  • vitesse d'exécution
  • facilité d'intégration
  • familiarité avec un fournisseur

Nous avons donc choisi 3 cas d'utilisation aléatoires, et pour les 3, il semble que la façon de gérer le projet sera différente :

  • Une API sélectionnée
  • La combinaison Genius de toutes les API choisies
  • Modèle personnalisé (avec les fournisseurs de solutions AutoML ou avec le développement open source)

Selon le cas d'utilisation, la meilleure façon d'obtenir les meilleures performances est toujours différente. Dans certains cas d'utilisation, une API du fournisseur A sera la meilleure, pour un autre cas d'utilisation, l'API B' du fournisseur est meilleure. Pour un cas d'utilisation plus complexe, peut-être qu'un modèle personnalisé peut être préférable, ou développer un modèle propriétaire basé sur des solutions open source.

Pourquoi choisir Eden AI ?

Pour GCP, AWS, Azure et Watson, nous n'avons pas besoin d'utiliser directement leur API. En fait, l'API Eden AI Object Detection permet d'obtenir les résultats des API des 4 fournisseurs en une seule demande. En quelques lignes de code, nous pouvons avoir accès aux résultats des 4 fournisseurs. Clarifai et Chooch AI ne sont pas encore implémentés sur Eden AI, nous utilisons donc directement leur API.

Avec Eden AI, vous pouvez accéder rapidement à divers résultats provenant de différents fournisseurs. Vous pouvez ainsi avoir une meilleure idée de la solution qui vous convient le mieux.

La prise de décision est la suivante :

Tout d'abord, vous exécutez vos données sur Eden AI pour comparer les solutions disponibles sur le marché. Trois options s'offrent alors à vous :

a. Vous trouvez un résultat qui vous pousse à choisir une API adaptée à votre tentative de performance

b. Les différents fournisseurs donnent de bons résultats. Vous pouvez donc utiliser la fonctionnalité Genius pour rassembler les forces et obtenir un résultat combiné, meilleur que n'importe quel résultat unique d'un fournisseur.

c. Les API préformées ne peuvent pas fournir de bons résultats pour votre projet :

  • vous décidez d'essayer les modèles Custom Vision
  • vous décidez de développer vos propres modèles à l'aide de solutions open source

Ce processus vous garantit de faire le bon choix pour mener à bien votre projet. Eden AI n'est qu'un outil qui permet de réaliser un benchmark très facilement et rapidement. Enfin, il est possible d'utiliser l'API Eden AI pour réaliser l'ensemble du projet en évitant les comptes et les facturations de nombreux fournisseurs, et en conservant la flexibilité de ne pas choisir un seul fournisseur.

Vous êtes fournisseur de solutions et souhaitez intégrer Eden AI, contactez-nous à l'adresse suivante : contact@edenai.co

Commencez votre aventure avec l’IA dès aujourd’hui

  • Accédez à plus de 100 API d’IA sur une seule plateforme.
  • Comparez et déployez des modèles d’IA en toute simplicité.
  • Paiement à l’usage, sans frais initiaux.
Commencez à créer GRATUITEMENT

Articles connexes

Essayez Eden AI gratuitement.

Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !

CommencezContactez le service commercial
X

Commencez votre parcours IA dès aujourd'hui!

Inscrivez-vous dès maintenant avec des crédits gratuits pour explorer plus de 100 API d'IA.
Commencer