
Commencez votre aventure avec l’IA dès aujourd’hui
- Accédez à plus de 100 API d’IA sur une seule plateforme.
- Comparez et déployez des modèles d’IA en toute simplicité.
- Paiement à l’usage, sans frais initiaux.
À l'ère numérique d'aujourd'hui, les moteurs de recherche sont devenus un outil indispensable permettant aux individus d'accéder à des informations sur presque tous les sujets sans effort et rapidement.
Cet article vise à fournir un guide étape par étape pour créer un moteur de recherche en Python à l'aide d'intégrations de texte. Les intégrations de mots encodent le texte dans un format numérique afin de mesurer la similitude entre deux éléments de texte.
En suivant ce didacticiel, vous serez en mesure de créer votre propre API de recherche à l'aide des intégrations d'Eden AI, puis de la déployer facilement sur Flask.
Prérequis :
Préparez d'abord votre ensemble de données. Dans le cadre de ce didacticiel, nous utiliserons un ensemble de données de 40 fonctionnalités d'IA, où chaque fonctionnalité est décrite par une courte description textuelle. L'ensemble de données peut être dans n'importe quel format, mais pour des raisons de simplicité, nous utiliserons un fichier CSV. Voici un exemple de ce à quoi pourrait ressembler l'ensemble de données :
Eden AI propose une vaste collection d'API, comprenant notamment des intégrations pré-entraînées. Pour ce didacticiel, nous utiliserons Open AI pour transformer les descriptions textuelles en représentations numériques. Ce tutoriel s'applique à d'autres fournisseurs, tels que Cohere (également disponible sur Eden AI). Toutefois, n'oubliez pas que lorsque vous représentez votre texte sous forme d'intégrations, vous ne devez utiliser qu'un seul fournisseur et ne pas fusionner des intégrations provenant de plusieurs fournisseurs.
Dans le code ci-dessus, nous appliquons l'API d'intégration d'Eden AI à chaque ligne de la colonne « Description » de l'ensemble de données et enregistrons les intégrations qui en résultent dans une nouvelle colonne appelée « description-embeddings ».
Voici le code permettant de générer des intégrations à l'aide de l'API Eden AI :
REMARQUE : N'oubliez pas de la remplacer <YOUR API KEY>par votre clé d'API Eden AI actuelle.
Maintenant que nous disposons des intégrations pour chaque description de notre ensemble de données, nous pouvons créer une API REST avec Flask qui permet aux utilisateurs de rechercher des entités dans l'ensemble de données en fonction de leur requête.
Tout d'abord, vous devez créer un environnement virtuel pour votre projet Flask et installer les dépendances requises. Pour ce faire, procédez comme suit :
1. Ouvrez votre interface de ligne de commande et accédez au répertoire dans lequel vous souhaitez créer votre projet Flask.
2. Créez un nouvel environnement virtuel à l'aide de la commande python3 -m venv <name of environment>. Remplacer <name of environment> avec le nom de votre choix, cela créera un nouvel environnement virtuel avec son propre interpréteur Python et ses packages installés, indépendamment de l'installation Python de votre système.
3. Activez l'environnement virtuel en exécutant la source de commande <name of environment>/bin/activer.
4. Installez les dépendances requises pour le projet en exécutant les commandes suivantes :
5. Importez l'ensemble de données dans votre projet et créez deux fichiers python search.py qui contiendra la logique de notre recherche et app.py pour l'API REST. Voici la structure de notre projet :
6. Dans le fichier "search.py «, nous allons implémenter le processus d'appel de l'API d'intégration Eden AI (qui a été démontré précédemment), ainsi que le calcul de la similitude des cosinus.
7. Notre objectif est de convertir la requête de recherche de l'utilisateur en intégrations, puis de lire l'ensemble de données pour mesurer la similitude en cosinus entre les intégrations de requêtes et les intégrations de description des sous-fonctionnalités. Notre résultat sera une liste triée des sous-fonctionnalités en fonction de leurs scores de similarité, en commençant par les plus similaires :
8. Dans app.py, nous allons créer une instance de notre projet Flask et définir un point de terminaison pour la recherche de sous-fonctionnalités dans notre ensemble de données. Ce point de terminaison appellera la fonction search_subfeature (), qui prend une description (requête) en entrée.
9. Enfin, démarrez l'application Flask en exécutant la commande flask --app app.py --exécuter le débogage.
Si tout fonctionne correctement, vous devriez voir un message dans votre interface de ligne de commande indiquant « Exécution sur http://127.0.0.1:5000/«.
Pour tester notre API de moteur de recherche, nous pouvons envoyer une requête GET au http://127.0.0.1:5000/search point de terminaison avec la requête comme charge utile. Pour ce faire, nous pouvons utiliser un outil comme Postman, qui nous permet d'envoyer facilement des requêtes HTTP et de visualiser les réponses.
Le résultat le plus pertinent pour la requête « Comment puis-je extraire des données d'un reçu ? » est en effet le analyseur_réception_de_réception sous-fonctionnalité.
Vous pouvez accéder au code complet dans ce dépôt github : https://github.com/Daggx/embedding-search-engine
Vous pouvez commencer à créer dès maintenant. Si vous avez des questions, n'hésitez pas à discuter avec nous !
CommencezContactez le service commercial