Le guide 2025 de la génération augmentée par récupération (RAG)

TABLE DES MATIÈRES

La génération augmentée par extraction (RAG) est devenue une approche essentielle dans les applications d'IA, combinant les points forts des méthodes basées sur la récupération avec des capacités génératives. Cet article fournit un aperçu technique détaillé de RAG, couvrant son architecture, son flux de processus et les différents types de frameworks RAG. À la fin, vous aurez une solide compréhension du RAG et de son application dans des scénarios complexes.

‍

Qu'est-ce que RAG ?

RAG est un framework hybride qui intègre mécanisme de récupération avec un modèle génératif pour améliorer la pertinence contextuelle et la précision factuelle du contenu généré. Le mécanisme de récupération extrait les données externes pertinentes, tandis que le modèle génératif utilise ces informations récupérées pour produire un texte cohérent et contextuellement précis (1).

Cette approche répond aux principaux défis des grands modèles linguistiques (LLM) :

Connaissances contextuelles limitées: les LLM sont formés sur des ensembles de données fixes et ne peuvent pas mettre à jour leurs connaissances de manière dynamique.
Hallucination: Les modèles génératifs produisent souvent des informations plausibles mais incorrectes.
Évolutivité: RAG permet aux systèmes d'accéder à de vastes bases de données externes, contournant ainsi efficacement les contraintes de mémoire.

‍

Comment fonctionne la génération retrieval-augmentée ?

L'architecture de RAG comprend deux composants principaux :

Retriever: récupère les documents pertinents à partir d'une base de connaissances (par exemple, des bases de données vectorielles, des moteurs de recherche ou un stockage local).
Génératrice: combine les documents récupérés avec la requête d'entrée pour générer des réponses enrichies contextuellement.

Une mise en œuvre courante de RAG implique trois systèmes principaux :

Modèle d'intégration: convertit les documents de la requête et de la base de connaissances en représentations vectorielles denses.
Retriever: Utilise des métriques de similarité (par exemple, similarité en cosinus) pour identifier les documents les plus pertinents : les segments les plus proches de la requête
Génératrice: Généralement, un modèle de langage basé sur un transformateur (par exemple, GPT) qui produit des réponses en conditionnant à la fois la requête et les documents récupérés.

‍

Processus RAG étape par étape

1. Codage des requêtes

La requête d'entrée est transformée en un vecteur dense à l'aide d'un modèle d'intégration pré-entraîné (par exemple, Ada d'OpenAI, Sentence-BERT).

2. Extraction de documents

Le vecteur de requête est comparé à des vecteurs dans un index de documents préconstruit (par exemple, stocké dans une base de données vectorielle telle que Pomme de pin, Tisser, ou Qdrant).
La récupération est généralement effectuée à l'aide de la recherche du voisin approximatif le plus proche (ANN) pour des raisons d'évolutivité et d'efficacité.

3. Fusion contextuelle

L'extracteur renvoie les k premiers documents, qui sont ajoutés à la requête en tant que contexte supplémentaire.
Ces documents peuvent être traités (par exemple, résumés, fragmentés) pour s'assurer qu'ils respectent les limites de longueur d'entrée du générateur.

4. Génération de réponses

Le modèle génératif prend l'entrée enrichie (requête + documents récupérés) et génère une réponse.

‍

‍

Limitations traditionnelles du RAG

De nos jours, le RAG est devenu une technique connue et accessible pour toutes les entreprises et tous les cas d'utilisation. Le fait que RAG ait été exposé à des millions de cas d'utilisation a également montré qu'il avait ses limites et ne remplissait pas toujours parfaitement sa mission. De nombreuses limites peuvent être identifiées en fonction du cas d'utilisation :

‍

Qualité de la récupération

Problèmes de pertinence : RAG s'appuie largement sur le système de recherche pour fournir des documents précis et pertinents. Si le contenu récupéré ne correspond pas à l'intention de la requête, la réponse générée sera erronée.

Limites de la base de connaissances : Une base de connaissances incomplète ou obsolète peut entraîner de graves lacunes en matière d'informations, ce qui rend difficile la production de résultats corrects ou utiles par le modèle RAG.

‍

Manque de compréhension du contexte

Ambiguïté dans les requêtes : les modèles RAG peuvent être confrontés à des requêtes ambiguës ou mal formulées, ce qui entraîne une extraction de documents non pertinente.

Raisonnement à sauts multiples : l'incapacité de relier les informations entre plusieurs documents récupérés limite la capacité du modèle à fournir des réponses cohérentes et complètes à des tâches complexes.

‍

Manque de précision et hallucinations

Hallucinations : le modèle de génération peut toujours halluciner ou fabriquer des informations, même lorsqu'il est présenté avec des documents extraits avec précision.

Mauvaise interprétation : le modèle linguistique peut mal interpréter ou déformer le contenu des documents récupérés lors de la génération de réponses.

‍

Latence élevée

Les modèles RAG traditionnels divisent les documents en petits morceaux, généralement d'une centaine de mots en moyenne. Cette approche permet une recherche précise mais augmente considérablement l'espace de recherche, obligeant les récupérateurs à passer au crible des millions d'unités pour trouver des informations pertinentes.

‍

Techniques RAG avancées

Pour surmonter ces limites, de nombreuses techniques RAG avancées ont été développées. Toutes ces techniques permettent de résoudre une ou plusieurs limitations en ajoutant une complexité d'optimisation supplémentaire au processus RAG.

‍

1. Chiffon long

‍Qu'est-ce que Long RAG ?

Long RAG (Retrieval-Augmented Generation) est une version améliorée de l'architecture RAG traditionnelle conçue pour gérer plus efficacement les longs documents. Contrairement aux modèles RAG classiques, qui divisent les documents en petits morceaux pour les récupérer, Long RAG traite des unités de récupération plus longues, telles que des sections ou des documents entiers. Cette innovation améliore l'efficacité de la récupération, préserve le contexte et réduit les coûts de calcul.

‍

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Les modèles RAG traditionnels sont confrontés à des défis importants en raison de leur utilisation de petits morceaux de texte (souvent d'environ 100 mots) :

Perte de contexte: La division des documents en petits morceaux fragmente souvent le récit, ce qui rend plus difficile la compréhension et l'utilisation du contexte complet par le modèle.
Surcharge de calcul élevée: La récupération d'informations pertinentes à partir de millions de petits blocs (par exemple, jusqu'à 22 millions pour des tâches de domaine ouvert comme Wikipedia) augmente la latence et la consommation de ressources.
Évolutivité réduite: À mesure que les ensembles de données augmentent, il devient peu pratique de traiter de nombreux petits blocs, en particulier pour les applications en temps réel.

Long RAG résout ces problèmes en travaillant avec des unités de récupération plus grandes, en réduisant la fragmentation et en améliorant l'efficacité.

‍

Comment fonctionne Long RAG ?

Prétraitement des documents:

Au lieu de diviser les documents en petits morceaux, Long RAG les divise en sections plus longues et cohérentes ou traite directement des documents complets. Cela préserve le récit et le contexte (2).

Optimisation des récupérateurs:

Long RAG utilise des outils de récupération avancés conçus pour gérer efficacement les étendues de texte étendues. Ces outils de recherche identifient les sections ou les documents les plus pertinents, réduisant ainsi le nombre d'unités à rechercher tout en préservant la précision.

Composant génératif:

Le modèle de génération est affiné pour traiter et synthétiser les informations provenant d'unités de récupération plus longues. Cela permet au système de produire des réponses détaillées, cohérentes et contextuellement précises sans perdre de nuances critiques.

Flux de travail RAG long pour une meilleure gestion du contexte

‍

Avantages du Long RAG

Compréhension contextuelle améliorée:

Le traitement de longues étendues de texte permet au modèle de conserver et d'utiliser le contexte complet d'un document, ce qui permet d'obtenir des réponses plus précises et cohérentes.

Efficacité accrue:
En utilisant des unités de récupération plus petites et plus grandes, Long RAG réduit les besoins de calcul et accélère la récupération et la génération.

Évolutivité:
Long RAG est mieux équipé pour gérer des ensembles de données volumineux, ce qui en fait un choix robuste pour les applications comportant des bases de connaissances étendues ou complexes.

Précision pour les domaines complexes:
Le système est particulièrement efficace pour générer des réponses dans des domaines qui nécessitent une compréhension nuancée, tels que les domaines juridique, médical ou universitaire.

Latence réduite:
Le processus rationalisé permet des temps de réponse plus rapides, ce qui fait de Long RAG la solution idéale pour les cas d'utilisation en temps réel.

‍

Cas d'utilisation pour Long RAG

Aide à la recherche:
Résumer ou répondre à des questions provenant d'articles universitaires, de documents techniques ou de rapports de recherche.

Analyse de documents juridiques:
Extraire des informations clés ou générer des résumés à partir de longs textes juridiques, de contrats ou de jurisprudence.

Assistance à la clientèle:
Fournir des réponses détaillées à l'aide d'informations provenant de grands manuels, de guides de dépannage ou de documentation utilisateur.

Génération de contenu:
Résumer ou tirer des enseignements de livres, d'articles ou de vastes ensembles de données à des fins créatives ou analytiques.

Gestion des connaissances:
Récupération et synthèse efficaces des informations à partir des bases de connaissances d'entreprise, des référentiels techniques ou des documents d'archives.

‍

2. Auto-chiffon

Qu'est-ce que SELF-RAG ?

SELF-RAG, ou Self-Reflective Retrieval-Augmented Generation, est un framework d'IA avancé conçu pour améliorer la précision factuelle et la fiabilité du contenu généré. Contrairement aux modèles traditionnels, il intègre un mécanisme autoréfléchissant qui décide dynamiquement quand et comment récupérer les informations, évalue la pertinence des données et critique leurs résultats pour garantir des réponses de haute qualité et étayées par des preuves (3).

‍

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

SELF-RAG répond à plusieurs limites clés des systèmes RAG traditionnels :

Récupération fixe et à l'aveugle: Le RAG traditionnel extrait un nombre fixe de documents, introduisant souvent des données non pertinentes ou contradictoires.
Absence d'évaluation critique: RAG n'évalue pas si les informations récupérées sont correctement utilisées ou pertinentes pour la réponse générée.
Inexactitude: Les résultats manquent souvent de preuves suffisantes, ce qui entraîne un contenu peu fiable ou trompeur.
Processus de récupération statique: Les modèles traditionnels ne peuvent pas décider de manière adaptative lorsque la récupération n'est pas nécessaire, gaspillant ainsi des ressources de calcul.

SELF-RAG surmonte ces défis en permettant au modèle de récupérer, d'évaluer et d'affiner les réponses de manière dynamique, en garantissant qu'elles sont à la fois précises et pertinentes du point de vue du contexte.

‍

Comment fonctionne SELF-RAG (étapes détaillées)

Extraction adaptative:

SELF-RAG détermine, à l'aide de jetons de réflexion, si des informations externes sont nécessaires pour une requête donnée. Il ne récupère de manière sélective les documents pertinents que lorsque cela est nécessaire, évitant ainsi les données inutiles ou non pertinentes.

Approvisionnement sélectif:

Les documents récupérés sont évalués pour leur pertinence et leurs preuves à l'aide de jetons de réflexion spécialisés (par exemple, ISREL pour la pertinence, ISSUP pour le support des preuves). Seules les données les plus fiables permettent de générer des réponses.

Jetons de réflexion:

Ces marqueurs uniques guident le processus de prise de décision du modèle. Des jetons comme Récupérez (quand récupérer les données), ISRAËL (pertinence), et PROBLÈME (utilité) permettent au modèle d'auto-évaluer ses performances.

Mécanisme de critique:

Après avoir généré des réponses, SELF-RAG critique ses résultats pour vérifier l'alignement avec les données récupérées et garantir l'exactitude des faits. Le modèle affine ses réponses de manière itérative en fonction des notes critiques, améliorant ainsi la qualité globale.

Sélection de la sortie finale:

SELF-RAG classe toutes les réponses possibles et sélectionne la plus précise et la plus appropriée au contexte, étayée par des citations pertinentes.

Architecture Self-Rag avec jetons de réflexion

‍

Avantages du SELF-RAG

Précision améliorée:

Récupère et intègre de manière dynamique uniquement les informations vérifiées et pertinentes, minimisant ainsi le risque d'erreurs factuelles.

Extraction adaptative:
Récupère les données uniquement lorsque cela est nécessaire, optimisant ainsi les ressources de calcul et améliorant l'efficacité des réponses.

Autocritique pour le raffinement:
L'autoréflexion itérative garantit que les résultats sont continuellement affinés pour répondre à des normes élevées de qualité et de pertinence.

Transparence:
Fournit des citations pour les informations récupérées, ce qui rend les réponses vérifiables et fiables.

Polyvalence:
Gère un large éventail de tâches, allant de la réponse à des questions en domaine ouvert au raisonnement complexe et à la génération de contenu détaillé.

‍

Cas d'utilisation de SELF-RAG

Réponses aux questions dans le domaine ouvert:
Répondre aux questions avec des réponses précises et étayées par des preuves, surpassant les modèles RAG traditionnels dans des tâches telles que Questions-réponses QA.

Vérification des faits:
Vérifier les allégations et les déclarations dans des domaines tels que la santé, la science et les actualités (par exemple, l'ensemble de données PubHealth).

Aide à la recherche et aux études:
Résumer et générer des informations à partir de sources complètes et crédibles avec des citations appropriées.

Tâches de raisonnement complexes:
Exceller dans les scénarios où le raisonnement est lourd, comme répondre Défi ARC questions avec une grande précision.

Rédaction et documentation professionnelles:
Générer un contenu long avec des citations précises, garantissant une précision factuelle élevée pour des secteurs tels que le monde universitaire ou le droit.

‍

3. CHIFFON correcteur

Qu'est-ce que Corrective RAG (CRAG) ?

La génération corrigée par récupération augmentée (CRAG) est un cadre de génération augmentée par extraction (RAG) conçu pour améliorer la robustesse en cas d'inexactitudes dans les données récupérées. Il introduit un évaluateur de récupération léger pour évaluer la qualité des documents récupérés, permettant au système de répondre de manière adaptative à des informations incorrectes, ambiguës ou non pertinentes. En affinant le processus de recherche et en incorporant dynamiquement des recherches Web à grande échelle si nécessaire, le CRAG garantit que le contenu généré est plus précis et plus fiable (4).

‍

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Le CRAG comble les principales lacunes des systèmes RAG traditionnels :

Gestion des extractions inexactes: Le RAG traditionnel ne dispose pas de mécanismes permettant d'évaluer ou de corriger les erreurs dans les informations récupérées, ce qui entraîne des résultats peu fiables en cas d'échec du processus de récupération.
Bases de connaissances statiques: Le RAG repose souvent sur des corpus statiques ou limités, ce qui peut entraîner des informations incomplètes ou obsolètes.
Surcharge d'informations: le RAG classique extrait les documents sans discernement, y compris souvent des détails redondants ou non pertinents qui réduisent la clarté et la précision du contenu généré.

CRAG améliore RAG en introduisant des actions de récupération adaptatives, en améliorant l'utilisation des documents et en intégrant des recherches dynamiques sur le Web pour un meilleur contexte et une meilleure fiabilité.

‍

Comment fonctionne CRAG

Evaluateur de récupération:

CRAG utilise un évaluateur de récupération léger pour analyser la qualité et la pertinence des documents récupérés pour une requête donnée. Cet évaluateur attribue un score de confiance à chaque document, en classant les résultats dans des catégories telles que :

Correct: Informations pertinentes et précises.
Incorrect: données incohérentes ou erronées.
Ambigu: informations qui manquent de clarté ou qui nécessitent un contexte supplémentaire.

‍

Extraction adaptative des connaissances:

Les données correctes sont directement utilisées pour la génération de réponses. Pour les données incorrectes ou ambiguës, déclenche des actions de récupération supplémentaires, souvent des recherches sur le Web, pour compléter l'ensemble de données d'origine avec des informations plus fiables ou plus diversifiées.

Génération à l'aide de l'algorithme de décomposer puis de recomposer:

Les documents récupérés sont divisés en éléments plus petits afin de se concentrer sur les informations clés tout en filtrant les informations non pertinentes ou redondantes. Les informations filtrées sont recombinées dans un ensemble de données cohérent et concis, optimisant la qualité des données saisies pour la génération.

Flux de travail RAG (CRAG) correctif avec algorithme de décomposition puis de recomposition

‍

Les avantages du CRAG

Précision améliorée:

En évaluant et en corrigeant les données récupérées, le CRAG garantit des résultats plus fiables et précis sur le plan factuel.

Adaptabilité dynamique:

L'intégration de recherches Web à grande échelle permet au CRAG d'aller au-delà des bases de connaissances statiques, en fournissant des informations actualisées et diversifiées.

Utilisation efficace des données:

L'algorithme de décomposition puis de recomposition réduit le bruit et se concentre sur les informations critiques, garantissant ainsi que les réponses générées sont à la fois concises et pertinentes.

Meilleure robustesse:

CRAG réduit le risque de générer des connaissances incorrectes en corrigeant dynamiquement les erreurs lors du processus de récupération.

‍

Cas d'utilisation pour CRAG

Réponse aux questions du domaine ouvert:

Fournir des réponses plus précises et pertinentes au contexte en affinant dynamiquement les résultats de recherche.

Vérification des faits:

Validation des affirmations et filtrage des informations erronées, particulièrement utiles dans le journalisme, la recherche universitaire ou le discours public.

Tâches à forte intensité de connaissances:

Soutenir des applications telles que la synthèse de documents médicaux ou juridiques, où l'exactitude et la précision sont essentielles.

Assistance dynamique à la recherche:

Intégrer des informations à jour par le biais de recherches sur le Web, en particulier pour les sujets qui reposent sur des données évolutives.

Génération de contenu:

Création de contenu de haute qualité, fondé sur des faits, pour la rédaction de longs textes ou de la documentation professionnelle.

‍

4. Chiffon Golden Retriever

Qu'est-ce que Golden-Retriever RAG ?

Golden-Retriever est un framework RAG avancé conçu pour naviguer efficacement dans de vastes bases de connaissances industrielles. Il intègre dans RAG une étape d'augmentation des questions basée sur la réflexion avant la récupération du document, qui consiste à identifier le jargon spécifique au domaine, à clarifier leur signification en fonction du contexte et à augmenter la question en conséquence (5). Cette approche garantit que le framework RAG extrait les documents les plus pertinents en fournissant un contexte clair et en résolvant les ambiguïtés, améliorant ainsi de manière significative la précision de la récupération.

‍

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

La méthode Golden-Retriever RAG permet d'éviter :

Mauvaise interprétation du jargon spécifique à un domaine: Les frameworks RAG standard peuvent mal interpréter ou halluciner le sens de termes spécialisés absents de leurs données d'apprentissage, ce qui entraîne une extraction de documents et des réponses inexactes.
Manque de compréhension du contexte: Sans contexte explicite, les systèmes RAG peuvent récupérer des documents non pertinents, ce qui réduit l'efficacité des réponses générées.
Bases de connaissances statiques: Les systèmes RAG traditionnels reposent souvent sur des corpus statiques ou limités, ce qui peut entraîner des informations incomplètes ou obsolètes.

‍

Comment fonctionne le Golden-Retriever

Augmentation des questions basée sur la réflexion:

Identification du jargon: Le système extrait et répertorie tout le jargon et les abréviations de la question saisie.

Détermination du contexte: Il détermine le contexte par rapport à une liste prédéfinie pour comprendre le domaine ou l'application spécifique.

Clarification du jargon: interroge un dictionnaire de jargon pour obtenir des définitions et des descriptions détaillées afin de clarifier les significations. Un dictionnaire de jargon contient des informations structurées et détaillées sur les termes, les abréviations et les concepts spécifiques à un domaine. Le dictionnaire de jargon peut être créé par l'utilisateur, par le système RAG ou par une combinaison des deux, en fonction du domaine et de la complexité de l'application.

Augmentation des questions: La question initiale est complétée par les définitions et le contexte du jargon clarifiés, fournissant un contexte clair et résolvant les ambiguïtés.

Extraction de documents:

Utilise la question augmentée pour récupérer les documents les plus pertinents de la base de connaissances, garantissant ainsi que les informations récupérées correspondent exactement à l'intention de l'utilisateur.

Génération de réponses:

Les documents récupérés sont ensuite utilisés pour générer des réponses précises et contextuellement pertinentes à la requête de l'utilisateur.

Olden-retriever RAG : amélioration de la récupération spécifique au domaine grâce à la clarification du jargon

‍

Avantages du Golden-Retriever

Précision de récupération améliorée: En clarifiant les termes ambigus et en fournissant un contexte explicite, le système extrait les documents les plus pertinents par rapport à la requête de l'utilisateur.

Génération de réponses améliorée: Avec l'accès à des documents précis, les réponses générées sont plus précises et informatives.

Évolutivité: Il gère efficacement de vastes bases de connaissances industrielles, ce qui le rend adapté aux grandes organisations disposant d'une documentation complète.

Cas d'utilisation du Golden-Retriever

Gestion des connaissances industrielles: Aider les ingénieurs et les nouveaux employés à naviguer et à interroger de nombreux documents propriétaires, tels que des supports de formation, des documents de conception et des résultats de recherche.

Support technique: Fournir des réponses précises et contextuellement pertinentes à des questions techniques complexes qui impliquent un jargon spécifique à un domaine.

Recherche et développement: Faciliter la recherche efficace d'informations à partir de grands ensembles de données, faciliter les revues de littérature et l'analyse des données.

Soins de santé: Interpréter les terminologies médicales et récupérer des informations pertinentes pour les professionnels de santé.

‍

5. RAG adaptatif

Qu'est-ce que Adaptive RAG

Adaptive RAG est un framework avancé qui adapte dynamiquement ses stratégies de récupération en fonction de la complexité des requêtes des utilisateurs. Contrairement aux systèmes RAG traditionnels qui appliquent une approche de récupération uniforme à toutes les requêtes, Adaptive RAG décide intelligemment quand et comment récupérer les informations externes, optimisant ainsi à la fois l'efficacité et la précision (6).

‍

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Les modèles RAG classiques traitent souvent toutes les requêtes de la même manière, ce qui entraîne des problèmes d'efficacité :

Récupérations inutiles: Les requêtes simples que le modèle peut gérer en interne déclenchent toujours la récupération de données externes, ce qui entraîne une surcharge de calcul inutile.
Gestion inadéquate des requêtes complexes: les requêtes complexes comportant plusieurs étapes peuvent ne pas bénéficier des processus de récupération complets dont elles ont besoin, ce qui entraîne des réponses incomplètes ou inexactes.

‍

Comment fonctionne Adaptive RAG

Adaptive RAG aborde ces problèmes par le biais d'un processus structuré :

Évaluation de la complexité des requêtes: un classificateur spécialisé évalue la requête entrante pour déterminer son niveau de complexité.
Sélection de la stratégie (Classification des requêtes)

un peu de texte
- Requêtes simples: Géré directement par le modèle de langage sans extraction externe, garantissant des réponses rapides.
- Requêtes simples: engagez un processus de récupération traditionnel.
- Requêtes complexes: Engagez-vous dans un processus de recherche en plusieurs étapes, en collectant et en intégrant de manière itérative des informations pour construire une réponse complète.

‍

Réglage dynamique: Le système adapte sa stratégie de récupération en temps réel, en équilibrant le besoin d'informations externes avec l'efficacité informatique.

‍

RAG adaptatif : stratégies de récupération dynamique basées sur la complexité des requêtes

‍

Avantages du RAG adaptatif

Une meilleure efficacité: En évitant les recherches inutiles pour des requêtes simples, le système réduit la latence et préserve les ressources.

Précision améliorée: L'adaptation des stratégies de recherche à la complexité des requêtes garantit que les questions complexes reçoivent les informations détaillées dont elles ont besoin.

Optimisation des ressources: Adaptive RAG alloue les ressources de calcul de manière plus efficace, améliorant ainsi les performances globales du système.

‍

Cas d'utilisation du RAG adaptatif

IA conversationnelle: fournit des réponses précises et rapides dans les chatbots et les assistants virtuels en ajustant les efforts de récupération en fonction des demandes de requêtes.

Assistance à la clientèle: Fournit des réponses précises de manière efficace, améliorant la satisfaction des utilisateurs en s'adaptant de manière dynamique à la complexité des demandes des clients.

Systèmes de recherche d'informations: Équilibre rapidité et rigueur dans les moteurs de recherche et les systèmes d'assurance qualité, offrant aux utilisateurs des informations pertinentes rapidement.

‍

6. Graphique RAG

Qu'est-ce que Graph RAG ?

Graph RAG est un nouveau framework RAG qui intègre des représentations graphiques des connaissances afin d'améliorer la récupération de documents et la génération de réponses. Il construit et utilise des graphes de connaissances (des réseaux structurés d'entités et leurs relations) parallèlement aux méthodes RAG traditionnelles, garantissant ainsi un processus de recherche plus interconnecté et plus riche en contexte. Cette approche est particulièrement efficace dans les domaines où les relations entre les entités sont aussi critiques que les entités elles-mêmes (7).

‍

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Graph RAG répond à plusieurs limites inhérentes aux systèmes RAG traditionnels :

Perte de relations contextuelles : les frameworks RAG standard traitent souvent les documents comme des unités isolées, négligeant les relations complexes entre les entités, ce qui entraîne des réponses fragmentées ou incomplètes.
Mauvaise gestion des requêtes complexes : les requêtes qui nécessitent de comprendre l'interaction entre plusieurs entités ou concepts constituent un défi pour les systèmes traditionnels, qui ne disposent pas d'une représentation structurée de ces relations.

‍

Comment ça marche

Graph RAG améliore le processus de recherche en incorporant des graphes de connaissances dans le pipeline RAG :

Construction d'un graphe de connaissances: Un graphe de connaissances est créé à partir de la base de connaissances, capturant les entités (par exemple, les concepts, les termes) et leurs relations (par exemple, les dépendances, les hiérarchies).
Mappage requête/graphe: les requêtes entrantes sont mappées sur le graphique pour identifier les entités et les relations pertinentes.
Extraction basée sur des graphiques : Le système parcourt le graphique pour récupérer non seulement les entités explicitement mentionnées dans la requête, mais également les entités associées, garantissant ainsi une couverture complète de l'intention de la requête.
Génération de réponses améliorée: Les informations graphiques récupérées sont intégrées au modèle RAG pour générer des réponses contextuelles riches et précises, en tirant parti de la nature interconnectée des données.

‍

Workflow GraphRag : intégration de graphes de connaissances pour une meilleure récupération (8)

‍

Avantages de Graph RAG

Compréhension contextuelle améliorée : En tenant compte des relations entre les entités, Graph RAG fournit des réponses plus cohérentes et plus sensibles au contexte.

Précision de récupération améliorée : Le graphe de connaissances garantit que le système récupère des documents et des informations très pertinents par rapport au contexte de la requête.

Évolutivité: La structure graphique permet des requêtes et des extractions efficaces, ce qui la rend adaptée aux ensembles de données volumineux et complexes.

‍

Cas d'utilisation de Graph RAG

Recherche scientifique

Aide les chercheurs à explorer les relations entre les concepts scientifiques, facilitant ainsi des connaissances plus approfondies et la génération d'hypothèses.

Soins de santé

Soutient les professionnels de santé en récupérant des informations interconnectées sur les symptômes, les diagnostics et les traitements.

Gestion des connaissances d'entreprise

Améliore la recherche de documents, de processus et de concepts connexes pour la prise de décisions dans les grandes organisations.

Éducation

Aide les étudiants et les enseignants à aborder des sujets complexes en présentant des concepts interconnectés et leurs relations.

‍

De laquelle ai-je besoin ?

RAG Technique	Specific Advantages	Best Use Cases
Traditional RAG	- Simple and well-established framework. - Effective for basic retrieval and generation tasks. - General-purpose question answering.	- Use cases with static and well-structured knowledge bases.
Long RAG	- Processes longer retrieval units (e.g., sections or documents). - Preserves context for complex tasks. - Reduces computational load by limiting the number of retrieval units.	- Summarizing lengthy documents (e.g., research papers, legal texts). - Applications requiring deep contextual understanding.
Self-RAG	- Critiques and refines its own outputs. - Dynamically retrieves additional information as needed. - Ensures factual accuracy with iterative improvement.	- High-stakes applications (e.g., healthcare, legal, research). - Fact-checking and open-domain question answering.
Corrective RAG (CRAG)	- Identifies and corrects inaccurate or ambiguous retrievals. - Uses large-scale web searches for broader context. - Filters out redundant or irrelevant information.	- Scenarios where retrieved data may be unreliable (e.g., customer support FAQs). - Applications with dynamic knowledge bases.
Golden-Retriever RAG	- Resolves domain-specific jargon and ambiguity. - Improves retrieval relevance for technical queries. - Seamlessly integrates into existing workflows.	- Industrial knowledge management. - Technical support for complex domains (e.g., engineering, healthcare).
Adaptive RAG	- Dynamically adjusts retrieval strategies based on query complexity. - Reduces unnecessary computational overhead. - Optimizes resource allocation for diverse tasks.	- Customer support systems with varied query complexity. - Conversational AI needing a mix of simple and complex answers.

‍

Conclusion

En conclusion, Génération augmentée par récupération (RAG) devrait rester la pierre angulaire de la recherche et de la génération d'informations en 2025, offrant une puissante fusion de méthodes de recherche avancées et de modèles linguistiques sophistiqués.

Alors que les organisations continuent de relever le défi de gérer de vastes bases de connaissances et de répondre à des requêtes de plus en plus complexes, les systèmes RAG se sont adaptés et ont évolué pour répondre à ces besoins.

Les différentes techniques RAG abordées, telles que CHIFFON traditionnel, Chiffon long, Auto-chiffon, CHIFFON correcteur, Chiffon Golden Retriever, RAG adaptatif, et Graph Rag—mettre en évidence la gamme de solutions disponibles, chacune étant adaptée à des complexités différentes et à des exigences spécifiques.

Le choix de la technique est crucial, en fonction de facteurs tels que le langage spécifique au domaine ou l'intégration de graphes de connaissances pour une meilleure compréhension. À mesure que la technologie de l'IA progresse, les frameworks RAG continueront de jouer un rôle déterminant dans la fourniture de solutions intelligentes et évolutives qui permettront aux industries d'exploiter les informations avec plus de précision et d'efficacité.

‍

Sources

Qrant. (s.d.). Comment fonctionne RAG. Extrait de https://qdrant.tech/articles_data/what-is-rag-in-ai/how-rag-works.jpg
Pubby AI. (s.d.). LLM à contexte long pour la recherche d'informations : l'approche LongRag. Extrait de https://ai.gopubby.com/long-context-llms-for-information-retrieval-the-longrag-approach-470dc6e8f56e
Wu, A. et coll. (2023). Génération augmentée par récupération autoréfléchissante (SELF-RAG). arXiv. Extrait de https://arxiv.org/abs/2310.11511
Chen, Z., et coll. (2024). Corrective RAG (CRAG) : amélioration de la précision grâce à une évaluation de récupération adaptative. arXiv. Extrait de https://arxiv.org/pdf/2401.15884
An, Z., Ding, X., Fu, Y., Chu, C., Li, Y. et Du, W. (2024). Golden-Retriever : génération augmentée de récupération agentique haute fidélité pour la base de connaissances industrielle. Université de Californie, Merced, Western Digital Corporation et Lawrence Berkeley National Laboratory. Extrait de https://arxiv.org/pdf/2408.00798.
Jeong, S., Baek, J., Cho, S., Hwang, S.J., & Park, J.C. (2024). Adaptive-RAG : apprendre à adapter de grands modèles de langage augmentés par extraction en fonction de la complexité des questions. Institut supérieur coréen des sciences et technologies (KAIST). Extrait de https://arxiv.org/pdf/2403.14403.
Eden AI. (s.d.). De RAG à GraphRag : améliorer la recherche à l'aide de graphes de connaissances. Extrait le 10 janvier 2025 de https://www.edenai.co/post/from-rag-to-graphrag-enhancing-retrieval-with-knowledge-graphs
Cookie, télévision. (1er septembre 2023). Comment j'ai créé un moteur de recherche Neo4j avec IA générative. Moyen. https://medium.com/@thcookieh/how-i-created-a-neo4j-search-engine-with-generative-ai-98b43cf8ec1e

Créez votre compte sur Eden AI

Le guide 2025 de la génération augmentée par récupération (RAG)

Qu'est-ce que RAG ?

Comment fonctionne la génération retrieval-augmentée ?

Processus RAG étape par étape

1. Codage des requêtes

2. Extraction de documents

3. Fusion contextuelle

4. Génération de réponses

Limitations traditionnelles du RAG

Qualité de la récupération

Manque de compréhension du contexte

Manque de précision et hallucinations

Latence élevée

Techniques RAG avancées

1. Chiffon long

‍Qu'est-ce que Long RAG ?

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Comment fonctionne Long RAG ?

Avantages du Long RAG

Cas d'utilisation pour Long RAG

2. Auto-chiffon

Qu'est-ce que SELF-RAG ?

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Comment fonctionne SELF-RAG (étapes détaillées)

Avantages du SELF-RAG

Cas d'utilisation de SELF-RAG

3. CHIFFON correcteur

Qu'est-ce que Corrective RAG (CRAG) ?

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Comment fonctionne CRAG

Les avantages du CRAG

Cas d'utilisation pour CRAG

4. Chiffon Golden Retriever

Qu'est-ce que Golden-Retriever RAG ?

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Comment fonctionne le Golden-Retriever

Avantages du Golden-Retriever

Cas d'utilisation du Golden-Retriever

5. RAG adaptatif

Qu'est-ce que Adaptive RAG

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Comment fonctionne Adaptive RAG

Avantages du RAG adaptatif

Cas d'utilisation du RAG adaptatif

6. Graphique RAG

Qu'est-ce que Graph RAG ?

Quelle limitation traditionnelle du RAG permet-elle de résoudre ?

Comment ça marche

Avantages de Graph RAG

Cas d'utilisation de Graph RAG

Recherche scientifique

Soins de santé

Gestion des connaissances d'entreprise

Éducation

De laquelle ai-je besoin ?

Conclusion

Sources

Commencez votre aventure avec l’IA dès aujourd’hui

Articles connexes

Comment contrôler l'utilisation des Tokens et réduire les coûts liés aux API d'IA ?

Comment les entreprises SaaS doivent-elles monétiser leurs nouvelles fonctionnalités d’IA ?

Comment concevoir l’architecture backend d’IA parfaite pour votre SaaS ?

Essayez Eden AI dès maintenant.

Plateforme

solutions

Ressources

L'entreprise

Commencez votre parcours IA dès aujourd'hui!

Commencez votre parcours IA dès aujourd'hui!