Génération Augmentée par Recherche
Intérêts de la RAG dans la conception d'un agent :
diminuer ses hallucinations
lui fournir des données récentes à moindre coût
pouvoir modifier / supprimer facilement ses informations
Principe de la RAG :
récupérer des passages de documents ,
proches du contexte sémantique d'un prompt ,
et les envoyer avec le prompt à un LLM pour génération.
Préparation des documents :
on les découpe en passages , selon une stratégie contrôlée
on converti chaque passage en un vecteur
on stocke :
le texte
les vecteurs et les informations de récupération des passages
Mécanisme de récupération des passages pertinents :
recherche vectorielle (aussi appelée recherche sémantique ) :
leurs vecteurs sont proches du vecteur du prompt à compléter.
Mécanisme de transmission au LLM :
le texte des passages est ajouté au prompt initial
le tout est envoyé au LLM comme un prompt classique .