Aller au contenu

Capacité 02

RAG souverain

Toute votre connaissance interrogeable, sans la sortir de chez vous.

Contrats, mails, ERP, archives, jurisprudence : on les transforme en base interrogeable en langage naturel. Recherche hybride lexicale et vectorielle, réponse sourcée à la phrase près, aucune hallucination silencieuse.

Recherche
Hybride lexicale (tsvector) et vectorielle (pgvector), fusionnée par RRF.
Réponses
Sourcées à la phrase près, source vérifiable, aucune hallucination silencieuse.
Hébergement
Cloud EU ou vos GPU, zéro fuite hors UE.

le pipeline, étape par étape

De vos documents à une réponse sourcée. Sans rien envoyer dehors.

  1. 01
    ingest

    vos sources : ERP, GED, mails, contrats

  2. 02
    embed

    vectorisation, chunking sémantique

  3. 03
    retrieve

    recherche hybride tsvector + pgvector

  4. 04
    rerank

    top-k pertinents, RRF

  5. 05
    generate

    modèle ouvert servi chez vous

  6. 06
    cite

    réponse + source vérifiable

Six étapes, toutes opérées dans votre périmètre. L'ingestion lit vos sources métier, l'embedding et la recherche vivent dans votre base Postgres, la génération s'appuie sur un modèle ouvert servi chez vous, et chaque réponse remonte sa source. Aucune étape ne sort de l'infrastructure.

Pourquoi souverain.

Un RAG branché sur une API américaine vous fait sortir contrats, mails et archives de votre périmètre. Le nôtre reste à l'intérieur, de bout en bout.

Vos données ne sortent pas

Tout reste sous votre contrôle

Modèles ouverts servis sur vos GPU on-premise ou dans un cloud souverain européen. Vos documents, vos vecteurs et vos requêtes ne transitent par aucune API tierce. Adapté aux organisations régulées et au secret des affaires.

Recherche hybride

tsvector, pgvector et RRF

Le lexical (tsvector Postgres) capte les termes exacts, le vectoriel (pgvector) capte le sens. La fusion RRF (Reciprocal Rank Fusion) combine les deux classements en un seul, plus robuste que chaque méthode prise isolément. Le moteur tient dans votre base, sans index propriétaire externe.

Réponses sourcées

Chaque affirmation tracée

La réponse cite le passage exact dont elle est tirée, vérifiable d'un clic. Quand la base ne sait pas, le système le dit, plutôt que d'inventer. Le calcul des chiffres reste déterministe, jamais laissé au modèle.

Ce que ça change au quotidien.

Une base RAG souveraine remplace la fouille manuelle dans des téraoctets d'archives par une question en langage naturel.

  • 01Contrats et juridiqueInterroger des milliers de contrats, retrouver une clause et sa référence en quelques secondes.
  • 02Mémoire d'entrepriseMails, comptes rendus et GED deviennent une source unique, interrogeable sans connaître l'arborescence.
  • 03Données ERP et métierCroiser des référentiels structurés avec des documents libres, avec la source citée pour chaque chiffre avancé.
  • 04Socle d'un agentLa base RAG sert de mémoire à un agent qui enchaîne ensuite des actions sur vos outils.

Deux questions de fond.

Mes données partent-elles chez OpenAI ou un autre fournisseur américain ?
Non. Recognity déploie des modèles ouverts (Mistral, Llama) sur votre propre infrastructure ou dans un cloud souverain européen. Vos données ne transitent par aucune API américaine.
Quelle différence entre un agent et une base RAG ?
Une base RAG répond à des questions en s'appuyant sur vos documents, avec la source. Un agent va plus loin : il enchaîne des actions, appelle vos outils et exécute une tâche de bout en bout. La plupart des projets combinent les deux.

trente minutes

Votre connaissance,
interrogeable et sourcée.

Visio avec un ingénieur senior. Vous décrivez vos sources et vos contraintes de confidentialité, on dit si un RAG souverain est la bonne réponse et comment le déployer.