Comment utiliser Azure AI Search et Purview : Guide complet pour construire un RAG sécurisé sensible aux étiquettes

2/25/2026
5 min read

Comment utiliser Azure AI Search et Purview : Guide complet pour construire un RAG sécurisé sensible aux étiquettes

Introduction

Dans le domaine moderne de la gestion des données et de la recherche, il est particulièrement important de construire un système RAG (Retrieval-Augmented Generation) sécurisé sensible aux étiquettes. Le RAG peut combiner les avantages de la récupération et de la génération pour fournir aux utilisateurs des réponses et des informations plus précises. Dans cet article, nous vous guiderons étape par étape sur la façon de construire un système RAG sécurisé avec des fonctionnalités sensibles aux étiquettes en utilisant Azure AI Search et Purview.

Prérequis

Avant de commencer, assurez-vous de disposer des éléments suivants :

  • Compte Azure : Vous avez besoin d'un compte Azure valide pour accéder à Azure AI Search et Azure Purview.
  • Compréhension des services Azure de base : Une compréhension de base d'Azure, y compris comment créer des groupes de ressources et des services.
  • Connaissances en programmation : Certains exemples dans cet article peuvent nécessiter des connaissances de base en programmation Python ou PowerShell.
  • Étapes détaillées

    Étape 1 : Créer un service Azure AI Search

  • Connectez-vous au portail Azure.
  • Cliquez sur "Créer une ressource" dans le menu de gauche.
  • Dans la barre de recherche, tapez "Azure Search", sélectionnez "Azure Cognitive Search", puis cliquez sur "Créer".
  • Remplissez les informations nécessaires, telles que le nom, l'abonnement, le groupe de ressources et l'emplacement, puis cliquez sur "Vérifier + Créer".
  • Une fois que vous avez confirmé que les informations sont correctes, cliquez sur "Créer".
  • Après avoir créé le service Azure AI Search, vous pouvez trouver les informations relatives au service dans le portail.
    

    Étape 2 : Créer un compte Azure Purview

  • Connectez-vous au portail Azure.
  • Cliquez sur "Créer une ressource".
  • Dans la barre de recherche, tapez "Purview", puis sélectionnez "Azure Purview".
  • Remplissez les informations nécessaires, telles que le nom du compte, l'abonnement, le groupe de ressources et la région, puis cliquez sur "Vérifier + Créer".
  • Attendez que le déploiement des ressources soit terminé.
  • Le service Purview peut vous aider à gérer la classification des données et les étiquettes de sensibilité.
    

    Étape 3 : Configurer les sources de données et les étiquettes de sensibilité

  • Dans le portail Azure Purview, cliquez sur "Sources de données".
  • Sélectionnez "Ajouter une source de données", entrez les informations pertinentes et connectez-vous à votre source de données.
  • Configurez le scan des données. Vous pouvez choisir un scan automatique ou manuel.
  • Dans la classification des données, personnalisez les étiquettes de sensibilité, par exemple : données personnelles, informations financières, données confidentielles, etc.
  • Avec Purview, vous pouvez facilement gérer les étiquettes de sensibilité des données.
    

    Étape 4 : Intégrer Azure AI Search

  • Créez un nouvel index, configurez l'index via l'API REST ou le SDK dans le service de recherche Azure.
  • Dans le portail Azure, créez un index en définissant les champs, les types de données et d'autres paramètres pour configurer l'index.
  • {
    

    "name": "sample-index", "fields": [ {"name": "id", "type": "Edm.String", "key": true, "searchable": true}, {"name": "content", "type": "Edm.String", "searchable": true} ] }

  • Utilisez le SDK pour charger les données dans l'index de recherche.
  • Étape 5 : Construire la logique de traitement des requêtes RAG

  • Créez une interface API à l'aide d'Azure Functions ou des services d'application pour recevoir les requêtes de recherche des utilisateurs.
  • Dans cette interface, implémentez la logique de vérification des étiquettes de sensibilité.
  • import requests
    

    def querysearch(query): # Implémentez ici la vérification des étiquettes de sensibilité et accédez à l'API de recherche en fonction des résultats de la vérification. response = requests.get(f"?q={query}") return response.json()

    Étape 6 : Retourner la réponse traitée

    Après avoir traité la requête, récupérez les informations de l'index de recherche et renvoyez-les à l'utilisateur, tout en vous assurant que le contenu renvoyé ne divulgue aucune information sensible.

    def processresponse(response):
    

    results = response.get('value', []) # Traitez les résultats de recherche, filtrez les informations sensibles. return results

    Questions fréquentes

  • Comment assurer la sécurité des données ?
  • - Utilisez la fonction de gestion des étiquettes de sensibilité d'Azure Purview pour garantir un contrôle strict des informations sensibles.

  • Comment traiter les informations sensibles dans les requêtes des utilisateurs ?
  • - Implémentez un mécanisme de vérification des étiquettes de sensibilité dans la logique de requête, en prenant des mesures appropriées en fonction des étiquettes, comme masquer certaines données.

  • Quels types de sources de données peuvent être utilisés ?
  • - Azure Purview prend en charge plusieurs types de sources de données, y compris Azure Blob Storage, bases de données SQL, etc.

    Conclusion

    Construire un système RAG sécurisé sensible aux étiquettes nécessite certaines compétences techniques, mais en suivant les étapes ci-dessus, vous pouvez utiliser Azure AI Search et Purview pour créer un système de recherche d'informations efficace et sécurisé. Grâce à une gestion efficace des données et au contrôle des étiquettes de sensibilité, assurez-vous que les informations que vous traitez restent toujours sécurisées et conformes. Nous espérons que ce guide vous sera utile !

    Published in Technology

    You Might Also Like