Cómo usar Azure AI Search y Purview: Guía completa para construir un RAG seguro con conciencia de etiquetas de sensibilidad

2/25/2026
5 min read

Cómo usar Azure AI Search y Purview: Guía completa para construir un RAG seguro con conciencia de etiquetas de sensibilidad

Introducción

En el campo moderno de la gestión de datos y búsqueda, se vuelve especialmente importante construir un sistema RAG (Generación Aumentada por Recuperación) seguro con conciencia de etiquetas de sensibilidad. RAG puede combinar las ventajas de la recuperación y la generación para proporcionar respuestas e información más precisas a los usuarios. En este artículo, le guiaremos paso a paso sobre cómo construir un sistema RAG seguro con conciencia de etiquetas de sensibilidad utilizando Azure AI Search y Purview.

Requisitos previos

Antes de comenzar, asegúrese de cumplir con los siguientes requisitos:

  • Cuenta de Azure: Necesita una cuenta de Azure válida para acceder a Azure AI Search y Azure Purview.
  • Conocimiento básico de los servicios de Azure: Tener un conocimiento básico sobre Azure, incluyendo cómo crear grupos de recursos y servicios.
  • Conocimientos básicos de programación: Algunos ejemplos en este artículo pueden requerir conocimientos básicos de programación en Python o PowerShell.
  • Pasos detallados

    Paso 1: Crear el servicio Azure AI Search

  • Inicie sesión en el portal de Azure.
  • Haga clic en "Crear recurso" en el menú de la izquierda.
  • Escriba "Azure Search" en el cuadro de búsqueda, seleccione "Azure Cognitive Search" y luego haga clic en "Crear".
  • Complete la información necesaria, como nombre, suscripción, grupo de recursos y ubicación, y luego haga clic en "Revisar + crear".
  • Una vez que confirme que la información es correcta, haga clic en "Crear".
  • Después de crear el servicio Azure AI Search, podrá encontrar la información del servicio relevante en el portal.
    

    Paso 2: Crear una cuenta de Azure Purview

  • Inicie sesión en el portal de Azure.
  • Haga clic en "Crear recurso".
  • Escriba "Purview" en el cuadro de búsqueda y luego seleccione "Azure Purview".
  • Complete la información necesaria, como nombre de cuenta, suscripción, grupo de recursos y región, y luego haga clic en "Revisar + crear".
  • Espere a que se complete el despliegue del recurso.
  • El servicio Purview puede ayudarle a gestionar la clasificación de datos y las etiquetas de sensibilidad.
    

    Paso 3: Configurar la fuente de datos y las etiquetas de sensibilidad

  • En el portal de Azure Purview, haga clic en "Fuentes de datos".
  • Seleccione "Agregar fuente de datos", ingrese la información relevante y conéctese a su fuente de datos.
  • Configure el escaneo de datos. Puede elegir escaneo automático o manual.
  • En la clasificación de datos, personalice las etiquetas de sensibilidad, por ejemplo: datos personales, información financiera, datos confidenciales, etc.
  • A través de Purview, puede gestionar fácilmente las etiquetas de sensibilidad de los datos.
    

    Paso 4: Integrar Azure AI Search

  • Cree un nuevo índice, configurando el índice en el servicio de búsqueda de Azure a través de la API REST o SDK.
  • En el portal de Azure, cree un índice configurando los parámetros como campos, tipos de datos, etc.
  • {
    

    "name": "sample-index", "fields": [ {"name": "id", "type": "Edm.String", "key": true, "searchable": true}, {"name": "content", "type": "Edm.String", "searchable": true} ] }

  • Use el SDK para cargar datos en el índice de búsqueda.
  • Paso 5: Construir la lógica de procesamiento de solicitudes RAG

  • Utilice Azure Functions o servicios de aplicaciones para crear una interfaz API que reciba las solicitudes de consulta de los usuarios.
  • En esta interfaz, implemente la lógica de verificación de etiquetas de sensibilidad.
  • import requests
    

    def querysearch(query): # Implemente aquí la verificación de etiquetas de sensibilidad y acceda a la API de búsqueda según el resultado de la verificación. response = requests.get(f"?q={query}") return response.json()

    Paso 6: Devolver la respuesta procesada

    Después de procesar la consulta, obtenga información del índice de búsqueda y devuélvala al usuario, asegurándose de que el contenido de salida no revele ninguna información sensible.

    def processresponse(response):
    

    results = response.get('value', []) # Procese los resultados de búsqueda, filtrando información sensible. return results

    Preguntas frecuentes

  • ¿Cómo asegurar la seguridad de los datos?
  • - Utilice la función de gestión de etiquetas de sensibilidad de Azure Purview para garantizar un control estricto sobre la información sensible.

  • ¿Cómo manejar la información sensible en las consultas de los usuarios?
  • - Implemente un mecanismo de verificación de etiquetas de sensibilidad en la lógica de consulta, y tome las medidas adecuadas según las etiquetas, como ocultar ciertos datos.

  • ¿Qué tipos de fuentes de datos se pueden utilizar?
  • - Azure Purview admite diversas fuentes de datos, incluyendo Azure Blob Storage, bases de datos SQL, etc.

    Conclusión

    Construir un sistema RAG seguro con conciencia de etiquetas de sensibilidad puede requerir una cierta base técnica, pero siguiendo los pasos anteriores, podrá utilizar Azure AI Search y Purview para crear un sistema de recuperación de información eficiente y seguro. A través de una gestión de datos efectiva y un control de etiquetas de sensibilidad, asegúrese de que la información que maneja siempre se mantenga segura y cumpla con las normativas. ¡Esperamos que esta guía le sea de ayuda!

    Published in Technology

    You Might Also Like