Kā izmantot Azure AI Search un Purview: Pilnīga rokasgrāmata droša RAG izveidei ar jutīguma etiķetēm

2/25/2026
4 min read

Kā izmantot Azure AI Search un Purview: Pilnīga rokasgrāmata droša RAG izveidei ar jutīguma etiķetēm

Ievads

Mūsdienu datu pārvaldības un meklēšanas jomā ir īpaši svarīgi izveidot drošu RAG (Retrieval-Augmented Generation) sistēmu, kas apzinās jutīguma etiķetes. RAG spēj apvienot meklēšanas un ģenerēšanas priekšrocības, nodrošinot lietotājiem precīzākas atbildes un informāciju. Šajā rakstā mēs soli pa solim parādīsim, kā izveidot drošu RAG sistēmu ar jutīguma etiķešu apzināšanu, izmantojot Azure AI Search un Purview.

Priekšnosacījumi

Pirms uzsākt, lūdzu, pārliecinieties, ka jums ir šādi nosacījumi:

  • Azure konts: Jums nepieciešams derīgs Azure konts, lai piekļūtu Azure AI Search un Azure Purview.
  • Pamatzināšanas par Azure pakalpojumiem: Pamatzināšanas par Azure, tostarp kā izveidot resursu grupas un pakalpojumus.
  • Programmēšanas pamati: Daži šajā rakstā iekļautie piemēri var prasīt pamatzināšanas par Python vai PowerShell programmēšanu.
  • Detalizēti soļi

    Pirmais solis: izveidot Azure AI Search pakalpojumu

  • Piesakieties Azure portālā.
  • Noklikšķiniet uz kreisajā izvēlnē uz "Izveidot resursu".
  • Meklēšanas lodziņā ierakstiet "Azure Search", izvēlieties "Azure Cognitive Search", pēc tam noklikšķiniet uz "Izveidot".
  • Aizpildiet nepieciešamo informāciju, piemēram, nosaukumu, abonementu, resursu grupu un atrašanās vietu, pēc tam noklikšķiniet uz "Pārskatīt + izveidot".
  • Pārliecinieties, ka informācija ir pareiza, pēc tam noklikšķiniet uz "Izveidot".
  • Izveidojot Azure AI Search pakalpojumu, jūs varat atrast attiecīgo pakalpojuma informāciju portālā
    

    Otrais solis: izveidot Azure Purview kontu

  • Piesakieties Azure portālā.
  • Noklikšķiniet uz "Izveidot resursu".
  • Meklēšanas lodziņā ierakstiet "Purview", pēc tam izvēlieties "Azure Purview".
  • Aizpildiet nepieciešamo informāciju, piemēram, konta nosaukumu, abonementu, resursu grupu un reģionu, pēc tam noklikšķiniet uz "Pārskatīt + izveidot".
  • Gaidiet, līdz resursu izvietošana ir pabeigta.
  • Purview pakalpojums var palīdzēt jums pārvaldīt datu klasifikāciju un jutīguma etiķetes
    

    Trešais solis: konfigurēt datu avotus un jutīguma etiķetes

  • Azure Purview portālā noklikšķiniet uz "Datu avoti".
  • Izvēlieties "Pievienot datu avotu", ievadiet attiecīgo informāciju un izveidojiet savienojumu ar savu datu avotu.
  • Konfigurējiet datu skenēšanu. Jūs varat izvēlēties automātisko skenēšanu vai manuālo skenēšanu.
  • Datu klasifikācijā pielāgojiet jutīguma etiķetes, piemēram: personas dati, finanšu informācija, konfidenciāli dati utt.
  • Izmantojot Purview, jūs varat viegli pārvaldīt datu jutīguma etiķetes
    

    Ceturtais solis: integrēt Azure AI Search

  • Izveidojiet jaunu indeksu, konfigurējot indeksu Azure meklēšanas pakalpojumā, izmantojot REST API vai SDK.
  • Azure portālā izveidojiet indeksu, definējot laukus, datu tipus un citus parametrus, lai konfigurētu indeksu.
  • {
    

    "name": "sample-index", "fields": [ {"name": "id", "type": "Edm.String", "key": true, "searchable": true}, {"name": "content", "type": "Edm.String", "searchable": true} ] }

  • Izmantojiet SDK, lai ielādētu datus meklēšanas indeksā.
  • Piektā darbība: izveidot RAG pieprasījumu apstrādes loģiku

  • Izmantojiet Azure Functions vai lietojumprogrammu pakalpojumus, lai izveidotu API interfeisu, kas saņem lietotāju meklēšanas pieprasījumus.
  • Šajā interfeisā īstenojiet jutīguma etiķešu pārbaudes loģiku.
  • import requests
    

    def querysearch(query): # Šeit īstenojiet jutīguma etiķešu pārbaudi un, pamatojoties uz pārbaudes rezultātiem, piekļūstiet meklēšanas API response = requests.get(f"?q={query}") return response.json()

    Sestā darbība: atgriezt apstrādāto atbildi

    Pēc pieprasījuma apstrādes iegūstiet informāciju no meklēšanas indeksa un atgrieziet to lietotājam, vienlaikus nodrošinot, ka izvadītā informācija nesatur nekādu jutīgu informāciju.

    def processresponse(response):
    

    results = response.get('value', []) # Apstrādājiet meklēšanas rezultātus, filtrējot jutīgu informāciju return results

    Biežāk uzdotie jautājumi

  • Kā nodrošināt datu drošību?
  • - Izmantojiet Azure Purview jutīguma etiķešu pārvaldības funkcionalitāti, lai nodrošinātu stingru kontroli pār jutīgu informāciju.

  • Kā apstrādāt jutīgu informāciju lietotāju pieprasījumos?
  • - Izmantojiet pieprasījumu loģikā jutīguma etiķešu pārbaudes mehānismu, lai veiktu attiecīgu apstrādi atkarībā no etiķetēm, piemēram, slēpjot noteiktus datus.

  • Kurus datu avotus var izmantot?
  • - Azure Purview atbalsta dažādus datu avotus, tostarp Azure Blob Storage, SQL datu bāzes utt.

    Kopsavilkums

    Izveidot drošu RAG sistēmu ar jutīguma etiķešu apzināšanu, lai gan tas prasa noteiktas tehniskās zināšanas, tomēr, ja sekojat iepriekš minētajiem soļiem, jūs varat izmantot Azure AI Search un Purview, lai izveidotu efektīvu un drošu informācijas meklēšanas sistēmu. Ar efektīvu datu pārvaldību un jutīguma etiķešu kontroli nodrošiniet, ka jūsu apstrādātā informācija vienmēr ir droša un atbilstoša. Ceru, ka šī raksta norādījumi var jums palīdzēt!

    Published in Technology

    You Might Also Like