Cách sử dụng Azure AI Search và Purview: Hướng dẫn đầy đủ để xây dựng hệ thống RAG an toàn nhận thức về nhãn nhạy cảm

2/25/2026
5 min read

Cách sử dụng Azure AI Search và Purview: Hướng dẫn đầy đủ để xây dựng hệ thống RAG an toàn nhận thức về nhãn nhạy cảm

Giới thiệu

Trong lĩnh vực quản lý dữ liệu và tìm kiếm hiện đại, việc xây dựng một hệ thống RAG (Retrieval-Augmented Generation) nhận thức về nhãn nhạy cảm trở nên đặc biệt quan trọng. RAG có thể kết hợp những lợi thế của việc truy xuất và tạo ra, cung cấp cho người dùng câu trả lời và thông tin chính xác hơn. Trong bài viết này, chúng tôi sẽ hướng dẫn bạn từng bước cách xây dựng một hệ thống RAG an toàn có chức năng nhận thức về nhãn nhạy cảm thông qua Azure AI Search và Purview.

Điều kiện tiên quyết

Trước khi bắt đầu, hãy đảm bảo bạn có những điều kiện sau:

  • Tài khoản Azure: Bạn cần một tài khoản Azure hợp lệ để truy cập Azure AI Search và Azure Purview.
  • Hiểu biết cơ bản về dịch vụ Azure: Có hiểu biết cơ bản về Azure, bao gồm cách tạo nhóm tài nguyên và dịch vụ.
  • Kiến thức lập trình cơ bản: Một số ví dụ trong bài viết này có thể yêu cầu kiến thức lập trình cơ bản về Python hoặc PowerShell.
  • Các bước chi tiết

    Bước 1: Tạo dịch vụ Azure AI Search

  • Đăng nhập vào Cổng Azure.
  • Nhấp vào "Tạo tài nguyên" trong menu bên trái.
  • Nhập "Azure Search" vào ô tìm kiếm, chọn "Azure Cognitive Search", sau đó nhấp vào "Tạo".
  • Điền thông tin cần thiết như tên, đăng ký, nhóm tài nguyên và vị trí, sau đó nhấp vào "Xem lại + Tạo".
  • Xác nhận thông tin chính xác, sau đó nhấp vào "Tạo".
  • Sau khi tạo dịch vụ Azure AI Search, bạn có thể tìm thấy thông tin dịch vụ liên quan trong cổng.
    

    Bước 2: Tạo tài khoản Azure Purview

  • Đăng nhập vào Cổng Azure.
  • Nhấp vào "Tạo tài nguyên".
  • Nhập "Purview" vào ô tìm kiếm, sau đó chọn "Azure Purview".
  • Điền thông tin cần thiết như tên tài khoản, đăng ký, nhóm tài nguyên và khu vực, sau đó nhấp vào "Xem lại + Tạo".
  • Chờ đợi quá trình triển khai tài nguyên hoàn tất.
  • Dịch vụ Purview có thể giúp bạn quản lý phân loại dữ liệu và nhãn nhạy cảm.
    

    Bước 3: Cấu hình nguồn dữ liệu và nhãn nhạy cảm

  • Trong cổng Azure Purview, nhấp vào "Nguồn dữ liệu".
  • Chọn "Thêm nguồn dữ liệu", nhập thông tin liên quan, kết nối với nguồn dữ liệu của bạn.
  • Cấu hình quét dữ liệu. Bạn có thể chọn quét tự động hoặc quét thủ công.
  • Trong phân loại dữ liệu, tùy chỉnh nhãn nhạy cảm, ví dụ: dữ liệu cá nhân, thông tin tài chính, dữ liệu bí mật, v.v.
  • Thông qua Purview, bạn có thể dễ dàng quản lý nhãn nhạy cảm của dữ liệu.
    

    Bước 4: Tích hợp Azure AI Search

  • Tạo một chỉ mục mới, cấu hình chỉ mục trong dịch vụ tìm kiếm Azure thông qua REST API hoặc SDK.
  • Tạo chỉ mục trong Cổng Azure, cấu hình chỉ mục bằng cách định nghĩa các trường, loại dữ liệu và các tham số khác.
  • {
    

    "name": "sample-index", "fields": [ {"name": "id", "type": "Edm.String", "key": true, "searchable": true}, {"name": "content", "type": "Edm.String", "searchable": true} ] }

  • Sử dụng SDK để tải dữ liệu vào chỉ mục tìm kiếm.
  • Bước 5: Xây dựng logic xử lý yêu cầu RAG

  • Sử dụng Azure Functions hoặc dịch vụ ứng dụng để tạo một giao diện API, nhận yêu cầu truy vấn từ người dùng.
  • Trong giao diện đó, triển khai logic kiểm tra nhãn nhạy cảm.
  • import requests
    

    def querysearch(query): # Triển khai kiểm tra nhãn nhạy cảm tại đây và truy cập API tìm kiếm dựa trên kết quả kiểm tra response = requests.get(f"?q={query}") return response.json()

    Bước 6: Trả về phản hồi đã xử lý

    Sau khi xử lý truy vấn, lấy thông tin từ chỉ mục tìm kiếm và trả lại cho người dùng, đồng thời đảm bảo nội dung đầu ra không tiết lộ bất kỳ thông tin nhạy cảm nào.

    def processresponse(response):
    

    results = response.get('value', []) # Xử lý kết quả tìm kiếm, lọc thông tin nhạy cảm return results

    Câu hỏi thường gặp

  • Làm thế nào để đảm bảo an toàn cho dữ liệu?
  • - Sử dụng chức năng quản lý nhãn nhạy cảm của Azure Purview để đảm bảo kiểm soát chặt chẽ đối với thông tin nhạy cảm.

  • Làm thế nào để xử lý thông tin nhạy cảm trong truy vấn của người dùng?
  • - Triển khai cơ chế kiểm tra nhãn nhạy cảm trong logic truy vấn, thực hiện xử lý tương ứng dựa trên nhãn, chẳng hạn như ẩn một số dữ liệu.

  • Có thể sử dụng những loại nguồn dữ liệu nào?
  • - Azure Purview hỗ trợ nhiều loại nguồn dữ liệu, bao gồm Azure Blob Storage, cơ sở dữ liệu SQL, v.v.

    Kết luận

    Xây dựng một hệ thống RAG an toàn nhận thức về nhãn nhạy cảm mặc dù cần một số kiến thức kỹ thuật, nhưng chỉ cần làm theo các bước trên, bạn có thể sử dụng Azure AI Search và Purview để tạo ra một hệ thống tìm kiếm thông tin hiệu quả và an toàn. Thông qua quản lý dữ liệu hiệu quả và kiểm soát nhãn nhạy cảm, đảm bảo thông tin bạn xử lý luôn được bảo mật và tuân thủ. Hy vọng hướng dẫn trong bài viết này có thể giúp ích cho bạn!

    Published in Technology

    You Might Also Like

    📝
    Technology

    Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng

    Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng Ngày 1 tháng 4 năm 2026, Anthropic đã âm...

    Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mớiTechnology

    Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới

    Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới Tôi luôn rất thích triết lý cốt lõi của Obsid...

    OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm quaTechnology

    OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm qua

    OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường tro...

    2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đếnHealth

    2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến

    2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến Năm mới bắt đầu, năm ngoái bạn đã ...

    Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều nàyHealth

    Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này

    Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này Tháng Ba đã qua nửa, kế hoạch giảm...

    📝
    Technology

    Hướng dẫn vận hành ổn định AI Browser 24 giờ

    Hướng dẫn vận hành ổn định AI Browser 24 giờ Bài hướng dẫn này giới thiệu cách thiết lập một môi trường AI Browser ổn đị...