Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới

3/26/2026
6 min read

Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới

图片

Tôi luôn rất thích triết lý cốt lõi của Obsidian: ưu tiên địa phương, mọi thứ đều là tệp, và đó là tệp văn bản Markdown đơn giản. Trong mô hình này, ghi chú hoàn toàn thuộc về chúng ta, chúng ta có thể tự do kết hợp các thành phần hoặc plugin khác nhau, tùy chỉnh thao tác và quy trình làm việc theo thói quen của mình. Hơn nữa, việc lưu trữ, sao lưu và đồng bộ thông tin đều nằm trong tầm kiểm soát của chúng ta.

Tôi đã từng giới thiệu về Obsidian Web Clipper, một plugin trình duyệt loại lưu trữ trang web do Obsidian phát triển, cũng tuân theo triết lý "trung tâm tệp" đã nêu, biến nội dung trang web mà chúng ta đang duyệt thành một ghi chú Markdown, lưu vào cơ sở dữ liệu của Obsidian, và còn bao gồm cả thông tin siêu dữ liệu.

Gần đây, Obsidian đã ra mắt một trang web mới, Defuddle.md, Defuddle là một công cụ rất mạnh trong hệ sinh thái tệp địa phương của Obsidian, nói một cách đơn giản, là phiên bản web của Obsidian Web Clipper.

Nếu coi Obsidian như một hệ điều hành ghi chú địa phương, chúng ta đã từng giới thiệu CLI (giao diện dòng lệnh), thì Defuddle giống như một giao diện URL của Obsidian Web Clipper.

Vì vậy, trước khi đi sâu vào Defuddle, chúng ta hãy nhanh chóng xem lại Web Clipper.

Obsidian Web Clipper: Trang web trở thành Markdown

Khi nói về Obsidian Web Clipper, tôi cá nhân cảm thấy điều hấp dẫn nhất của nó là nó đã vượt xa chức năng lưu trữ trang web truyền thống.

图片

Nó không chỉ đơn thuần là lưu lại trang web, mà còn hỗ trợ các mẫu Obsidian cực kỳ linh hoạt. Web Clipper có thể trích xuất nhiều siêu dữ liệu từ trang web (chẳng hạn như tác giả, thời gian phát hành, thậm chí là các phần tử trang cụ thể). Điều khiến tôi ngạc nhiên hơn nữa là nó hiện nay còn hỗ trợ các thao tác logic như điều kiện và vòng lặp. Điều này có nghĩa là, trong giai đoạn thu thập trang web, chúng ta có thể sắp xếp nội dung theo quy tắc của riêng mình, trực tiếp biến nó thành tệp Markdown địa phương sạch sẽ và có cấu trúc.

Tất nhiên, nhược điểm là nếu người dùng không thích mẫu sắp xếp mặc định, họ cần tự cấu hình, quá trình này có thể có một số rào cản (thực ra có thể để AI làm điều đó).

Nhưng tổng thể mà nói, Obsidian Clipper hoàn toàn phù hợp với hệ sinh thái của Obsidian, giúp nội dung trang web hòa nhập một cách mượt mà vào kho kiến thức cá nhân của chúng ta. Đối với người dùng chuyên nghiệp, nó còn cung cấp không gian để tự mày mò. Đừng xem nhẹ những người dùng chuyên nghiệp này, rất nhiều plugin Obsidian đều do người dùng tự phát triển.

Defuddle.md: Tầng trích xuất tập trung vào làm sạch

Sự xuất hiện của Defuddle khiến tôi cảm thấy Obsidian đã tách riêng khả năng trích xuất trang web cốt lõi nhất của Web Clipper.

Nếu bạn là một người thu thập thông tin trong một lĩnh vực nào đó, nhà nghiên cứu, nhà phân tích dữ liệu... Nếu bạn có thể tự mày mò một chút, hoặc nhờ vào AI (bao gồm cả con tôm hùm nhỏ đang nổi gần đây) để mày mò. Thì Defuddle.md chắc chắn là một điều bất ngờ!

图片

Cho Defuddle một liên kết, nó có thể giúp bạn làm sạch quảng cáo, khu vực gợi ý và các yếu tố lộn xộn khác trên trang web, cố gắng trích xuất nội dung chính và siêu dữ liệu có cấu trúc sạch sẽ. Nó giống như một bộ lọc chuyên trách chuyển đổi các trang web phức tạp thành văn bản Markdown tiêu chuẩn. Với điều này, bất kỳ ai cũng có thể tạo ra một Web Clipper của riêng mình mà không cần phải thuộc về Obsidian.

Defuddle cung cấp một số cách truy cập.

  • Người dùng thông thường, truy cập qua trình duyệt, nhập địa chỉ trang web cần chuyển đổi, xem HTML hoặc Markdown đã được làm sạch
  • AI Agent hoặc nhà phát triển, thông qua giao diện URL, nhận kết quả làm sạch và chuyển đổi
  • Người dùng Obsidian, chỉ cần sử dụng plugin Web Clipper (đằng sau chính là Defuddle).
Trong số đó, tôi cảm thấy giá trị nhất chính là "giao diện URL", hãy tưởng tượng tôi là một con tôm hùm nhỏ, vừa điếc vừa mù, việc thu thập và truy cập trang web theo yêu cầu của người dùng rất đau khổ, vừa là trình duyệt không đầu, vừa bị chặn, ngay cả khi lấy được trang web, bên trong có rất nhiều tạp chất và tiếng ồn; bây giờ thì tốt rồi, chỉ cần gọi Defuddle là mọi thứ được giải quyết.

Hơn nữa, điều quan trọng là, Defuddle là mã nguồn mở. Chúng ta thậm chí có thể tự triển khai tại địa phương. Điều này thật sự rất Obsidian. Để ứng dụng trở thành một hệ thống mà người dùng có thể kiểm soát, thay vì biến người dùng thành phụ thuộc vào ứng dụng.

Cuối cùng

Trên thị trường, thực ra có rất nhiều plugin lưu trữ, trong đó nhiều plugin nhằm mục đích khóa người dùng vào một ứng dụng cụ thể. Nhưng Obsidian Web Clipper thì khác, vì triết lý của Obsidian là Tệp Trên Ứng Dụng. Bây giờ, một bước xa hơn, Defuddle đã được mở ra, mọi người có thể sử dụng trực tiếp, và còn là mã nguồn mở. Vì vậy, có phần quá hào phóng, ngược lại không thích ứng.

Nếu bạn quan tâm đến việc thu thập trang web (như một phần quan trọng của PKM), trước đây Jina.ai cũng đã cung cấp API Reader trả phí (hình dưới). Jina là lựa chọn hàng đầu của nhiều người làm trong lĩnh vực AI, bây giờ có vẻ như đã có một đối thủ miễn phí và mã nguồn mở. Tất nhiên, Jina tuyên bố là mô hình AI làm sạch thu thập, vẫn có chút khác biệt.

图片

Nói thật lòng, bây giờ tôi lại bắt đầu lo lắng rằng Defuddle sẽ bị người khác lạm dụng (hoặc bị chặn).

图片
Published in Technology

You Might Also Like

📝
Technology

Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng

Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng Ngày 1 tháng 4 năm 2026, Anthropic đã âm...

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm quaTechnology

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm qua

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường tro...

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đếnHealth

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến Năm mới bắt đầu, năm ngoái bạn đã ...

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều nàyHealth

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này Tháng Ba đã qua nửa, kế hoạch giảm...

📝
Technology

Hướng dẫn vận hành ổn định AI Browser 24 giờ

Hướng dẫn vận hành ổn định AI Browser 24 giờ Bài hướng dẫn này giới thiệu cách thiết lập một môi trường AI Browser ổn đị...

📝
Technology

Hướng dẫn cấu hình Agent-Browser: Tái sử dụng trạng thái đăng nhập trình duyệt qua CDP

Hướng dẫn cấu hình Agent-Browser: Tái sử dụng trạng thái đăng nhập trình duyệt qua CDP\n\nHướng dẫn này giúp bạn cài đặt...