Obsidian გამოუშვა Defuddle, Obsidian Web Clipper ახალ დონეზე გადაიყვანა
Obsidian გამოუშვა Defuddle, Obsidian Web Clipper ახალ დონეზე გადაიყვანა
მე ყოველთვის ძალიან მომწონდა Obsidian-ის ძირითადი იდეა: ადგილობრივი პრიორიტეტი, ყველაფერი ფაილია და ეს არის უბრალო Markdown ტექსტური ფაილები. ასეთ მოდელში, შენიშვნები სრულიად ჩვენს საკუთრებაშია, ჩვენ თავისუფლად შეგვიძლია სხვადასხვა კომპონენტების ან პლაგინების კომბინირება, ჩვენი ჩვევების მიხედვით ოპერაციების და სამუშაო პროცესების მორგება. და რაც მთავარია, ინფორმაციის შენახვა, სარეზერვო და სინქრონიზაცია ჩვენს კონტროლშია.
მე ადრე ვახსენე Obsidian-ის მიერ გაწვდილი Web Clipper, ვებსაიტის შენახვის ბრაუზერის პლაგინი, რომელიც ასევე ემორჩილება ზემოთ აღნიშნულ "ფაილის ცენტრის" იდეას, რაც ჩვენს მიერ ნავიგირებულ ვებსაიტზე არსებული შინაარსის Markdown შენიშვნად გადაქცევას და Obsidian-ის მონაცემთა ბაზაში შენახვას გულისხმობს, და ასევე მოიცავს მეტა ინფორმაცია.
ბოლო დროს Obsidian-მა გამოუშვა ახალი ვებსაიტი, Defuddle.md, Defuddle არის Obsidian-ის ადგილობრივი ფაილების ეკოსისტემაში ძალიან ძლიერი ინსტრუმენტი, მარტივად რომ ვთქვათ, ეს არის Obsidian Web Clipper-ის ვერსია ვებსაიტზე.
თუ Obsidian-ს ადგილობრივი შენიშვნების ოპერაციული სისტემა ვუწოდებთ, ჩვენ ადრე ვახსენეთ CLI (კომანდის ხაზის ინტერფეისი), ეს Defuddle უფრო ჰგავს Obsidian Web Clipper-ის URL ინტერფეისს.
ასე რომ, Defuddle-ის დეტალურ განხილვამდე, სწრაფად გადავხედოთ Web Clipper-ს.
Obsidian Web Clipper: ვებსაიტი Markdown-ში
Obsidian Web Clipper-ის შესახებ საუბრისას, პირადად მე ვფიქრობ, რომ მისი ყველაზე მიმზიდველი მხარე ის არის, რომ ის უკვე დიდი ხანია გადააჭარბა ტრადიციულ ვებსაიტების შენახვის ფუნქციას.
ეს არ არის მხოლოდ ვებსაიტის ჩამოტვირთვა, უფრო ძლიერია ის, რომ ის მხარს უჭერს ძალიან მოქნილ Obsidian-ის შაბლონებს. Web Clipper შეუძლია გამოიტანოს ვებსაიტზე არსებული სხვადასხვა მეტა მონაცემები (მაგალითად, ავტორი, გამოქვეყნების თარიღი, 심甚至特定的页面元素). უფრო მეტად მიკვირს, რომ ახლა ის ასევე მხარს უჭერს პირობების განსაზღვრას, ციკლებს და ამ ლოგიკურ ოპერაციებს. ეს ნიშნავს, რომ ვებსაიტის შეგროვების ეტაპზე, ჩვენ შეგვიძლია ჩვენი წესების მიხედვით შინაარსის ორგანიზება, პირდაპირ გადავაქციოთ სუფთა, სტრუქტურირებულ ადგილობრივ Markdown ფაილში.
რა თქმა უნდა, ნაკლი ის არის, რომ თუ მომხმარებელს არ მოსწონს დეფოლტური ორგანიზაციის შაბლონი, მას უნდა დააკონფიგურიროს, ეს პროცესი შეიძლება ჰქონდეს გარკვეული ბარიერები (მართალია, ეს შეიძლება AI-ს მეშვეობით გაკეთდეს).
მაგრამ ზოგადად, Obsidian Clipper სრულყოფილად შეესაბამება Obsidian-ის ეკოსისტემას, რაც ვებსაიტის შინაარსის ძალიან სუფთა ინტეგრაციას ჩვენს პირად ცოდნის ბაზაში. Power User-ებისთვის, ის ასევე უზრუნველყოფს საკუთარი ექსპერიმენტების სივრცეს. ნუ დაივიწყებთ ამ Power User-ებს, იმდენი Obsidian პლაგინი, უმეტესობა მომხმარებლების მიერ შექმნილია.
Defuddle.md: ყურადღება სუფთა გამოტანის ფენაზე
Defuddle-ის გამოჩენა让我觉得 Obsidian 是把 Web Clipper 背后最核心的网页抽取能力单独开放出来了。
如果,大家是某个信息领域的资料收集者,调研者,数据分析者 …… 如果自己又能稍微捣鼓两下,又或者借助 AI(包括最近大火的小龙虾)捣鼓两下。 那么Defuddle.md 绝对是一个惊喜!
给 Defuddle 一个链接,它就能帮你清洗掉网页上的广告、推荐区等杂乱元素,尽量提取出干净的正文和结构化的元数据。它就像是一个专门负责把复杂网页转化为标准 Markdown 文本的净化器。 有了这个,任何人都可以做一个自己的 Web Clipper,而且不用隶属于 Obsidian。
Defuddle 提供几种访问方式。
- 普通用户,浏览器访问,输入需要转换的网页网址,查看清洗过的 HTML 或 Markdown
- AI Agent 或 开发者, 通过 URL 接口,获取清洗转换结果
- Obsidian 用户, 直接使用 Web Clipper 插件 即可(背后就是 Defuddle)。
而且,很重要的是,Defuddle 是开源的。我们甚至可以自己本地部署。这就很 Obsidian 了。 让 App 成为用户自己可以控制的系统,而不是把用户变成 App 的附庸。
最后
市面上,其实剪藏插件很多,其中不少的目的是锁定用户到某个特定App。 而 Obsidian Web Clipper 不同, 因为 Obsidian 理念是 File Over App。 现在,更进一步, Defuddle 被开放出来,大家可以直接用了,而且还是开源的。 所以,有点太阔绰了,反而不适应了。
如果对这类网页抓取(作为PKM重要组成部分)有兴趣的话,之前 Jina.ai 也提供了付费的 Reader API (下图)。Jina 是很多 AI 从业者的首选,现在则感觉有了一个免费开源的对手。当然,Jina号称是 AI模型 清洗抓取,还略有不同。
说实话,我现在反而开始担心 Defuddle 要被人滥用了(或者被屏蔽了)。

