Obsidian выпустил Defuddle, подняв Obsidian Web Clipper на новый уровень
Obsidian выпустил Defuddle, подняв Obsidian Web Clipper на новый уровень
Мне всегда нравилась основная идея Obsidian: приоритет локального, все — это файлы, и это простые текстовые файлы Markdown. В такой модели заметки полностью принадлежат нам, мы можем свободно комбинировать различные компоненты или плагины, настраивать операции и рабочие процессы по своему усмотрению. Кроме того, сохранение, резервное копирование и синхронизация информации находятся под нашим контролем.
Ранее я представлял веб-клиппер, выпущенный Obsidian, браузерный плагин для сохранения веб-страниц, который также придерживается вышеупомянутой концепции "центра файлов", превращая содержимое веб-страницы, которую мы просматриваем, в заметку Markdown, сохраняемую в базе данных Obsidian, и также включает метаданные.
Недавно Obsidian запустил новый сайт, Defuddle.md, Defuddle — это очень мощный инструмент в экосистеме локальных файлов Obsidian, проще говоря, это веб-версия Obsidian Web Clipper.
Если рассматривать Obsidian как ОС для локальных заметок, то мы ранее обсуждали CLI (интерфейс командной строки), этот Defuddle больше похож на URL-интерфейс Obsidian Web Clipper.
Поэтому, прежде чем подробно рассмотреть Defuddle, давайте быстро вспомним о Web Clipper.
Obsidian Web Clipper: веб-страница становится Markdown
Говоря о Obsidian Web Clipper, я лично считаю, что его самая привлекательная черта заключается в том, что он давно превзошел традиционные функции сохранения и захвата веб-страниц.
Он не просто захватывает веб-страницы, но и поддерживает крайне гибкие шаблоны Obsidian. Web Clipper может извлекать различные метаданные с веб-страниц (например, автора, дату публикации и даже определенные элементы страницы). Меня особенно удивило, что он теперь также поддерживает логические операции, такие как условные операторы и циклы. Это означает, что на этапе сбора веб-страниц мы можем организовать содержимое по своим правилам, превращая его в чистый, структурированный локальный файл Markdown.
Конечно, недостаток в том, что если пользователю не нравится стандартный шаблон организации, ему нужно настроить его самостоятельно, и этот процесс может иметь некоторые барьеры (на самом деле, это можно сделать с помощью ИИ).
Но в целом, Obsidian Clipper идеально вписывается в экосистему Obsidian, позволяя веб-контенту очень плавно интегрироваться в нашу личную базу знаний. Для Power User он также предоставляет пространство для экспериментов. Не стоит недооценивать этих Power User, так как многие плагины Obsidian были созданы самими пользователями.
Defuddle.md: слой извлечения, сосредоточенный на очистке
Появление Defuddle заставляет меня думать, что Obsidian выделил основную способность извлечения веб-страниц, стоящую за Web Clipper, в отдельный инструмент.
Если вы являетесь сборщиком информации в какой-либо области, исследователем или аналитиком данных... Если вы можете немного поэкспериментировать или воспользоваться ИИ (включая недавно популярного маленького рака), то Defuddle.md определенно станет для вас приятным сюрпризом!
Дайте Defuddle ссылку, и он поможет вам очистить веб-страницу от рекламы, рекомендательных зон и других беспорядочных элементов, стараясь извлечь чистый текст и структурированные метаданные. Он как бы является очистителем, который отвечает за преобразование сложных веб-страниц в стандартный текст Markdown. С этим любая osoba может создать свой собственный Web Clipper, не будучи привязанным к Obsidian.
Defuddle предлагает несколько способов доступа.
- Обычные пользователи, доступ через браузер, вводят URL веб-страницы, которую нужно преобразовать, и просматривают очищенный HTML или Markdown.
- AI Agent или разработчики, через URL-интерфейс, получают результаты очистки и преобразования.
- Пользователи Obsidian могут просто использовать плагин Web Clipper (за ним стоит Defuddle).
Кроме того, очень важно, что Defuddle является открытым исходным кодом. Мы даже можем развернуть его локально. Это очень в духе Obsidian. Позволяя приложению стать системой, которую пользователь может контролировать, а не превращая пользователя в придаток приложения.
В заключение
На рынке на самом деле много плагинов для захвата, многие из которых нацелены на привязку пользователя к какому-то конкретному приложению. Однако Obsidian Web Clipper отличается, потому что концепция Obsidian — это "файл важнее приложения". Теперь, с открытием Defuddle, все могут использовать его напрямую, и он также является открытым исходным кодом. Так что это немного слишком щедро, и это может не соответствовать ожиданиям.
Если вас интересует этот тип захвата веб-страниц (как важная часть PKM), ранее Jina.ai также предлагала платный Reader API (см. рисунок ниже). Jina является выбором многих специалистов по ИИ, и теперь, похоже, у нее появился бесплатный открытый конкурент. Конечно, Jina утверждает, что это ИИ-модель для очистки захвата, и это немного отличается.
Честно говоря, я теперь начинаю беспокоиться, что Defuddle может быть злоупотреблен (или заблокирован).

