ObsidianはDefuddleを発表し、Obsidian Web Clipperを新たな高みへと引き上げた
ObsidianはDefuddleを発表し、Obsidian Web Clipperを新たな高みへと引き上げた
私はObsidianのコア理念がとても好きです:ローカルファースト、すべてはファイル、そして単純なMarkdownテキストファイルです。このようなモデルでは、ノートは完全に私たち自身のものであり、さまざまなコンポーネントやプラグインを自由に組み合わせ、自分の習慣に従って操作やワークフローをカスタマイズできます。また、情報の保存、バックアップ、同期はすべて私たちのコントロール下にあります。
以前、Obsidianが自社で発表したWeb Clipperについて紹介しました。これはウェブページをクリップするためのブラウザプラグインで、上記の「ファイル中心」理念を引き継ぎ、私たちが閲覧しているウェブページの内容をMarkdownノートに変換し、Obsidianのデータベースに保存します。また、メタ情報も含まれています。
最近、Obsidianは新しいウェブサイト、Defuddle.mdを発表しました。DefuddleはObsidianのローカルファイルエコシステムの中で非常に強力なツールであり、簡単に言えば、Obsidian Web Clipperのウェブ版です。
もしObsidianをローカルノートのOSと考えるなら、以前紹介したCLI(コマンドラインインターフェース)に対して、このDefuddleはObsidian Web ClipperのURLインターフェースのようなものです。
したがって、Defuddleを詳しく解説する前に、まずWeb Clipperを簡単に振り返りましょう。
Obsidian Web Clipper:ウェブページをMarkdownに変換
Obsidian Web Clipperについて話すと、私個人としては、その最も魅力的な点は、すでに従来のウェブ保存機能を超えていると感じています。
それは単にウェブページをキャッチするだけでなく、非常に柔軟なObsidianテンプレートをサポートしています。Web Clipperはウェブページ内のさまざまなメタデータ(例えば、著者、公開日時、特定のページ要素など)を抽出できます。さらに驚いたことに、現在は条件判断やループなどの論理操作もサポートしています。これは、ウェブページを収集する段階で、自分のルールに従って内容を整理し、直接クリーンで構造化されたローカルMarkdownファイルに変換できることを意味します。
もちろん、欠点は、ユーザーがデフォルトの整理テンプレートを好まない場合、自己設定が必要であり、このプロセスにはいくつかのハードルがあるかもしれません(実際にはAIに設定させることもできます)。
しかし、全体的に見て、Obsidian ClipperはObsidianのエコシステムに完璧にフィットし、ウェブページの内容を非常にスムーズに私たちの個人的な知識ベースに統合します。Power Userにとっては、自分でいじるスペースも提供しています。これらのPower Userを軽視してはいけません。多くのObsidianプラグインは、ユーザー自身が作り出したものです。
Defuddle.md:クリーンアップに特化した抽出レイヤー
Defuddleの登場により、ObsidianはWeb Clipperの背後にある最もコアなウェブ抽出能力を単独で開放したと感じています。
もし、皆さんが特定の情報分野の資料収集者、リサーチャー、データアナリストであれば……少し手を加えることができるなら、またはAI(最近人気のある小龍虾を含む)を使って少し手を加えることができるなら、Defuddle.mdは絶対に驚きです!
Defuddleにリンクを与えると、ウェブページ上の広告、推奨エリアなどの雑多な要素をクリーンアップし、できるだけクリーンな本文と構造化されたメタデータを抽出します。それは、複雑なウェブページを標準的なMarkdownテキストに変換することを専門とする浄化器のようです。これがあれば、誰でも自分自身のWeb Clipperを作成でき、Obsidianに依存する必要はありません。
Defuddleは、いくつかのアクセス方法を提供しています。
- 一般ユーザーは、ブラウザでアクセスし、変換したいウェブページのURLを入力して、クリーンアップされたHTMLまたはMarkdownを確認できます。
- AIエージェントまたは開発者は、URLインターフェースを通じて、クリーンアップ変換結果を取得できます。
- Obsidianユーザーは、Web Clipperプラグインを直接使用できます(その背後にはDefuddleがあります)。
さらに重要なのは、Defuddleはオープンソースであることです。私たちは自分のローカルにデプロイすることもできます。これがまさにObsidianです。アプリをユーザー自身が制御できるシステムにし、ユーザーをアプリの従属物にしないようにします。
最後に
市場には、実際に多くのクリッピングプラグインがありますが、その多くは特定のアプリにユーザーをロックインすることを目的としています。しかし、Obsidian Web Clipperは異なります。なぜなら、Obsidianの理念はFile Over Appだからです。今、さらに一歩進んで、Defuddleがオープンにされ、誰でも直接使用でき、しかもオープンソースです。ですので、少し贅沢すぎるかもしれません。
このようなウェブページの収集(PKMの重要な構成要素として)に興味がある場合、以前Jina.aiも有料のReader APIを提供していました(下の画像)。Jinaは多くのAI業界の人々の選択肢であり、今では無料のオープンソースの競合ができたように感じます。もちろん、JinaはAIモデルによるクリーンアップを謳っていますが、少し異なります。
正直なところ、私は今、Defuddleが悪用されることを心配し始めています(またはブロックされることを)。

