Obsidian a lancé Defuddle, élevant Obsidian Web Clipper à un nouveau niveau

3/26/2026
5 min read

Obsidian a lancé Defuddle, élevant Obsidian Web Clipper à un nouveau niveau

图片

J'ai toujours aimé la philosophie fondamentale d'Obsidian : priorité au local, tout est fichier, et ce sont de simples fichiers texte Markdown. Dans ce modèle, les notes nous appartiennent entièrement, nous pouvons librement combiner divers composants ou plugins, et personnaliser nos opérations et flux de travail selon nos habitudes. De plus, la sauvegarde et la synchronisation des informations sont entièrement sous notre contrôle.

J'ai précédemment présenté le Web Clipper d'Obsidian, un plugin de navigateur pour la capture de contenu web, qui adhère également à la philosophie du "centre de fichiers" mentionnée ci-dessus, transformant le contenu des pages web que nous consultons en une note Markdown, stockée dans la base de données d'Obsidian, et incluant également des métadonnées.

Récemment, Obsidian a lancé un nouveau site, Defuddle.md. Defuddle est un outil très puissant dans l'écosystème des fichiers locaux d'Obsidian, en termes simples, c'est la version web d'Obsidian Web Clipper.

Si l'on considère Obsidian comme un système d'exploitation pour les notes locales, nous avons précédemment introduit le CLI (interface en ligne de commande), Defuddle ressemble davantage à une interface URL pour Obsidian Web Clipper.

Donc, avant de plonger dans les détails de Defuddle, faisons un rapide retour sur Web Clipper.

Obsidian Web Clipper : des pages web en Markdown

En parlant d'Obsidian Web Clipper, je pense personnellement que ce qui le rend le plus attrayant, c'est qu'il a déjà dépassé les fonctionnalités traditionnelles de sauvegarde et de capture de pages web.

图片

Il ne se contente pas de capturer des pages web, ce qui est encore plus impressionnant, c'est qu'il prend en charge des modèles Obsidian extrêmement flexibles. Web Clipper peut extraire diverses métadonnées des pages web (comme l'auteur, la date de publication, et même des éléments de page spécifiques). Ce qui m'a encore plus surpris, c'est qu'il prend maintenant en charge des opérations logiques telles que des conditions et des boucles. Cela signifie qu'au stade de la collecte des pages web, nous pouvons organiser le contenu selon nos propres règles, le transformant directement en fichiers Markdown locaux propres et structurés.

Bien sûr, l'inconvénient est que si l'utilisateur n'aime pas le modèle d'organisation par défaut, il doit le configurer lui-même, ce qui peut présenter certaines barrières (en fait, l'IA peut s'en charger).

Mais dans l'ensemble, Obsidian Clipper s'intègre parfaitement à l'écosystème d'Obsidian, permettant au contenu web de s'intégrer très facilement dans notre base de connaissances personnelle. Pour les utilisateurs avancés, cela offre également un espace pour expérimenter. Ne sous-estimez pas ces utilisateurs avancés, tant de plugins Obsidian ont été créés par les utilisateurs eux-mêmes.

Defuddle.md : une couche d'extraction axée sur le nettoyage

L'apparition de Defuddle me fait penser qu'Obsidian a ouvert séparément la capacité d'extraction web la plus essentielle derrière Web Clipper.

Si vous êtes un collecteur d'informations, un chercheur, un analyste de données dans un domaine d'information... Si vous pouvez également bricoler un peu, ou utiliser l'IA (y compris le récent petit homard à la mode) pour bricoler un peu. Alors Defuddle.md est absolument une surprise !

图片

Donnez à Defuddle un lien, il peut vous aider à nettoyer les publicités, les zones de recommandations et autres éléments désordonnés sur la page web, en essayant d'extraire le texte principal propre et les métadonnées structurées. C'est comme un purificateur spécialement conçu pour transformer des pages web complexes en texte Markdown standard. Avec cela, n'importe qui peut créer son propre Web Clipper, sans être lié à Obsidian.

Defuddle propose plusieurs méthodes d'accès.

  • Utilisateurs ordinaires, accès via le navigateur, saisissez l'URL de la page web à convertir, visualisez le HTML ou Markdown nettoyé.
  • Agents IA ou développeurs, via l'interface URL, obtenez les résultats de nettoyage et de conversion.
  • Utilisateurs d'Obsidian, utilisez simplement le plugin Web Clipper (qui repose sur Defuddle).
Ce qui est le plus précieux, je pense, c'est l'"interface URL". Imaginez que je suis un petit homard, à la fois sourd et aveugle, collecter des pages web selon les exigences des utilisateurs est très douloureux, que ce soit avec un navigateur sans tête ou en étant bloqué, même si j'obtiens la page web, il y a beaucoup de bruit et d'impuretés à l'intérieur ; maintenant, c'est bien, il suffit d'appeler Defuddle et tout est résolu.

De plus, il est très important que Defuddle soit open source. Nous pouvons même le déployer localement. C'est très Obsidian. Cela permet à l'application de devenir un système que l'utilisateur peut contrôler, plutôt que de transformer l'utilisateur en un vassal de l'application.

Enfin

Sur le marché, il existe en fait de nombreux plugins de capture, dont beaucoup visent à verrouiller les utilisateurs dans une application spécifique. Cependant, Obsidian Web Clipper est différent, car la philosophie d'Obsidian est "Fichier plutôt qu'application". Maintenant, avec Defuddle ouvert, tout le monde peut l'utiliser directement, et c'est aussi open source. Donc, c'est un peu trop généreux, ce qui peut même être inadapté.

Si vous êtes intéressé par ce type de capture de pages web (en tant que composant important du PKM), Jina.ai a également proposé une API Reader payante (voir ci-dessous). Jina est le choix de nombreux professionnels de l'IA, et maintenant il semble avoir un concurrent open source gratuit. Bien sûr, Jina prétend être un modèle d'IA pour le nettoyage et la capture, ce qui est légèrement différent.

图片

Honnêtement, je commence maintenant à m'inquiéter que Defuddle soit abusé (ou bloqué).

图片
Published in Technology

You Might Also Like