Obsidian lanzó Defuddle, llevando Obsidian Web Clipper a un nuevo nivel
Obsidian lanzó Defuddle, llevando Obsidian Web Clipper a un nuevo nivel
Siempre me ha gustado la filosofía central de Obsidian: prioridad local, todo es un archivo, y son simples archivos de texto Markdown. En este modelo, las notas nos pertenecen completamente, podemos combinar libremente varios componentes o plugins, y personalizar las operaciones y flujos de trabajo según nuestras preferencias. Además, la conservación, respaldo y sincronización de la información están bajo nuestro control.
Anteriormente, presenté el Web Clipper de Obsidian, un plugin de navegador para la captura de contenido web, que también sigue la filosofía de "centro de archivos", convirtiendo el contenido de las páginas web que estamos navegando en una nota Markdown, almacenándola en la base de datos de Obsidian, y también incluye metainformación.
Recientemente, Obsidian lanzó un nuevo sitio web, Defuddle.md, Defuddle es una herramienta muy poderosa dentro del ecosistema de archivos locales de Obsidian, en términos simples, es la versión web de Obsidian Web Clipper.
Si consideramos a Obsidian como un sistema operativo para notas locales, anteriormente presentamos la CLI (interfaz de línea de comandos), Defuddle se asemeja más a una interfaz URL de Obsidian Web Clipper.
Así que, antes de profundizar en Defuddle, hagamos un breve repaso sobre Web Clipper.
Obsidian Web Clipper: páginas web a Markdown
Al hablar de Obsidian Web Clipper, personalmente creo que su aspecto más atractivo es que ya ha superado la función tradicional de guardar y capturar páginas web.
No solo captura la página web, sino que lo impresionante es que soporta plantillas de Obsidian extremadamente flexibles. Web Clipper puede extraer varios metadatos de la página web (como autor, fecha de publicación, e incluso elementos específicos de la página). Lo que más me sorprendió es que ahora también soporta operaciones lógicas como condiciones y bucles. Esto significa que, en la fase de captura de la página web, podemos organizar el contenido según nuestras propias reglas, convirtiéndolo directamente en un archivo Markdown local limpio y estructurado.
Por supuesto, la desventaja es que si a los usuarios no les gusta la plantilla de organización predeterminada, necesitan configurarla ellos mismos, lo que puede tener algunas barreras (en realidad, se puede dejar que la IA lo configure).
Pero en general, Obsidian Clipper se adapta perfectamente al ecosistema de Obsidian, permitiendo que el contenido web se integre de manera fluida en nuestro propio repositorio de conocimiento. Para los Power Users, también ofrece un espacio para experimentar. No subestimen a estos Power Users, muchos de los plugins de Obsidian son creados por los propios usuarios.
Defuddle.md: capa de extracción enfocada en la limpieza
La aparición de Defuddle me hace sentir que Obsidian ha separado la capacidad central de extracción de páginas web detrás de Web Clipper.
Si ustedes son recolectores de información en algún campo, investigadores, analistas de datos... Si pueden experimentar un poco, o incluso usar IA (incluyendo el reciente y popular "camarón"), entonces Defuddle.md es definitivamente una sorpresa.
Dale a Defuddle un enlace, y te ayudará a limpiar los anuncios, áreas de recomendación y otros elementos desordenados de la página web, intentando extraer el cuerpo limpio y los metadatos estructurados. Es como un purificador que se encarga de convertir páginas web complejas en texto Markdown estándar. Con esto, cualquiera puede crear su propio Web Clipper, y no necesita estar vinculado a Obsidian.
Defuddle ofrece varias formas de acceso.
- Usuarios comunes, acceden a través del navegador, ingresan la URL de la página web que necesitan convertir, y ven el HTML o Markdown limpiado.
- Agentes de IA o desarrolladores, a través de la interfaz URL, obtienen los resultados de la limpieza y conversión.
- Usuarios de Obsidian, simplemente usan el plugin Web Clipper (que está respaldado por Defuddle).
Además, es muy importante que Defuddle es de código abierto. Incluso podemos implementarlo localmente. Esto es muy Obsidian. Permite que la aplicación se convierta en un sistema que el usuario puede controlar, en lugar de convertir al usuario en un apéndice de la aplicación.
Por último
En el mercado, hay muchos plugins de captura, muchos de los cuales tienen como objetivo encerrar a los usuarios en una aplicación específica. Sin embargo, Obsidian Web Clipper es diferente, porque la filosofía de Obsidian es "Archivo sobre Aplicación". Ahora, avanzando aún más, Defuddle ha sido abierto, y todos pueden usarlo directamente, y además es de código abierto. Así que, es un poco demasiado generoso, lo que podría no adaptarse.
Si están interesados en este tipo de captura de páginas web (como una parte importante de PKM), anteriormente Jina.ai también ofreció una API Reader de pago (ver imagen abajo). Jina es la opción preferida de muchos profesionales de IA, y ahora parece que tiene un competidor gratuito y de código abierto. Por supuesto, Jina afirma que es un modelo de IA que limpia la captura, lo que tiene algunas diferencias.
Para ser honesto, ahora empiezo a preocuparme de que Defuddle sea mal utilizado (o bloqueado).

