Obsidian lanzó Defuddle, llevando Obsidian Web Clipper a un nuevo nivel
Obsidian lanzó Defuddle, llevando Obsidian Web Clipper a un nuevo nivel
Siempre me ha gustado la filosofía central de Obsidian: prioridad local, todo es un archivo y son simples archivos de texto Markdown. En este modelo, las notas nos pertenecen completamente, podemos combinar libremente varios componentes o plugins, y personalizar las operaciones y flujos de trabajo según nuestras preferencias. Además, la conservación, respaldo y sincronización de la información están bajo nuestro control.
Anteriormente, presenté el Web Clipper de Obsidian, un plugin de navegador para la captura de contenido web, que también sigue la filosofía de "centro de archivos" mencionada anteriormente, convirtiendo el contenido de las páginas web que estamos navegando en una nota Markdown, almacenándola en la base de datos de Obsidian, e incluyendo metainformación.
Recientemente, Obsidian lanzó un nuevo sitio web, Defuddle.md. Defuddle es una herramienta muy poderosa dentro del ecosistema de archivos locales de Obsidian, en términos simples, es la versión web de Obsidian Web Clipper.
Si consideramos a Obsidian como un sistema operativo para notas locales, anteriormente presentamos CLI (interfaz de línea de comandos), Defuddle se asemeja más a una interfaz URL de Obsidian Web Clipper.
Por lo tanto, antes de detallar Defuddle, hagamos un rápido repaso de Web Clipper.
Obsidian Web Clipper: páginas web a Markdown
Al hablar de Obsidian Web Clipper, personalmente creo que su aspecto más atractivo es que ha superado con creces la funcionalidad tradicional de guardar y capturar páginas web.
No solo captura páginas web, sino que lo más impresionante es que soporta plantillas de Obsidian extremadamente flexibles. Web Clipper puede extraer varios metadatos de las páginas web (como autor, fecha de publicación, e incluso elementos específicos de la página). Lo que más me sorprendió es que ahora también soporta operaciones lógicas como condiciones y bucles. Esto significa que, en la fase de captura de la página web, podemos organizar el contenido según nuestras propias reglas, convirtiéndolo directamente en un archivo Markdown local limpio y estructurado.
Por supuesto, la desventaja es que si a los usuarios no les gusta la plantilla de organización predeterminada, necesitarán configurarla ellos mismos, lo que puede tener una cierta curva de aprendizaje (en realidad, se puede dejar que la IA lo configure).
Pero en general, Obsidian Clipper se integra perfectamente en el ecosistema de Obsidian, permitiendo que el contenido web se incorpore de manera fluida a nuestro repositorio personal de conocimientos. Para los usuarios avanzados, también ofrece un espacio para experimentar. No subestimen a estos usuarios avanzados, muchos de los plugins de Obsidian son creados por los propios usuarios.
Defuddle.md: capa de extracción enfocada en la limpieza
La aparición de Defuddle me hace sentir que Obsidian ha separado la capacidad central de extracción de páginas web detrás de Web Clipper.
Si ustedes son recolectores de información en algún campo, investigadores, analistas de datos... Si pueden experimentar un poco, o incluso utilizar IA (incluyendo el popular "camarón" recientemente), entonces Defuddle.md es definitivamente una sorpresa.
Dale a Defuddle un enlace, y te ayudará a limpiar anuncios, áreas de recomendación y otros elementos desordenados de la página web, extrayendo lo más limpio posible el contenido principal y los metadatos estructurados. Es como un purificador que se encarga de convertir páginas web complejas en texto Markdown estándar. Con esto, cualquiera puede crear su propio Web Clipper sin necesidad de estar vinculado a Obsidian.
Defuddle ofrece varias formas de acceso.
- Usuarios comunes, accediendo a través del navegador, ingresando la URL de la página web que desean convertir, para ver el HTML o Markdown limpio.
- Agentes de IA o desarrolladores, a través de la interfaz URL, para obtener resultados de limpieza y conversión.
- Usuarios de Obsidian, simplemente usando el plugin Web Clipper (que está respaldado por Defuddle).
Además, es muy importante que Defuddle es de código abierto. Incluso podemos implementarlo localmente. Esto es muy Obsidian. Permite que la aplicación se convierta en un sistema que los usuarios pueden controlar, en lugar de convertir a los usuarios en dependientes de la aplicación.
Por último
En el mercado, hay muchos plugins de captura, muchos de los cuales tienen como objetivo encerrar a los usuarios en una aplicación específica. Sin embargo, Obsidian Web Clipper es diferente, porque la filosofía de Obsidian es Archivo sobre Aplicación. Ahora, con Defuddle abierto, todos pueden usarlo directamente, y además es de código abierto. Así que es un poco demasiado generoso, lo que puede resultar incómodo.
Si estás interesado en este tipo de captura de páginas web (como una parte importante de PKM), anteriormente Jina.ai también ofrecía una API de Reader de pago (ver imagen abajo). Jina es la opción preferida de muchos profesionales de IA, y ahora parece que tiene un competidor gratuito y de código abierto. Por supuesto, Jina afirma que es un modelo de IA para limpiar y capturar, lo que tiene algunas diferencias.
Para ser honesto, ahora empiezo a preocuparme de que Defuddle sea mal utilizado (o bloqueado).

