أوبسيديان أطلقت Defuddle، ورفعت أوبسيديان ويب كليبر إلى مستوى جديد
أوبسيديان أطلقت Defuddle، ورفعت أوبسيديان ويب كليبر إلى مستوى جديد
لطالما أحببت الفكرة الأساسية لأوبسيديان: الأولوية المحلية، كل شيء هو ملف، وهو ملف نصي بسيط بتنسيق Markdown. في مثل هذا النموذج، تكون الملاحظات ملكًا لنا بالكامل، ويمكننا دمج مكونات أو إضافات مختلفة بحرية، وتخصيص العمليات وسير العمل وفقًا لعاداتنا. بالإضافة إلى ذلك، فإن حفظ المعلومات ونسخها احتياطيًا ومزامنتها كلها تحت سيطرتنا.
قدمت سابقًا أوبسيديان ويب كليبر، وهو إضافة متصفح من نوع قص ولصق صفحات الويب، والتي تتبع نفس فكرة "مركز الملفات" المذكورة أعلاه، حيث تحول محتوى صفحة الويب التي نتصفحها إلى ملاحظة بتنسيق Markdown، وتخزن في قاعدة بيانات أوبسيديان، وتحتوي أيضًا على معلومات وصفية.
مؤخراً، أطلقت أوبسيديان موقعًا جديدًا، Defuddle.md، حيث يُعتبر Defuddle أداة قوية جدًا في نظام ملفات أوبسيديان المحلي، وببساطة، هو النسخة على الويب من أوبسيديان ويب كليبر.
إذا اعتبرنا أوبسيديان كنظام تشغيل للملاحظات المحلية، فقد قدمنا سابقًا واجهة سطر الأوامر (CLI)، بينما يبدو أن Defuddle هو واجهة URL لأوبسيديان ويب كليبر.
لذا، قبل أن نتعمق في Defuddle، دعونا نراجع سريعًا ويب كليبر.
أوبسيديان ويب كليبر: صفحة الويب تتحول إلى Markdown
عند الحديث عن أوبسيديان ويب كليبر، أعتقد أن أكثر ما يجذبني فيه هو أنه تجاوز بالفعل وظيفة حفظ صفحات الويب التقليدية.
إنه لا يقتصر فقط على حفظ صفحة الويب، بل إنه يدعم أيضًا قوالب أوبسيديان المرنة للغاية. يمكن لويب كليبر استخراج أنواع مختلفة من البيانات الوصفية من صفحة الويب (مثل المؤلف، تاريخ النشر، وحتى عناصر الصفحة المحددة). وما أدهشني أكثر هو أنه يدعم الآن عمليات منطقية مثل الشروط والحلقات. وهذا يعني أنه خلال مرحلة جمع صفحات الويب، يمكننا تنظيم المحتوى وفقًا لقواعدنا الخاصة، وتحويله مباشرة إلى ملفات Markdown محلية نظيفة ومنظمة.
بالطبع، العيب هو أنه إذا لم يحب المستخدم القالب الافتراضي، فسيتعين عليه تكوينه بنفسه، وقد تكون هذه العملية لها بعض العوائق (يمكن استخدام الذكاء الاصطناعي للمساعدة في ذلك).
لكن بشكل عام، يتناسب أوبسيديان كليبر تمامًا مع نظام أوبسيديان البيئي، مما يجعل محتوى صفحات الويب يندمج بسلاسة في مكتبتنا الشخصية للمعرفة. بالنسبة للمستخدمين المتقدمين، يوفر أيضًا مساحة للتجريب. لا تستخف بهؤلاء المستخدمين المتقدمين، فالكثير من إضافات أوبسيديان تم تطويرها بواسطة المستخدمين أنفسهم.
Defuddle.md: طبقة استخراج تركز على التنظيف
ظهور Defuddle جعلني أشعر أن أوبسيديان قد فتحت القدرة الأساسية لاستخراج صفحات الويب من وراء ويب كليبر.
إذا كنت جامع معلومات في مجال معين، باحث، محلل بيانات... وإذا كنت تستطيع أن تجرب بعض الأشياء بنفسك، أو بمساعدة الذكاء الاصطناعي (بما في ذلك الروبوتات الصغيرة الشهيرة مؤخرًا)، فإن Defuddle.md سيكون مفاجأة لك!
أعط Defuddle رابطًا، وسيساعدك في تنظيف الإعلانات، ومناطق التوصيات، والعناصر الفوضوية الأخرى من صفحة الويب، ويستخرج النص الرئيسي والبيانات الوصفية المنظمة قدر الإمكان. إنه مثل جهاز تنقية مسؤول عن تحويل صفحات الويب المعقدة إلى نصوص Markdown قياسية. مع هذا، يمكن لأي شخص إنشاء ويب كليبر خاص به، دون الحاجة إلى الانتماء إلى أوبسيديان.
يوفر Defuddle عدة طرق للوصول.
- المستخدمون العاديون، يمكنهم زيارة الموقع عبر المتصفح، وإدخال عنوان صفحة الويب المراد تحويلها، ومشاهدة HTML أو Markdown المنظف.
- وكلاء الذكاء الاصطناعي أو المطورون، يمكنهم الحصول على نتائج التنظيف والتحويل من خلال واجهة URL.
- مستخدمو أوبسيديان، يمكنهم استخدام إضافة ويب كليبر مباشرة (التي تعتمد على Defuddle).
وأيضًا، من المهم جدًا أن Defuddle مفتوح المصدر. يمكننا حتى نشره محليًا. هذا يتماشى مع فلسفة أوبسيديان. تجعل التطبيق نظامًا يمكن للمستخدم التحكم فيه، بدلاً من تحويل المستخدم إلى تابع للتطبيق.
أخيرًا
في السوق، هناك العديد من إضافات القص واللصق، والعديد منها يهدف إلى قفل المستخدم في تطبيق معين. لكن أوبسيديان ويب كليبر مختلف، لأن فلسفة أوبسيديان هي "الملف فوق التطبيق". الآن، مع فتح Defuddle، يمكن للجميع استخدامه مباشرة، وهو مفتوح المصدر أيضًا. لذا، يبدو أنه مفرط بعض الشيء، وقد لا يتناسب مع الوضع.
إذا كنت مهتمًا بهذا النوع من جمع صفحات الويب (كجزء مهم من PKM)، فقد قدمت Jina.ai سابقًا واجهة API مدفوعة للقراء (كما هو موضح في الصورة أدناه). Jina هي الخيار الأول للعديد من العاملين في مجال الذكاء الاصطناعي، والآن يبدو أن لديها منافسًا مجانيًا ومفتوح المصدر. بالطبع، تدعي Jina أنها نموذج ذكاء اصطناعي لتنظيف وجمع البيانات، ولها اختلافات طفيفة.
بصراحة، بدأت الآن أشعر بالقلق من أن يتم إساءة استخدام Defuddle (أو يتم حظره).

