میں نے AI کو صرف ایک چال سکھائی، اور اس نے باقی خود ہی سیکھ لیا...
آج میں ایک عملی مجموعہ ترتیب دے رہا ہوں۔ دو مہارتیں، دو گائیڈز، اور ایک چھوٹی سی ٹپ، یہ سب میں خود استعمال کرتا ہوں، اور یہ استعمال کے لیے تیار ہیں۔
دوسری مہارت: AI کو خود مہارتیں تلاش کرنا سکھائیں
Find Skills یہ وہ چیز ہے جس کی میں سب سے زیادہ سفارش کرنا چاہتا ہوں۔

بہت سے لوگوں کا خیال یہ ہے کہ: مجھے AI میں بہت سی مہارتیں ڈالنی ہیں، ایک ایک کرکے دستی طور پر شامل کریں۔ مجھے لگتا ہے کہ یہ راستہ زیادہ دور نہیں جائے گا۔ جیسے جیسے مہارتیں بڑھتی جائیں گی، آپ ان کو سنبھال نہیں پائیں گے۔
ایک مختلف سوچ اپنائیں: اسے مہارتیں مت کھلائیں، اسے خود تلاش کرنے دیں۔
Find Skills یہی کام کرتا ہے۔ یہ ایک "مہارتوں کا سرچ انجن" کے مترادف ہے۔ جب AI اسسٹنٹ کو کوئی ایسی چیز ملتی ہے جو وہ نہیں جانتا، تو وہ خود تلاش کرتا ہے، خود انسٹال کرتا ہے، اور خود سیکھتا ہے۔
یہ بالکل اسی طرح ہے جیسے کوئی شخص کچھ سیکھتا ہے۔ آپ کو تمام معلومات کو اپنے دماغ میں بھرنے کی ضرورت نہیں ہے، آپ کو صرف یہ سیکھنے کی ضرورت ہے کہ معلومات کیسے تلاش کی جائیں اور کیسے سیکھی جائیں۔
مجھے لگتا ہے کہ یہ مستقبل میں AI آٹومیشن کی سمت ہے، مہارتوں کو جمع کرنا نہیں، بلکہ اسے انسانی دماغ کی طرح خود مختار طور پر سیکھنے دینا ہے۔
انسٹال کرنا بہت آسان ہے:
npx skills add https://github.com/vercel-labs/skills --skill find-skills انسٹال کرنے کے بعد، آپ کے AI اسسٹنٹ میں "خود سیکھنے کی صلاحیت" ہوگی۔
دوسری مہارت: Agent Browser
تلاش اور سیکھنے کی صلاحیت کافی نہیں ہے۔ بہت سے کاموں کے لیے ویب صفحات کو چلانے کی ضرورت ہوتی ہے۔ فارم بھرنا، ڈیٹا نکالنا، اسکرین شاٹس لینا، بیک گراؤنڈ میں لاگ ان کرنا... یہ سب Agent Browser کر سکتا ہے۔
اس کی منطق بہت واضح ہے: ویب پیج کھولیں → عناصر کی شناخت کریں → کلک کریں، بھریں، منتخب کریں → نتائج کی تصدیق کریں۔
یہ بالکل اسی طرح ہے جیسے کوئی شخص براؤزر چلاتا ہے، سوائے اس کے کہ AI آپ کے لیے یہ کر رہا ہے۔ سادہ عمل اب بھی نسبتاً مستحکم ہیں، لیکن اس بات کا خیال رکھیں کہ ٹوکنز خرچ ہوں گے۔
انسٹال کرنے کا حکم:
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser انسٹال کرنے کے بعد، آپ کے AI اسسٹنٹ کے پاس "ہاتھ" ہوں گے، اور وہ براہ راست براؤزر چلا سکے گا۔
دو عملی گائیڈز
صرف مہارتیں کافی نہیں ہیں۔ کچھ بنیادی ڈھانچے کو پہلے سے تیار کرنا ہوگا۔ میں نے دو گائیڈز لکھے ہیں، جو سب GitHub ریپوزٹری میں رکھے گئے ہیں۔
1. Browser Tool انسٹالیشن گائیڈ
میں آپ کو مرحلہ وار سکھاتا ہوں کہ Linux/Ubuntu ماحول میں براؤزر ٹولز کو کیسے ترتیب دیا جائے۔ اس میں Chrome کی تنصیب، کنفیگریشن فائل آئسولیشن، اور ملٹی کنفیگریشن مینجمنٹ شامل ہیں۔ اس مرحلے کو مکمل کرنے کے بعد، Agent Browser واقعی چل سکے گا۔
2. Web Search آن لائن سرچ گائیڈ
اپنے AI اسسٹنٹ کو آن لائن تلاش کرنے کے قابل بنائیں۔ میں نے کئی تھرڈ پارٹی سروسز کا موازنہ کیا، اور آخر میں Brave Search کی سفارش کی۔ وجہ بہت آسان ہے: مفت کوٹہ کافی ہے، ردعمل کی رفتار تیز ہے، اور کنفیگریشن بھی پیچیدہ نہیں ہے۔
اگر آپ چاہتے ہیں کہ آپ کا AI اسسٹنٹ صرف مقامی نالج بیس میں جوابات تلاش نہ کرے، بلکہ آپ کی طرح آن لائن معلومات تلاش کرنے کے قابل ہو، تو یہ گائیڈ پر عمل کرنے کے قابل ہے۔
ایک چھوٹی سی ٹپ: آواز کی شناخت
اگر آپ چاہتے ہیں کہ آپ کا AI اسسٹنٹ آواز کو سمجھ سکے، تو آپ ElevenLabs کی آواز سے متن کی سروس کو جوڑ سکتے ہیں، اور شناخت کا اثر اچھا ہے۔
کنفیگریشن کا طریقہ بہت آسان ہے: براہ راست اپنے AI اسسٹنٹ سے کہیں کہ "ElevenLabs Speech-to-Text مہارت انسٹال کرنے میں میری مدد کریں، مجھے ElevenLabs آواز کی شناخت کو جوڑنے کی ضرورت ہے"، اور پھر اسے API Key بھیجیں، اور یہ خود بخود آپ کے لیے ترتیب دے گا۔
لیکن مجھے آپ کو یاد دلانا چاہیے: اس سروس کی فیس ہے، مفت کوٹہ ہے لیکن زیادہ نہیں۔ روزمرہ کے منظرناموں میں، چیٹنگ ٹولز میں بلٹ ان آواز سے متن کا استعمال کرنا کافی ہے۔ لیکن اگر آپ کے پاس بیچ میں آڈیو ٹرانسکرپشن، میٹنگ منٹس جیسی ضروریات ہیں، تو آپ اسے آزما سکتے ہیں۔

وسائل کا خلاصہ
مندرجہ بالا تمام وسائل میری GitHub ریپوزٹری میں ترتیب دیے گئے ہیں، جن کی آپ کو ضرورت ہے وہ خود لے لیں:
👉 github.com/geekjourneyx/awesome-openclaw
دو مہارتیں، دو گائیڈز، اور ایک چھوٹی سی ٹپ۔ زیادہ نہیں، لیکن یہ سب میں نے خود چلائے اور تصدیق کیے ہیں۔
ٹولز زیادہ نہیں ہونے چاہئیں، اہم بات یہ ہے کہ ہر ایک کو صحیح معنوں میں استعمال کیا جا سکے۔





