আমি AI কে শুধু একটি কৌশল শিখিয়েছি, এবং এটি বাকিটা নিজেই শিখে নিয়েছে...
আজকে একটি বাস্তব অভিজ্ঞতার সংগ্রহ সাজিয়েছি। দুটি দক্ষতা, দুটি নির্দেশিকা, একটি ছোট কৌশল, যা আমি নিজে ব্যবহার করি, সরাসরি ব্যবহারের জন্য।
দ্বিতীয় দক্ষতা: AI কে নিজে থেকে দক্ষতা খুঁজে বের করতে দিন
Find Skills এটি আমি সবচেয়ে বেশি সুপারিশ করতে চাই।

অনেকের ধারণা হল: আমাকে AI-এর মধ্যে অনেক দক্ষতা যোগ করতে হবে, একটি একটি করে হাতেকলমে যোগ করতে হবে। আমার মনে হয় এই পথে বেশি দূর যাওয়া যাবে না। দক্ষতা যত বাড়বে, আপনি সামলাতে পারবেন না।
অন্যভাবে ভাবুন: একে দক্ষতা খাওয়াবেন না, একে নিজে থেকে খুঁজে নিতে দিন।
Find Skills এটাই করে। এটি একটি "দক্ষতা অনুসন্ধান ইঞ্জিন" এর মতো, AI সহকারী কোনো কিছু না পারলে, নিজে থেকে খুঁজে নেয়, নিজে থেকে ইনস্টল করে, নিজে থেকে শিখে নেয়।
মানুষ যেভাবে শেখে তেমনই। আপনার মস্তিষ্কে সমস্ত জ্ঞান ঢোকানোর দরকার নেই, আপনাকে শুধু জানতে হবে কীভাবে জ্ঞান খুঁজে বের করতে হয়, কীভাবে জ্ঞান অর্জন করতে হয়।
আমার মনে হয় এটাই ভবিষ্যতের AI অটোমেশনের দিক, দক্ষতা স্তূপ করা নয়, একে মানুষের মস্তিষ্কের মতো স্বয়ংক্রিয়ভাবে শিখতে দেওয়া।
ইনস্টল করা খুব সহজ:
npx skills add https://github.com/vercel-labs/skills --skill find-skills ইনস্টল করার পরে, আপনার AI সহকারীর "স্ব-শিক্ষার ক্ষমতা" থাকবে।
দ্বিতীয় দক্ষতা: Agent Browser
অনুসন্ধান এবং শেখার ক্ষমতা থাকলেই যথেষ্ট নয়, অনেক কাজের জন্য ওয়েবপেজ ব্যবহার করার প্রয়োজন হয়। ফর্ম পূরণ করা, ডেটা সংগ্রহ করা, স্ক্রিনশট নেওয়া, ব্যাকএন্ডে লগইন করা... এই কাজগুলো Agent Browser করতে পারে।
এর যুক্তি খুব স্পষ্ট: ওয়েবপেজ খোলা → উপাদান সনাক্ত করা → ক্লিক করা, পূরণ করা, নির্বাচন করা → ফলাফল নিশ্চিত করা।
মানুষ যেভাবে ব্রাউজার ব্যবহার করে, এটিও তেমনই, শুধু AI আপনার হয়ে কাজটি করে, সহজ প্রক্রিয়াগুলো বেশ স্থিতিশীল, তবে Token খরচ হয়।
ইনস্টল করার কমান্ড:
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser ইনস্টল করার পরে, আপনার AI সহকারীর "হাত" থাকবে, যা সরাসরি ব্রাউজার ব্যবহার করতে পারবে।
দুটি বাস্তব নির্দেশিকা
শুধু দক্ষতা থাকলেই যথেষ্ট নয়, কিছু অবকাঠামো আগে থেকে তৈরি করে নিতে হয়। আমি দুটি নির্দেশিকা লিখেছি, যা GitHub রিপোজিটরিতে রাখা আছে।
1. Browser Tool ইনস্টলেশন নির্দেশিকা
ধাপে ধাপে শেখানো হয়েছে কীভাবে Linux/Ubuntu পরিবেশে ব্রাউজার টুল কনফিগার করতে হয়। Chrome ইনস্টলেশন, কনফিগারেশন ফাইল আইসোলেশন, মাল্টিপল কনফিগারেশন ম্যানেজমেন্ট ইত্যাদি অন্তর্ভুক্ত। এই ধাপটি সম্পন্ন হলে, Agent Browser সত্যিই কাজ করা শুরু করবে।
2. Web Search অনলাইন অনুসন্ধান নির্দেশিকা
আপনার AI সহকারীকে অনলাইনে অনুসন্ধান করতে দিন। আমি কয়েকটি থার্ড-পার্টি পরিষেবা তুলনা করেছি, এবং অবশেষে Brave Search সুপারিশ করছি। কারণ খুব সহজ: বিনামূল্যে ব্যবহারের পরিমাণ যথেষ্ট, দ্রুত সাড়া দেয়, এবং কনফিগার করাও জটিল নয়।
আপনি যদি চান আপনার AI সহকারী শুধু স্থানীয় জ্ঞানভাণ্ডারে উত্তর না খুঁজে, আপনার মতো অনলাইনে তথ্য খুঁজে বের করুক, তাহলে এই নির্দেশিকা অনুসরণ করা মূল্যবান।
একটি ছোট কৌশল: ভয়েস রিকগনিশন
আপনি যদি চান আপনার AI সহকারী ভয়েস বুঝতে পারুক, তাহলে ElevenLabs-এর ভয়েস-টু-টেক্সট পরিষেবা ব্যবহার করতে পারেন, সনাক্তকরণের ফলাফল বেশ ভালো।
কনফিগার করার পদ্ধতি খুবই সহজ: সরাসরি আপনার AI সহকারীকে বলুন "আমাকে ElevenLabs Speech-to-Text দক্ষতা ইনস্টল করতে সাহায্য করো, আমার ElevenLabs ভয়েস রিকগনিশন ব্যবহার করতে হবে", তারপর API Key পাঠিয়ে দিন, এটি নিজে থেকেই কনফিগার হয়ে যাবে।
তবে মনে রাখতে হবে: এই পরিষেবাটি পেইড বিনামূল্যে ব্যবহারের সুযোগ আছে, তবে বেশি নয়। দৈনন্দিন ব্যবহারের জন্য, চ্যাটিং অ্যাপে বিল্ট-ইন ভয়েস-টু-টেক্সট সুবিধাই যথেষ্ট। তবে যদি আপনার প্রচুর অডিও ট্রান্সক্রাইব করার প্রয়োজন হয়, যেমন মিটিংয়ের রেকর্ড, তাহলে এটি ব্যবহার করে দেখতে পারেন।

সম্পদ সংগ্রহ
উপরের সমস্ত সম্পদ আমার GitHub রিপোজিটরিতে সাজানো আছে, প্রয়োজন অনুযায়ী নিয়ে নিন:
👉 github.com/geekjourneyx/awesome-openclaw
দুটি দক্ষতা, দুটি নির্দেশিকা, একটি ছোট কৌশল। বেশি নয়, তবে এগুলো আমি নিজে পরীক্ষা করে দেখেছি।
টুল বেশি থাকলেই হয় না, জরুরি হল প্রতিটি যেন সত্যিই ব্যবহার করা যায়।





