Aš išmokiau AI tik vieno triuko, o likusius jis išmoko pats...
Šiandien parengsiu praktinių patarimų rinkinį. Du įgūdžiai, du vadovai, vienas mažas triukas – viskas, ką pats naudoju, paruošta naudoti iš karto.
Antrasis įgūdis: leiskite AI pačiam išmokti rasti įgūdžius
Find Skills yra tai, ką labiausiai noriu rekomenduoti.

Daugelio žmonių mąstymas yra toks: aš turiu įdiegti daug įgūdžių AI, po vieną rankiniu būdu. Manau, kad šis kelias toli nenuves. Įgūdžių daugėja, tu tiesiog negali jų visų suvaldyti.
Pakeiskite mąstymą: nemaitinkite jo įgūdžiais, leiskite jam pačiam jų ieškoti.
Find Skills būtent tuo ir užsiima. Tai tarsi „įgūdžių paieškos sistema“. AI asistentas, susidūręs su dalykais, kurių nežino, pats ieško, pats diegia, pats mokosi.
Tai tarsi žmogus mokytųsi. Jums nereikia visų žinių susikišti į galvą, jums tereikia išmokti, kaip rasti žinias, kaip mokytis žinių.
Manau, kad tai yra ateities AI automatizavimo kryptis – ne įgūdžių kaupimas, o leidimas jam savarankiškai mokytis kaip žmogaus smegenims.
Diegimas labai paprastas:
npx skills add https://github.com/vercel-labs/skills --skill find-skills
Įdiegus jūsų AI asistentas įgis „savarankiško mokymosi gebėjimų“.
Antrasis įgūdis: Agent Browser
Turėti paieškos ir mokymosi galimybių nepakanka, daugeliui užduočių reikia valdyti tinklalapius. Užpildyti formas, gauti duomenis, daryti ekrano nuotraukas, prisijungti prie užkulisių... Visa tai gali padaryti Agent Browser.
Jo logika labai aiški: atidaryti tinklalapį → atpažinti elementus → spustelėti, užpildyti, pasirinkti → patvirtinti rezultatą.
Tai tas pats procesas, kaip ir žmogus valdytų naršyklę, tik AI tai daro už jus, paprasti procesai vis dar gana stabilūs, atkreipkite dėmesį, kad tai kainuoja Token'us.
Diegimo komanda:
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser
Įdiegus jūsų AI asistentas turės „rankas“ ir galės tiesiogiai valdyti naršyklę.
Du praktiniai vadovai
Vien įgūdžių nepakanka, reikia pirmiausia sukurti tam tikrą infrastruktūrą. Parašiau du vadovus, abu patalpinti GitHub saugykloje.
1. Browser Tool diegimo vadovas
Žingsnis po žingsnio mokau, kaip sukonfigūruoti naršyklės įrankius Linux/Ubuntu aplinkoje. Įskaitant Chrome diegimą, konfigūracijos failų atskyrimą, kelių konfigūracijų valdymą ir kt. Atlikus šį žingsnį, Agent Browser gali tikrai veikti.
2. Web Search prisijungimo prie interneto paieškos vadovas
Leiskite savo AI asistentui prisijungti prie interneto ir ieškoti. Palyginau kelias trečiųjų šalių paslaugas ir galiausiai rekomendavau Brave Search. Priežastis labai paprasta: nemokamo limito pakanka, atsako greitis greitas, o konfigūracija nėra sudėtinga.
Jei norite, kad AI asistentas ne tik ieškotų atsakymų vietinėje žinių bazėje, bet ir galėtų ieškoti informacijos internete kaip jūs, šį vadovą verta peržiūrėti.
Mažas triukas: kalbos atpažinimas
Jei norite, kad AI asistentas suprastų kalbą, galite prisijungti prie ElevenLabs kalbos į tekstą paslaugos, atpažinimo efektas yra gana geras.
Konfigūracijos metodas yra labai paprastas: tiesiog pasakykite savo AI asistentui „padėkite man įdiegti ElevenLabs Speech-to-Text įgūdį, man reikia prisijungti prie ElevenLabs kalbos atpažinimo“, tada atsiųskite jam API Key, ir jis automatiškai padės jums jį sukonfigūruoti.
Tačiau noriu priminti: ši paslauga yra mokama, yra nemokamas limitas, bet nedidelis. Kasdienėse situacijose iš tikrųjų pakanka naudoti pokalbių įrankyje integruotą kalbos į tekstą funkciją. Tačiau jei turite poreikių, tokių kaip garso įrašų konvertavimas paketais, susitikimų protokolai ir pan., galite tai išbandyti.

Išteklių suvestinė
Visi aukščiau išvardyti ištekliai yra surinkti mano GitHub saugykloje, paimkite juos patys, jei jums reikia:
👉 github.com/geekjourneyx/awesome-openclaw
Du įgūdžiai, du vadovai, vienas mažas triukas. Nedaug, bet viską pats išbandžiau ir patvirtinau.
Įrankių nebūtinai turi būti daug, svarbiausia, kad kiekvienas iš jų būtų tikrai naudojamas.





