Jaz sem AI naučil samo en trik, ostalo se je naučil sam...
Danes bom uredil praktičen komplet. Dve veščini, dva vodnika in en majhen trik, ki jih uporabljam sam, pripravljeni za uporabo.
Druga veščina: Naj se AI sam nauči najti veščine
Find Skills je tisto, kar najbolj priporočam.

Veliko ljudi razmišlja takole: AI moram namestiti veliko veščin, eno za drugo ročno. Mislim, da ta pot ne bo dolga. Več kot je veščin, težje jih je obvladovati.
Spremenite način razmišljanja: ne hranite ga z veščinami, ampak naj jih poišče sam.
Find Skills počne točno to. Je kot "iskalnik veščin". Ko AI asistent ne ve, kako nekaj narediti, sam poišče, namesti in se nauči.
Tako kot se ljudje učijo. Ni vam treba v glavo vtakniti vsega znanja, samo naučiti se morate, kako najti znanje in kako se učiti.
Mislim, da je to prihodnja smer avtomatizacije AI, ne kopičenje veščin, ampak omogočanje, da se uči samostojno kot človeški možgani.
Namestitev je zelo preprosta:
npx skills add https://github.com/vercel-labs/skills --skill find-skills
Po namestitvi bo vaš AI asistent imel "sposobnost samoučenja".
Druga veščina: Agent Browser
Iskanje in učenje nista dovolj, veliko nalog zahteva upravljanje spletnih strani. Izpolnjevanje obrazcev, zajemanje podatkov, posnetki zaslona, prijava v ozadje ... vse to lahko stori Agent Browser.
Njegova logika je zelo jasna: odprite spletno stran → prepoznajte elemente → kliknite, izpolnite, izberite → potrdite rezultat.
Postopek je enak kot pri upravljanju brskalnika, le da to namesto vas počne AI. Enostavni postopki so še vedno precej stabilni, pazite le na porabo žetonov (Token).
Ukaz za namestitev:
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser
Po namestitvi bo vaš AI asistent imel "roke" in bo lahko neposredno upravljal brskalnik.
Dva praktična vodnika
Samo veščine niso dovolj, najprej je treba vzpostaviti nekaj infrastrukture. Napisal sem dva vodnika, oba sta v repozitoriju GitHub.
1. Vodnik za namestitev orodja Browser Tool
Korak za korakom vas naučim, kako konfigurirati orodje brskalnika v okolju Linux/Ubuntu. Vključno z namestitvijo Chroma, izolacijo konfiguracijskih datotek, upravljanjem več konfiguracij itd. Ko to uredite, lahko Agent Browser resnično začne delovati.
2. Vodnik za spletno iskanje Web Search
Omogočite svojemu AI asistentu, da išče po internetu. Primerjal sem več storitev tretjih oseb in na koncu priporočil Brave Search. Razlog je preprost: dovolj brezplačne kvote, hitra odzivnost in konfiguracija ni zapletena.
Če želite, da vaš AI asistent ne išče odgovorov samo v lokalni bazi znanja, ampak lahko išče informacije na spletu tako kot vi, je ta vodnik vreden, da ga preberete.
Majhen trik: prepoznavanje govora
Če želite, da vaš AI asistent razume govor, lahko povežete storitev pretvorbe govora v besedilo ElevenLabs, učinek prepoznavanja je kar dober.
Način konfiguracije je zelo preprost: preprosto recite svojemu AI asistentu "Pomagaj mi namestiti veščino ElevenLabs Speech-to-Text, potrebujem dostop do prepoznavanja govora ElevenLabs" in mu pošljite API Key, in sam ga bo konfiguriral.
Vendar vas moram opozoriti: ta storitev je plačljiva, ima brezplačno kvoto, vendar ni velika. V vsakdanjih scenarijih je pravzaprav dovolj, da uporabite vgrajeno pretvorbo govora v besedilo v orodjih za klepet. Če pa imate potrebe po paketnem prepisovanju zvoka, zapisih sestankov itd., jo lahko preizkusite.

Zbiranje virov
Vsi zgornji viri so urejeni v mojem repozitoriju GitHub, po potrebi jih vzemite sami:
👉 github.com/geekjourneyx/awesome-openclaw
Dve veščini, dva vodnika in en majhen trik. Ni veliko, vendar sem jih sam preizkusil in potrdil.
Ni pomembno, koliko orodij imate, pomembno je, da lahko vsako od njih resnično uporabite.





