Jaz sem AI naučil samo en trik, ostalo se je naučil sam...

2/13/2026
3 min read

Danes bom uredil praktičen komplet. Dve veščini, dva vodnika in en majhen trik, ki jih uporabljam sam, pripravljeni za uporabo.

Druga veščina: Naj se AI sam nauči najti veščine

Find Skills je tisto, kar najbolj priporočam.

image.png

Veliko ljudi razmišlja takole: AI moram namestiti veliko veščin, eno za drugo ročno. Mislim, da ta pot ne bo dolga. Več kot je veščin, težje jih je obvladovati.

Spremenite način razmišljanja: ne hranite ga z veščinami, ampak naj jih poišče sam.

Find Skills počne točno to. Je kot "iskalnik veščin". Ko AI asistent ne ve, kako nekaj narediti, sam poišče, namesti in se nauči.

image.pngTako kot se ljudje učijo. Ni vam treba v glavo vtakniti vsega znanja, samo naučiti se morate, kako najti znanje in kako se učiti.

Mislim, da je to prihodnja smer avtomatizacije AI, ne kopičenje veščin, ampak omogočanje, da se uči samostojno kot človeški možgani.

Namestitev je zelo preprosta:

npx skills add https://github.com/vercel-labs/skills --skill find-skills

Po namestitvi bo vaš AI asistent imel "sposobnost samoučenja".

Druga veščina: Agent Browser

Iskanje in učenje nista dovolj, veliko nalog zahteva upravljanje spletnih strani. Izpolnjevanje obrazcev, zajemanje podatkov, posnetki zaslona, prijava v ozadje ... vse to lahko stori Agent Browser.

Njegova logika je zelo jasna: odprite spletno stran → prepoznajte elemente → kliknite, izpolnite, izberite → potrdite rezultat.

Postopek je enak kot pri upravljanju brskalnika, le da to namesto vas počne AI. Enostavni postopki so še vedno precej stabilni, pazite le na porabo žetonov (Token).

Ukaz za namestitev:

npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser

Po namestitvi bo vaš AI asistent imel "roke" in bo lahko neposredno upravljal brskalnik.

Dva praktična vodnika

Samo veščine niso dovolj, najprej je treba vzpostaviti nekaj infrastrukture. Napisal sem dva vodnika, oba sta v repozitoriju GitHub.

1. Vodnik za namestitev orodja Browser Tool

Korak za korakom vas naučim, kako konfigurirati orodje brskalnika v okolju Linux/Ubuntu. Vključno z namestitvijo Chroma, izolacijo konfiguracijskih datotek, upravljanjem več konfiguracij itd. Ko to uredite, lahko Agent Browser resnično začne delovati.

2. Vodnik za spletno iskanje Web Search

Omogočite svojemu AI asistentu, da išče po internetu. Primerjal sem več storitev tretjih oseb in na koncu priporočil Brave Search. Razlog je preprost: dovolj brezplačne kvote, hitra odzivnost in konfiguracija ni zapletena.

Če želite, da vaš AI asistent ne išče odgovorov samo v lokalni bazi znanja, ampak lahko išče informacije na spletu tako kot vi, je ta vodnik vreden, da ga preberete.

Majhen trik: prepoznavanje govora

Če želite, da vaš AI asistent razume govor, lahko povežete storitev pretvorbe govora v besedilo ElevenLabs, učinek prepoznavanja je kar dober.

Način konfiguracije je zelo preprost: preprosto recite svojemu AI asistentu "Pomagaj mi namestiti veščino ElevenLabs Speech-to-Text, potrebujem dostop do prepoznavanja govora ElevenLabs" in mu pošljite API Key, in sam ga bo konfiguriral.

Vendar vas moram opozoriti: ta storitev je plačljiva, ima brezplačno kvoto, vendar ni velika. V vsakdanjih scenarijih je pravzaprav dovolj, da uporabite vgrajeno pretvorbo govora v besedilo v orodjih za klepet. Če pa imate potrebe po paketnem prepisovanju zvoka, zapisih sestankov itd., jo lahko preizkusite.

image.png

Zbiranje virov

Vsi zgornji viri so urejeni v mojem repozitoriju GitHub, po potrebi jih vzemite sami:

👉 github.com/geekjourneyx/awesome-openclaw

Dve veščini, dva vodnika in en majhen trik. Ni veliko, vendar sem jih sam preizkusil in potrdil.

Ni pomembno, koliko orodij imate, pomembno je, da lahko vsako od njih resnično uporabite.

Published in Technology

You Might Also Like