Én csak egy trükköt tanítottam a mesterséges intelligenciának, a többit magától megtanulta...
Ma egy gyakorlati gyűjteményt állítottam össze. Két képesség, két útmutató és egy kis trükk, mindet én magam használom, azonnal használhatóak.
Második képesség: A mesterséges intelligencia maga tanulja meg a képességek keresését
A Find Skills-t szeretném a legjobban ajánlani.

Sokak gondolkodása az, hogy sok képességet kell a mesterséges intelligenciába telepíteni, egyenként manuálisan hozzáadni. Szerintem ez az út nem vezet messzire. Egyre több képesség lesz, és képtelen leszel kezelni őket.
Váltsunk gondolkodásmódot: ne etessük képességekkel, hanem hadd találja meg maga.
A Find Skills ezt csinálja. Ez egy "képességkereső", a mesterséges intelligencia asszisztens, ha nem tud valamit, maga keresi meg, maga telepíti, maga tanulja meg.
Mint ahogy az emberek tanulnak. Nem kell minden tudást a fejedbe tömni, csak meg kell tanulnod, hogyan keress tudást, hogyan tanulj tudást.
Szerintem ez a mesterséges intelligencia automatizálásának jövője, nem a képességek halmozása, hanem az, hogy úgy tanuljon önállóan, mint az emberi agy.
A telepítés egyszerű:
npx skills add https://github.com/vercel-labs/skills --skill find-skillsA telepítés után a mesterséges intelligencia asszisztensed "önképző" képességgel rendelkezik.
Második képesség: Agent Browser
Nem elég a keresési és tanulási képesség, sok feladathoz weboldalak kezelése szükséges. Űrlapok kitöltése, adatok gyűjtése, képernyőképek készítése, háttérbe való bejelentkezés... Az Agent Browser mindezt meg tudja csinálni.
A logikája nagyon világos: weboldal megnyitása → elemek azonosítása → kattintás, kitöltés, kiválasztás → eredmény megerősítése.
Ugyanaz a folyamat, mint amikor egy ember böngészőt használ, csak a mesterséges intelligencia csinálja helyetted, az egyszerű folyamatok viszonylag stabilak, figyelj a Token költségére.
Telepítési parancs:
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browserA telepítés után a mesterséges intelligencia asszisztensed "keze" van, és közvetlenül tudja kezelni a böngészőt.
Két gyakorlati útmutató
Nem elég a képesség, néhány infrastruktúrát először ki kell építeni. Két útmutatót írtam, mindkettő a GitHub tárolómban található.
1. Browser Tool telepítési útmutató
Lépésről lépésre megmutatom, hogyan kell a böngésző eszközt Linux/Ubuntu környezetben konfigurálni. Beleértve a Chrome telepítését, a konfigurációs fájlok elkülönítését, a több konfiguráció kezelését stb. Ha ezt a lépést megoldod, az Agent Browser valóban futni fog.
2. Web Search online keresési útmutató
Engedd, hogy a mesterséges intelligencia asszisztensed online keressen. Összehasonlítottam néhány harmadik féltől származó szolgáltatást, és végül a Brave Search-öt ajánlom. Az ok egyszerű: az ingyenes keret elegendő, a válaszidő gyors, és a konfiguráció sem bonyolult.
Ha azt szeretnéd, hogy a mesterséges intelligencia asszisztensed ne csak a helyi tudásbázisban keressen válaszokat, hanem úgy keressen információkat az interneten, mint te, akkor érdemes végigmenni ezen az útmutatón.
Egy kis trükk: Beszédfelismerés
Ha azt szeretnéd, hogy a mesterséges intelligencia asszisztensed megértse a beszédet, csatlakoztathatod az ElevenLabs beszéd-szöveg szolgáltatását, a felismerési hatás nem rossz.
A konfiguráció nagyon egyszerű: mondd meg a mesterséges intelligencia asszisztensednek, hogy "telepítse az ElevenLabs Speech-to-Text képességet, szükségem van az ElevenLabs beszédfelismerés csatlakoztatására", majd küldd el neki az API Key-t, és automatikusan beállítja neked.
De figyelmeztetlek: ez a szolgáltatás fizetős, van ingyenes keret, de nem sok. A mindennapi használat során valójában elegendő a csevegőeszközök saját beszéd-szöveg funkciója. De ha van tömeges hangátírási, konferenciajegyzetelési igényed, akkor kipróbálhatod.

Erőforrás-összefoglaló
A fenti összes erőforrás a GitHub tárolómban található, vedd el, amire szükséged van:
👉 github.com/geekjourneyx/awesome-openclaw
Két képesség, két útmutató és egy kis trükk. Nem sok, de mindet én magam teszteltem.
Nem a sok eszköz a lényeg, hanem az, hogy mindegyik valóban használható legyen.





