ਮੈਂ AI ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਚਾਲ ਸਿਖਾਈ, ਅਤੇ ਇਸਨੇ ਬਾਕੀ ਸਭ ਕੁਝ ਆਪਣੇ ਆਪ ਸਿੱਖ ਲਿਆ...
ਅੱਜ ਮੈਂ ਇੱਕ ਅਸਲ ਸੰਸਾਰਕ ਸੰਗ੍ਰਹਿ ਤਿਆਰ ਕੀਤਾ ਹੈ। ਦੋ ਹੁਨਰ, ਦੋ ਗਾਈਡਾਂ, ਇੱਕ ਛੋਟੀ ਜਿਹੀ ਚਾਲ, ਇਹ ਸਭ ਮੈਂ ਖੁਦ ਵਰਤ ਰਿਹਾ ਹਾਂ, ਅਤੇ ਇਹ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਹਨ।
ਦੂਜਾ ਹੁਨਰ: AI ਨੂੰ ਆਪਣੇ ਆਪ ਹੁਨਰ ਲੱਭਣਾ ਸਿਖਾਓ
Find Skills ਇਹ ਉਹ ਚੀਜ਼ ਹੈ ਜਿਸਦੀ ਮੈਂ ਸਭ ਤੋਂ ਵੱਧ ਸਿਫ਼ਾਰਸ਼ ਕਰਨਾ ਚਾਹੁੰਦਾ ਹਾਂ।

ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਦਾ ਵਿਚਾਰ ਹੈ: ਮੈਂ AI ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਹੁਨਰ ਸਥਾਪਤ ਕਰਨਾ ਚਾਹੁੰਦਾ ਹਾਂ, ਇੱਕ-ਇੱਕ ਕਰਕੇ ਹੱਥੀਂ ਜੋੜਨਾ ਚਾਹੁੰਦਾ ਹਾਂ। ਮੈਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਇਹ ਰਸਤਾ ਬਹੁਤ ਦੂਰ ਨਹੀਂ ਜਾਵੇਗਾ। ਜਿੰਨੇ ਜ਼ਿਆਦਾ ਹੁਨਰ ਹੋਣਗੇ, ਤੁਸੀਂ ਉਨ੍ਹਾਂ ਨੂੰ ਸੰਭਾਲ ਨਹੀਂ ਸਕੋਗੇ।
ਇੱਕ ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਸੋਚੋ: ਇਸਨੂੰ ਹੁਨਰ ਨਾ ਦਿਓ, ਇਸਨੂੰ ਆਪਣੇ ਆਪ ਲੱਭਣ ਦਿਓ।
Find Skills ਇਹੀ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ "ਹੁਨਰ ਖੋਜ ਇੰਜਣ" ਦੇ ਬਰਾਬਰ ਹੈ। ਜਦੋਂ AI ਸਹਾਇਕ ਨੂੰ ਕੋਈ ਅਜਿਹੀ ਚੀਜ਼ ਮਿਲਦੀ ਹੈ ਜੋ ਉਹ ਨਹੀਂ ਜਾਣਦਾ, ਤਾਂ ਉਹ ਆਪਣੇ ਆਪ ਖੋਜਦਾ ਹੈ, ਆਪਣੇ ਆਪ ਸਥਾਪਤ ਕਰਦਾ ਹੈ, ਅਤੇ ਆਪਣੇ ਆਪ ਸਿੱਖਦਾ ਹੈ।
ਇਹ ਉਸੇ ਤਰ੍ਹਾਂ ਹੈ ਜਿਵੇਂ ਲੋਕ ਚੀਜ਼ਾਂ ਸਿੱਖਦੇ ਹਨ। ਤੁਹਾਨੂੰ ਸਾਰੇ ਗਿਆਨ ਨੂੰ ਆਪਣੇ ਦਿਮਾਗ ਵਿੱਚ ਭਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ, ਤੁਹਾਨੂੰ ਸਿਰਫ਼ ਇਹ ਸਿੱਖਣ ਦੀ ਲੋੜ ਹੈ ਕਿ ਗਿਆਨ ਕਿਵੇਂ ਲੱਭਣਾ ਹੈ ਅਤੇ ਗਿਆਨ ਕਿਵੇਂ ਸਿੱਖਣਾ ਹੈ।
ਮੈਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਇਹ ਭਵਿੱਖ ਵਿੱਚ AI ਆਟੋਮੇਸ਼ਨ ਦੀ ਦਿਸ਼ਾ ਹੈ, ਹੁਨਰਾਂ ਨੂੰ ਇਕੱਠਾ ਕਰਨਾ ਨਹੀਂ, ਸਗੋਂ ਇਸਨੂੰ ਮਨੁੱਖੀ ਦਿਮਾਗ ਵਾਂਗ ਖੁਦਮੁਖਤਿਆਰੀ ਨਾਲ ਸਿੱਖਣ ਦੇਣਾ ਹੈ।
ਇੰਸਟਾਲ ਕਰਨਾ ਬਹੁਤ ਸੌਖਾ ਹੈ:
npx skills add https://github.com/vercel-labs/skills --skill find-skillsਇੰਸਟਾਲ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਤੁਹਾਡੇ AI ਸਹਾਇਕ ਵਿੱਚ "ਸਵੈ-ਸਿੱਖਣ ਦੀ ਯੋਗਤਾ" ਹੋਵੇਗੀ।
ਦੂਜਾ ਹੁਨਰ: Agent Browser
ਖੋਜ ਅਤੇ ਸਿੱਖਣ ਦੀ ਯੋਗਤਾ ਹੋਣਾ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ, ਬਹੁਤ ਸਾਰੇ ਕੰਮਾਂ ਲਈ ਵੈੱਬਪੇਜਾਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਫਾਰਮ ਭਰਨਾ, ਡਾਟਾ ਕੱਢਣਾ, ਸਕ੍ਰੀਨਸ਼ਾਟ ਲੈਣਾ, ਬੈਕਗ੍ਰਾਉਂਡ ਵਿੱਚ ਲੌਗਇਨ ਕਰਨਾ... Agent Browser ਇਹ ਸਭ ਕਰ ਸਕਦਾ ਹੈ।
ਇਸਦਾ ਤਰਕ ਬਹੁਤ ਸਪੱਸ਼ਟ ਹੈ: ਵੈੱਬਪੇਜ ਖੋਲ੍ਹੋ → ਤੱਤਾਂ ਦੀ ਪਛਾਣ ਕਰੋ → ਕਲਿੱਕ ਕਰੋ, ਭਰੋ, ਚੁਣੋ → ਨਤੀਜਿਆਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰੋ।
ਇਹ ਉਸੇ ਤਰ੍ਹਾਂ ਹੈ ਜਿਵੇਂ ਲੋਕ ਬ੍ਰਾਊਜ਼ਰ ਚਲਾਉਂਦੇ ਹਨ, ਸਿਰਫ਼ ਇਹ ਹੈ ਕਿ AI ਤੁਹਾਡੇ ਲਈ ਇਹ ਕਰ ਰਿਹਾ ਹੈ, ਸਧਾਰਨ ਪ੍ਰਕਿਰਿਆ ਅਜੇ ਵੀ ਮੁਕਾਬਲਤਨ ਸਥਿਰ ਹੈ, ਧਿਆਨ ਦਿਓ ਕਿ ਇਸ ਵਿੱਚ Token ਲੱਗਦੇ ਹਨ।
ਇੰਸਟਾਲੇਸ਼ਨ ਕਮਾਂਡ:
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browserਇੰਸਟਾਲ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਤੁਹਾਡੇ AI ਸਹਾਇਕ ਕੋਲ "ਹੱਥ" ਹੋਣਗੇ ਅਤੇ ਉਹ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਬ੍ਰਾਊਜ਼ਰ ਚਲਾਉਣ ਦੇ ਯੋਗ ਹੋਵੇਗਾ।
ਦੋ ਅਸਲ ਸੰਸਾਰਕ ਗਾਈਡਾਂ
ਸਿਰਫ਼ ਹੁਨਰ ਹੋਣਾ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ, ਕੁਝ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਨੂੰ ਪਹਿਲਾਂ ਬਣਾਉਣ ਦੀ ਲੋੜ ਹੈ। ਮੈਂ ਦੋ ਗਾਈਡਾਂ ਲਿਖੀਆਂ ਹਨ, ਜੋ ਕਿ GitHub ਰਿਪੋਜ਼ਟਰੀ ਵਿੱਚ ਰੱਖੀਆਂ ਗਈਆਂ ਹਨ।
1. Browser Tool ਇੰਸਟਾਲੇਸ਼ਨ ਗਾਈਡ
ਇਹ ਤੁਹਾਨੂੰ ਹੱਥੀਂ ਸਿਖਾਉਂਦਾ ਹੈ ਕਿ Linux/Ubuntu ਵਾਤਾਵਰਣ ਵਿੱਚ ਬ੍ਰਾਊਜ਼ਰ ਟੂਲ ਨੂੰ ਕਿਵੇਂ ਕੌਂਫਿਗਰ ਕਰਨਾ ਹੈ। ਇਸ ਵਿੱਚ Chrome ਇੰਸਟਾਲੇਸ਼ਨ, ਕੌਂਫਿਗਰੇਸ਼ਨ ਫਾਈਲ ਆਈਸੋਲੇਸ਼ਨ, ਮਲਟੀਪਲ ਕੌਂਫਿਗਰੇਸ਼ਨ ਪ੍ਰਬੰਧਨ ਆਦਿ ਸ਼ਾਮਲ ਹਨ। ਇਸ ਕਦਮ ਨੂੰ ਪੂਰਾ ਕਰਨ ਤੋਂ ਬਾਅਦ, Agent Browser ਅਸਲ ਵਿੱਚ ਚੱਲ ਸਕੇਗਾ।
2. Web Search ਔਨਲਾਈਨ ਖੋਜ ਗਾਈਡ
ਆਪਣੇ AI ਸਹਾਇਕ ਨੂੰ ਔਨਲਾਈਨ ਖੋਜ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਓ। ਮੈਂ ਕਈ ਤੀਜੀ-ਧਿਰ ਸੇਵਾਵਾਂ ਦੀ ਤੁਲਨਾ ਕੀਤੀ, ਅਤੇ ਅੰਤ ਵਿੱਚ Brave Search ਦੀ ਸਿਫ਼ਾਰਸ਼ ਕੀਤੀ। ਕਾਰਨ ਬਹੁਤ ਸੌਖਾ ਹੈ: ਮੁਫ਼ਤ ਸੀਮਾ ਕਾਫ਼ੀ ਹੈ, ਜਵਾਬ ਦੇਣ ਦੀ ਗਤੀ ਤੇਜ਼ ਹੈ, ਅਤੇ ਕੌਂਫਿਗਰੇਸ਼ਨ ਵੀ ਗੁੰਝਲਦਾਰ ਨਹੀਂ ਹੈ।
ਜੇ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਤੁਹਾਡਾ AI ਸਹਾਇਕ ਸਿਰਫ਼ ਸਥਾਨਕ ਗਿਆਨ ਅਧਾਰ ਵਿੱਚ ਜਵਾਬ ਨਾ ਲੱਭੇ, ਸਗੋਂ ਤੁਹਾਡੇ ਵਾਂਗ ਔਨਲਾਈਨ ਜਾਣਕਾਰੀ ਖੋਜਣ ਦੇ ਯੋਗ ਹੋਵੇ, ਤਾਂ ਇਹ ਗਾਈਡ ਤੁਹਾਡੇ ਲਈ ਪੜ੍ਹਨ ਯੋਗ ਹੈ।
ਇੱਕ ਛੋਟੀ ਜਿਹੀ ਚਾਲ: ਵੌਇਸ ਰਿਕੋਗਨੀਸ਼ਨ
ਜੇ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਤੁਹਾਡਾ AI ਸਹਾਇਕ ਆਵਾਜ਼ ਨੂੰ ਸਮਝ ਸਕੇ, ਤਾਂ ਤੁਸੀਂ ElevenLabs ਦੀ ਵੌਇਸ-ਟੂ-ਟੈਕਸਟ ਸੇਵਾ ਨਾਲ ਜੁੜ ਸਕਦੇ ਹੋ, ਅਤੇ ਪਛਾਣ ਪ੍ਰਭਾਵ ਬਹੁਤ ਵਧੀਆ ਹੈ।
ਕੌਂਫਿਗਰ ਕਰਨ ਦਾ ਤਰੀਕਾ ਬਹੁਤ ਸੌਖਾ ਹੈ: ਸਿੱਧੇ ਆਪਣੇ AI ਸਹਾਇਕ ਨੂੰ ਕਹੋ "ਮੈਨੂੰ ElevenLabs Speech-to-Text ਹੁਨਰ ਸਥਾਪਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰੋ, ਮੈਨੂੰ ElevenLabs ਵੌਇਸ ਰਿਕੋਗਨੀਸ਼ਨ ਨਾਲ ਜੁੜਨ ਦੀ ਲੋੜ ਹੈ", ਅਤੇ ਫਿਰ ਇਸਨੂੰ API Key ਭੇਜੋ, ਅਤੇ ਇਹ ਆਪਣੇ ਆਪ ਤੁਹਾਡੇ ਲਈ ਕੌਂਫਿਗਰ ਹੋ ਜਾਵੇਗਾ।
ਪਰ ਮੈਂ ਤੁਹਾਨੂੰ ਯਾਦ ਦਿਵਾਉਣਾ ਚਾਹਾਂਗਾ: ਇਸ ਸੇਵਾ ਲਈ ਖਰਚਾ ਲੱਗਦਾ ਹੈ, ਇੱਥੇ ਇੱਕ ਮੁਫ਼ਤ ਸੀਮਾ ਹੈ ਪਰ ਇਹ ਜ਼ਿਆਦਾ ਨਹੀਂ ਹੈ। ਰੋਜ਼ਾਨਾ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ, ਗੱਲਬਾਤ ਟੂਲ ਵਿੱਚ ਬਿਲਟ-ਇਨ ਵੌਇਸ-ਟੂ-ਟੈਕਸਟ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਕਾਫ਼ੀ ਹੈ। ਪਰ ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਆਡੀਓ, ਮੀਟਿੰਗ ਰਿਕਾਰਡਾਂ ਨੂੰ ਬੈਚ ਵਿੱਚ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰਨ ਵਰਗੀਆਂ ਲੋੜਾਂ ਹਨ, ਤਾਂ ਤੁਸੀਂ ਇਸਨੂੰ ਅਜ਼ਮਾ ਸਕਦੇ ਹੋ।

ਸਰੋਤ ਸੰਖੇਪ
ਉਪਰੋਕਤ ਸਾਰੇ ਸਰੋਤ ਮੇਰੀ GitHub ਰਿਪੋਜ਼ਟਰੀ ਵਿੱਚ ਸੰਗ੍ਰਹਿਤ ਕੀਤੇ ਗਏ ਹਨ, ਜੇਕਰ ਤੁਹਾਨੂੰ ਲੋੜ ਹੋਵੇ ਤਾਂ ਤੁਸੀਂ ਇਸਨੂੰ ਲੈ ਸਕਦੇ ਹੋ:
👉 github.com/geekjourneyx/awesome-openclaw
ਦੋ ਹੁਨਰ, ਦੋ ਗਾਈਡਾਂ, ਇੱਕ ਛੋਟੀ ਜਿਹੀ ਚਾਲ। ਜ਼ਿਆਦਾ ਨਹੀਂ, ਪਰ ਇਹ ਸਭ ਉਹ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਮੈਂ ਖੁਦ ਚਲਾ ਕੇ ਪ੍ਰਮਾਣਿਤ ਕੀਤਾ ਹੈ।
ਟੂਲ ਜ਼ਿਆਦਾ ਹੋਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ, ਮੁੱਖ ਗੱਲ ਇਹ ਹੈ ਕਿ ਹਰ ਇੱਕ ਅਸਲ ਵਿੱਚ ਵਰਤੋਂ ਵਿੱਚ ਆ ਸਕੇ।





