Claude Code vs Codex: Aš žiūrėjau 38 minutes realaus testo, skirtumas didesnis nei tikėtasi
Claude Code vs Codex: Aš žiūrėjau 38 minutes realaus testo, skirtumas didesnis nei tikėtasi
Pirmiausia pasakysiu išvadą: jei esi nepriklausomas kūrėjas arba reikia greitai paversti idėjas į produktus, rinkis Claude Code. Nėra dėl ko dvejoti.
Aš paprastai naudoju Claude Code, Codex tik kartais atidarau pabandyti. Šis pasirinkimas nėra mados reikalas, Claude Code atnaujinimai vyksta labai greitai, įkūrėjas Boris Churney dažnai Twitter dalijasi komandos patirtimi, kaip jie naudoja jį tikroje plėtroje. Tai ne demo, tai tikrai veikiantys produktai.
O Codex? Gebėjimai tikrai stiprūs, aš pats sukūriau keletą mažų programų. Aplinkoje kai kurie sako, kad Codex labiau tinka backend'ui ir saugumui.
Clawdbot įkūrėjas Peter Steinberger teigia, kad jis per maždaug 10 dienų vibe coding sukūrė Clawdbot prototipą, daugiausia remdamasis Claude Code ir Codex, kur sudėtingesnį kodavimą ir pagrindines dalis jis labiau pasitikėjo Codex.
Taigi, kuris iš šių dviejų labiau tinka kaip AI programavimo įrankis? Anksčiau irgi nesu buvęs tikras.
Kol nepamačiau šio realaus testo.
Užsienio tinklaraštininkas Mansel Scheffel atliko labai rimtą eksperimentą: suteikė dviem įrankiams visiškai tą patį prompt'ą, kad jie nuo nulio sukurtų programą ir ją paleistų. Viskas buvo įrašyta, 38 minutės.
I. Eksperimento nustatymas: visiškai sąžiningas mūšis
Užduotis labai paprasta, bet ir labai išsami: sukurti programą, vadinamą "Rival", konkurentų informacijos analizės programą.
Vartotojas įveda įmonės URL, programa automatiškai surenka šios įmonės ir jos konkurentų informaciją, sugeneruoja išsamų konkurencijos analizės ataskaitą. Tokia analizė, jei ieškotum konsultacijų įmonės, kainuotų ne mažiau kaip 10 tūkst. dolerių.
Technologijų krūva: Supabase (duomenų bazė + autentifikacija) + Firecrawl (internetinių puslapių surinkimas) + Vercel (paleidimas)
Taisyklės: visiškai identiški nurodymai, be papildomų patarimų, pažiūrėti, kas gali savarankiškai užbaigti.
II. Pirmas ratas: planavimo etapas
Codex iš karto užduoda tau dešimt klausimų.
- Kas yra tikslinė auditorija?
- Kuriuo modeliu atlikti analizę?
- Kurį autentifikavimo metodą pasirinkti?
- Kaip nustatyti UI stilių?
- Koks yra numatytas naudojimo limitas?
Tiesiog pradeda rašyti kodą.
Tinklaraštininko vertinimas labai tikslus: "Codex kaip atsargus praktikantas, Claude Code kaip pasitikintis senbuvis."
III. Antras ratas: kūrimo greitis
Tada prasideda ilgas laukimas.
- Claude Code: apie 1 valandą baigta
- Codex: daugiau nei 2 valandas, vis dar tęsiasi
IV. Trečias ratas: UI kokybės palyginimas
Po to, kai abi pusės buvo paleistos, tinklaraštininkas atidarė sąsają palyginimui.
Claude Code sąsaja: neįspūdinga, bet veikia. Išdėstymas protingas, šriftas normalus.
Codex sąsaja: tinklaraštininkas iš karto pasakė —
"Sakykime tiesiai, ši sąsaja per daug bjauri. 2026 metai, kaip galima sugeneruoti tokį šriftą ir tarpus?"
V. Ketvirtas ratas: funkcijų testavimas
Tikras išbandymas atėjo: leiskite abiem pusėms analizuoti ClickUp.
Claude Code:
Pirmą kartą paleidus, įvyko klaida. Bet taisymas buvo greitas, per kelias minutes buvo nustatyta problema (JWT autentifikavimo konfigūracija), per 4 minutes buvo ištaisyta.
Po taisymo sėkmingai surinko ClickUp ir jo konkurentus: Monday, Notion, Asana, Atlassian. Ataskaita taip pat buvo sugeneruota.
Codex:
Susidūrė su ta pačia klaida.
Užtruko 19 minučių, kol rado problemą.
Po taisymo vis tiek neveikė. Tinklaraštininkas laukė ilgai, galiausiai atsisakė.
VI. Penktas ratas: trečiųjų šalių vertinimas
Tinklaraštininkas pakvietė Gemini Pro 3 aklai įvertinti du kodų saugyklas. Šis etapas buvo gana įdomus.
Backend saugumo srityje: Codex laimėjo.
Gemini mano, kad jo saugumo architektūra yra brandesnė: pilnas eilučių lygio saugumo strategijos (RLS), nekintamų auditų žurnalų, autorizacijos modeliai yra geresni. Tai taip pat patvirtina nuomonę aplinkoje — dirbant su backend'u ir saugumu, Codex tikrai turi savo sistemą.
Frontend kokybės srityje: Claude Code visiškai laimėjo.
Kodo vientisumas, logikos aiškumas, UI įgyvendinimo kokybė yra akivaizdžiai geresni.
Tinklaraštininko išvada labai tiesi:
"Tu gali įtikinti mane, kad Codex yra saugesnis, bet negali įtikinti manęs jį naudoti. Nes jo vartotojo patirtis per prasta. Įrankis, kuris net negali įgyvendinti pagrindinių funkcijų, koks jo saugumas?"
VII. Pagrindinių skirtumų santrauka
Peržiūrėjęs šį realų testą, mano mintys šiek tiek pasikeitė.
Anksčiau maniau, kad abu įrankiai turi savo privalumų ir trūkumų, kurį pasirinkti priklauso nuo situacijos. Dabar manau, kad jei esi nepriklausomas kūrėjas arba reikia greitai patikrinti idėjas, sukurti MVP, Claude Code efektyvumas ir patikimumas yra geresni. Laikas yra pinigai, kol Codex užduos tau dešimtą klausimą, Claude Code gali jau veikti.
Bet jei dirbi su įmonių lygio backend'u, turinčiu griežtus saugumo reikalavimus, Codex verta apsvarstyti. Pirmiausia turi turėti kantrybės.

