Claude Code vs Codex: Я подивився 38 хвилин тестування, різниця більша, ніж очікувалося
Claude Code vs Codex: Я подивився 38 хвилин тестування, різниця більша, ніж очікувалося
Спочатку про висновок: якщо ви незалежний розробник або вам потрібно швидко перетворити ідею на продукт, обирайте Claude Code. Немає про що турбуватися.
Я зазвичай користуюсь Claude Code, Codex лише іноді відкриваю, щоб спробувати. Це уподобання не слідує моді, Claude Code оновлюється занадто швидко, засновник Борис Чурней часто ділиться в Twitter досвідом команди, яка використовує його для реальної розробки. Це не демонстрація, а справжнє, що працює в продуктивному середовищі.
А що з Codex? Його можливості дійсно сильні, я пробував зробити кілька маленьких програм. У колі говорять, що для бекенду та безпеки Codex підходить більше.
Засновник Clawdbot Петер Штайнбергер зазначив, що він витратив близько 10 днів на vibe coding, щоб створити прототип Clawdbot, в основному покладаючись на Claude Code та Codex для розробки, при цьому для складного кодування та основних частин він більше покладався на Codex.
Отже, хто з цих двох інструментів більше підходить як AI інструмент для програмування? Раніше я також не був впевнений.
Поки не побачив це тестування.
Закордонний блогер Мансел Шеффел провів дуже жорсткий експеримент: дав обом інструментам абсолютно однаковий prompt, щоб вони з нуля побудували додаток і розгорнули його. Весь процес був записаний, 38 хвилин.
Один. Налаштування експерименту: абсолютно чесне змагання
Завдання дуже просте, але й повне: створити додаток для аналізу конкурентів під назвою "Rival".
Користувач вводить URL компанії, додаток автоматично збирає інформацію про цю компанію та її конкурентів, генерує повний звіт про конкурентний аналіз. Якщо звертатися до консалтингової компанії, це коштуватиме не менше 10 тисяч доларів.
Технічний стек: Supabase (база даних + аутентифікація) + Firecrawl (веб-скрапінг) + Vercel (розгортання)
Правила: абсолютно однакові підказки, без додаткових підказок, подивимося, хто зможе самостійно завершити.
Два. Перший раунд: етап планування
Codex відразу ж задає вам десяток запитань.
- Хто є цільовою аудиторією?
- Яку модель використовувати для аналізу?
- Який метод аутентифікації вибрати?
- Який стиль UI визначити?
- Який встановити ліміт використання за замовчуванням?
Прямо почав писати код.
Оцінка блогера дуже влучна: "Codex схожий на обережного стажера, Claude Code - на впевненого професіонала."
Три. Другий раунд: швидкість побудови
А потім довге очікування.
- Claude Code: приблизно 1 година на завершення
- Codex: більше 2 годин, ще триває
Чотири. Третій раунд: порівняння якості UI
Після завершення обидва додатки були розгорнуті, блогер відкрив інтерфейси для порівняння.
Інтерфейс Claude Code: не вражає, але працює. Розташування логічне, шрифт нормальний.
Інтерфейс Codex: блогер відразу ж висловив невдоволення —
"Скажу чесно, цей інтерфейс дуже потворний. 2026 рік, як можна генерувати такі шрифти та відстані?"
П’ять. Четвертий раунд: тестування функцій
Справжнє випробування: обидва інструменти повинні проаналізувати ClickUp.
Claude Code:
Перший раз виникла помилка. Але виправлення було швидким, за кілька хвилин виявили проблему (конфігурація JWT верифікації), за 4 хвилини виправили.
Після виправлення успішно зібрали дані про ClickUp та його конкурентів: Monday, Notion, Asana, Atlassian. Звіт також був згенерований.
Codex:
Стикнувся з такою ж помилкою.
Знайти проблему зайняло 19 хвилин.
Після виправлення все ще не працювало. Блогер чекав ще довго, врешті-решт здався.
Шість. П’ятий раунд: незалежна оцінка
Блогер запросив Gemini Pro 3 для сліпої оцінки двох кодових баз. Цей етап досить цікавий.
У сфері безпеки бекенду: Codex виграв.
Gemini вважає, що його архітектура безпеки більш зріла: повна стратегія безпеки на рівні рядків (RLS), незмінні журнали аудиту, моделі авторизації реалізовані краще. Це також підтверджує думку в колі — для бекенду та безпеки Codex дійсно має свою систему.
У сфері якості фронтенду: Claude Code беззаперечно виграв.
Цілісність коду, ясність логіки, якість реалізації UI — все це явно краще.
Підсумок блогера дуже прямий:
"Ви можете переконати мене, що Codex більш безпечний, але ви не можете переконати мене його використовувати. Тому що його користувацький досвід занадто поганий. Інструмент, який не може реалізувати навіть основні функції, не має сенсу, як би безпечним він не був."
Сім. Підсумок основних відмінностей
Після перегляду цього тестування мої думки трохи змінилися.
Раніше я вважав, що обидва інструменти мають свої переваги та недоліки, вибір залежить від ситуації. Тепер я вважаю, що якщо ви незалежний розробник або вам потрібно швидко перевірити ідею, створити MVP, ефективність і надійність Claude Code значно вищі. Час — це гроші, поки Codex запитує вас десяте питання, Claude Code, можливо, вже запустився.
Але якщо ви займаєтеся корпоративним бекендом і маєте суворі вимоги до безпеки, Codex варто розглянути. Головне, щоб у вас було терпіння.

