Claude Code vs Codex: Я посмотрел 38 минут тестирования, разница больше, чем ожидалось
Claude Code vs Codex: Я посмотрел 38 минут тестирования, разница больше, чем ожидалась
Сначала скажу вывод: если вы независимый разработчик или вам нужно быстро превратить идею в продукт, выбирайте Claude Code. Здесь нет о чем долго думать.
Я обычно использую Claude Code, Codex открываю только время от времени. Это предпочтение не модное, Claude Code обновляется слишком быстро, основатель Борис Чурней часто делится в Твиттере опытом команды, использующей его для реальной разработки. Это не демо, это действительно работающие вещи в производственной среде.
А Codex? Возможности действительно сильные, я сам делал несколько небольших программ. В кругу говорят, что для бэкенда и безопасности Codex более подходящий.
Основатель Clawdbot Питер Штайнбергер заявил, что он потратил около 10 дней на vibe coding, чтобы создать прототип Clawdbot, в основном полагаясь на Claude Code и Codex для разработки, при этом для сложного кодирования и ключевых частей он больше полагался на Codex.
Так кто из них лучше подходит в качестве инструмента для программирования на AI? Ранее я тоже не был уверен.
Пока не увидел этот тест.
Зарубежный блогер Мансел Шеффель провел очень жесткий эксперимент: дал двум инструментам абсолютно одинаковый prompt, чтобы они с нуля построили приложение и развернули его. Весь процесс был записан, 38 минут.
I. Условия эксперимента: абсолютно честное противостояние
Задача очень простая, но полная: построить приложение для анализа конкурентной информации под названием "Rival".
Пользователь вводит URL компании, приложение автоматически собирает информацию о компании и ее конкурентах, генерируя полный отчет о конкурентном анализе. Если обратиться в консалтинговую компанию, это обойдется не менее чем в 10 тысяч долларов.
Технологический стек: Supabase (база данных + аутентификация) + Firecrawl (веб-скрейпинг) + Vercel (развертывание)
Правила: абсолютно одинаковые подсказки, без дополнительных подсказок, посмотрим, кто сможет завершить самостоятельно.
II. Первый раунд: этап планирования
Codex сразу же задает вам десяток вопросов.
- Кто целевая аудитория?
- Какую модель использовать для анализа?
- Какой способ аутентификации выбрать?
- Какой стиль UI определить?
- Какой установить лимит по умолчанию?
Прямо начал писать код.
Оценка блогера очень точная: "Codex как осторожный стажер, Claude Code как уверенный профессионал."
III. Второй раунд: скорость построения
Затем началось долгое ожидание.
- Claude Code: примерно 1 час на завершение
- Codex: более 2 часов, все еще продолжается
IV. Третий раунд: сравнение качества UI
После развертывания с обеих сторон блогер открыл интерфейсы для сравнения.
Интерфейс Claude Code: не впечатляющий, но рабочий. Компоновка разумная, шрифт нормальный.
Интерфейс Codex: блогер тут же высказал недовольство —
"Серьезно, этот интерфейс слишком уродлив. 2026 год, как можно генерировать такие шрифты и отступы?"
V. Четвертый раунд: тестирование функций
Настоящее испытание пришло: заставить обе стороны проанализировать ClickUp.
Claude Code:
Первый раз выдал ошибку. Но исправление прошло быстро, через несколько минут нашел проблему (настройка проверки JWT), исправил за 4 минуты.
После исправления успешно собрал данные ClickUp и его конкурентов: Monday, Notion, Asana, Atlassian. Отчет также был сгенерирован.
Codex:
Столкнулся с той же ошибкой.
Потратил 19 минут на поиск проблемы.
После исправления все равно не работало. Блогер ждал долго, в конце концов сдался.
VI. Пятый раунд: независимая оценка
Блогер пригласил Gemini Pro 3 для слепой оценки двух кодовых баз. Этот этап довольно интересный.
В области безопасности бэкенда: Codex выиграл.
Gemini считает, что его архитектура безопасности более зрелая: полные стратегии безопасности на уровне строк (RLS), неизменяемые журналы аудита, модели авторизации сделаны лучше. Это также подтверждает мнение в кругу — для бэкенда и безопасности Codex действительно имеет свои преимущества.
В области качества фронтенда: Claude Code одержал полную победу.
Целостность кода, ясность логики, качество реализации UI — все явно лучше.
Резюме блогера очень прямое:
"Вы можете убедить меня, что Codex более безопасен, но вы не сможете убедить меня использовать его. Потому что его пользовательский опыт слишком плох. Инструмент, который не может реализовать даже базовые функции, какой смысл в его безопасности?"
VII. Итоговая сводка основных различий
Посмотрев этот тест, мои мысли немного изменились.
Ранее я считал, что оба инструмента имеют свои плюсы и минусы, выбор зависит от ситуации. Теперь я считаю, что если вы независимый разработчик или вам нужно быстро проверить идею, создать MVP, эффективность и надежность Claude Code значительно превосходят. Время — деньги, пока Codex задает вам десятый вопрос, Claude Code, возможно, уже запустился.
Но если вы работаете с корпоративным бэкендом и у вас строгие требования к безопасности, Codex стоит рассмотреть. При условии, что у вас есть терпение.

