Claude Code vs Codex: მე ვნახე 38 წუთიანი ტესტირება, განსხვავება უფრო დიდი იყო ვიდრე ველოდი
Claude Code vs Codex: მე ვნახე 38 წუთიანი ტესტირება, განსხვავება უფრო დიდი იყო ვიდრე ველოდი
პირველ რიგში, დასკვნა: თუ თქვენ დამოუკიდებელი დეველოპერი ხართ, ან გჭირდებათ სწრაფად გადაიყვანოთ იდეები პროდუქტში, აირჩიეთ Claude Code. არ არის საჭირო შეწუხება.
ჩემთვის ძირითადად Claude Code-ი გამოიყენება, Codex კი მხოლოდ პერიოდულად ვცდილობ. ეს უპირატესობა არ არის მოდის ტენდენცია, Claude Code ძალიან სწრაფად განახლდება, დამფუძნებელი Boris Churney ხშირად აქვეყნებს Twitter-ზე გუნდური რეალური განვითარების გამოცდილებას. ეს არ არის დემო, ეს არის რეალურად წარმოებაში გაწვდილი პროდუქტი.
Codex-ის შესახებ? შესაძლებლობები ნამდვილად ძლიერი აქვს, მე რამდენიმე პატარა პროგრამა გავაკეთე. წრეში有人说做后端、搞安全用 Codex 更合适。
Clawdbot-ის დამფუძნებელი Peter Steinberger აცხადებს, რომ მან დაახლოებით 10 დღე დახარჯა vibe coding-ის გამოყენებით Clawdbot-ის პროტოტიპის შექმნაზე, ძირითადად Claude Code და Codex-ის გამოყენებით, სადაც რთული კოდირება და ძირითადი ნაწილი უფრო Codex-ზე იყო დამოკიდებული.
ასე რომ, ეს ორი ინსტრუმენტი ვის უფრო უკეთესად მოერგება AI პროგრამირების ინსტრუმენტად? ადრე არ ვიყავი დარწმუნებული.
მდე იმ ტესტირების ნახვამდე.
უცხოელი ბლოგერი Mansel Scheffel-მა ძალიან რთული ექსპერიმენტი ჩაატარა: ორივე ინსტრუმენტისთვის სრულიად ერთნაირი prompt მიაწვდო, რათა მათ ნულიდან შექმნან აპლიკაცია და განათავსონ ონლაინ. მთელი პროცესის ჩანაწერი გაკეთდა, 38 წუთი.
ერთი, ექსპერიმენტის პარამეტრები: სრულიად სამართლიანი დაპირისპირება
მოცემული დავალება ძალიან მარტივია, მაგრამ სრულყოფილი: შექმენით აპლიკაცია სახელწოდებით "Rival" კონკურენტული ინფორმაციის ანალიზისთვის.
მომხმარებელი აწვდავს კომპანიის URL-ს, აპლიკაცია ავტომატურად იჭერს ამ კომპანიის და მისი კონკურენტების ინფორმაციას, ქმნის სრულყოფილ კონკურენტულ ანალიზის ანგარიშს. ასეთი ანალიზი, თუ კონსულტაციის კომპანიას მიმართავთ, მინიმუმ 10,000 დოლარი დაგიჯდებათ.
ტექნოლოგიური სტეკი: Supabase (ბაზა + ავტორიზაცია) + Firecrawl (ვებსაიტების抓取) + Vercel (განათავსება)
წესები: სრულიად ერთნაირი提示词, დამატებითი提示 არ არის, ვნახოთ ვინ შეძლებს დამოუკიდებლად დასრულებას.
ორი, პირველი რაუნდი: დაგეგმვის ეტაპი
Codex იწყებს და გეკითხება ათზე მეტი კითხვა.
- ვინ არის მიზნობრივი მომხმარებელი?
- რომელი მოდელი უნდა გამოვიყენოთ ანალიზისთვის?
- რომელი ავტორიზაციის მეთოდი უნდა ავირჩიოთ?
- როგორ უნდა განისაზღვროს UI სტილი?
- რა უნდა იყოს დეფოლტი გამოყენების ზღვარი?
მباشად დაიწყო კოდის წერა.
ბლოგერის შეფასება ძალიან ზუსტია: "Codex არის როგორც ფრთხილი სტაჟიორი, Claude Code კი როგორც თავდაჯერებული პროფესიონალი."
სამი, მეორე რაუნდი: მშენებლობის სიჩქარე
შემდეგ იყო ხანგრძლივი ლოდინი.
- Claude Code: დაახლოებით 1 საათში დასრულდა
- Codex: 2 საათზე მეტი, ჯერ კიდევ გრძელდება
ოთხი, მესამე რაუნდი: UI ხარისხის შედარება
ორივე მხარე დასრულების შემდეგ, ბლოგერი UI-ს შედარებას იწყებს.
Claude Code-ის ინტერფეისი: არ არის გასაოცარი, მაგრამ გამოსაყენებელია. განლაგება ლოგიკურია, შრიფტი ნორმალურია.
Codex-ის ინტერფეისი: ბლოგერი ადგილზე წუწუნებს——
"მართლა, ეს ინტერფეისი ძალიან მახინჯია. 2026 წელს, როგორ შეიძლება ასეთი შრიფტი და间距生成?"
ხუთი, მეოთხე რაუნდი: ფუნქციონალური ტესტირება
ნამდვილად რთული გამოცდა: ორივე მხარეს ClickUp-ის ანალიზი უნდა ჩაატარონ.
Claude Code:
პირველად შეცდომა მოხდა. მაგრამ სწრაფად გამოასწორა, რამდენიმე წუთში პრობლემა (JWT ავტორიზაციის კონფიგურაცია) იპოვა, 4 წუთში მოაგვარა.
შესაბამისად, წარმატებით იჭერს ClickUp-ს და მის კონკურენტებს: Monday, Notion, Asana, Atlassian. ანგარიში ასევე შეიქმნა.
Codex:
იმავე შეცდომას შეხვდა.
19 წუთი დასჭირდა პრობლემის პოვნას.
შემდეგ ისევ ვერ გაწვდეს. ბლოგერი კიდევ დიდხანს ელოდა, ბოლოს კი უარი თქვა.
ექვსი, მეხუთე რაუნდი: მესამე მხარის შეფასება
ბლოგერმა Gemini Pro 3-ისგან ორი კოდის ბიბლიოთეკა ბრმა შეფასება მოითხოვა. ეს ეტაპი საკმაოდ საინტერესო იყო.
უკანა უსაფრთხოების ასპექტში: Codex მოიგო.
Gemini მიიჩნევს, რომ მისი უსაფრთხოების არქიტექტურა უფრო განვითარებულია: სრულყოფილი რიგის უსაფრთხოების პოლიტიკა (RLS), შეუცვლელი აუდიტის ლოგები, ავტორიზაციის მოდელები უკეთესად გაკეთებულია. ეს ასევე ადასტურებს წრეში გავრცელებულ აზრს——უკანა, უსაფრთხოების საკითხებში Codex ნამდვილად აქვს თავისი სისტემა.
წინა ხარისხის ასპექტში: Claude Code სრულად მოიგო.
კოდის მთლიანობა, ლოგიკური სიწმინდე, UI-ის განხორციელების ხარისხი, აშკარად უკეთესია.
ბლოგერის დასკვნა ძალიან პირდაპირია:
"თქვენ შეგიძლიათ მითხრათ, რომ Codex უფრო უსაფრთხოა, მაგრამ ვერ დამარწმუნებთ მისი გამოყენებისას. რადგან მისი მომხმარებლის გამოცდილება ძალიან ცუდია. ინსტრუმენტი, რომელიც ვერ ახერხებს ძირითადი ფუნქციების შესრულებას, რამდენადაც უსაფრთხოა, რა მნიშვნელობა აქვს?"
შვიდი, ძირითადი განსხვავების შეჯამება
ამ ტესტირების შემდეგ, ჩემი აზრები ცოტა შეიცვალა.
წინათ ვფიქრობდი, რომ ორივე ინსტრუმენტი თავისი უპირატესობებითა და ნაკლებით იყო აღჭურვილი, რომელი უნდა აირჩიოთ სცენარის მიხედვით. ახლა ვფიქრობ, რომ თუ თქვენ დამოუკიდებელი დეველოპერი ხართ, ან გჭირდებათ სწრაფად გაამყაროთ იდეა, Claude Code-ის ეფექტურობა და სანდოობა უფრო მაღალია. დრო არის ფული, როდესაც Codex თქვენ ათი კითხვით გეკითხება, Claude Code უკვე გაწვდილი იქნება.
მაგრამ თუ თქვენ მუშაობთ საწარმოს დონის უკანა მხარეს, უსაფრთხოების მკაცრი მოთხოვნებით, Codex值得考虑. წინაპირობა კი არის, რომ თქვენ უნდა იყოთ მოთმინება.

