Claude Opus 4.6 + GPT-5.3 Codex: ჩემი ორმაგი მოდელის სამუშაო პროცესი, ეფექტურობა პირდაპირ გაორმაგდა

ღამის თენებით ახალი მოდელების გამოშვებას რომ ელოდით, კარგად ხართ?

Anthropic-მა და OpenAI-მ ერთ დღეს გამოუშვეს თავიანთი ფლაგმანი მოდელები. მეგობრების წრე უკვე სავსეა სხვადასხვა შეფასებების შედარებებით.

მაგრამ დღეს შეფასებებზე არ მინდა საუბარი.

მინდა ვისაუბრო იმაზე, თუ რა შეგიძლიათ მიიღოთ ამ განახლებიდან?

ორმაგი მოდელის თანამშრომლობის სამუშაო პროცესი 🔥 პირველ რიგში, დეტალი, რომელმაც ზურგში გამაჟრჟოლა

OpenAI-ს ოფიციალურ ბლოგში არის ასეთი ფრაზა:

„GPT-5.3-Codex არის ჩვენი პირველი მოდელი, რომელმაც მნიშვნელოვანი როლი ითამაშა საკუთარი თავის შექმნის პროცესში.“

რას ნიშნავს ეს?

OpenAI-ს გუნდმა GPT-5.3-ის შემუშავების პროცესში გამოიყენა Codex-ის ადრეული ვერსიები სასწავლო პროცესის გამართვის, განლაგების მართვისა და ტესტის შედეგების ანალიზისთვის.

მათ თვითონაც კი თქვეს, რომ „გაოცებულები იყვნენ იმით, თუ რამდენად აჩქარებდა Codex-ი მათ განვითარებას“.

ხელოვნური ინტელექტი უკვე მონაწილეობს საკუთარ განვითარებაში.

ეს მახსენებს ჩემს წინა სტატიას მაოტაის შესახებ. მაშინ ვთქვი: „მომავალში მოკვდება თუ არა, ახლა თუ გამოსადეგია, გამოვიყენოთ.“

ახლა მინდა ვთქვა: ხელოვნური ინტელექტის ევოლუციის სიჩქარე შეიძლება უფრო სწრაფი იყოს, ვიდრე ჩვენ წარმოგვიდგენია.

სანამ „გაერკვევით“ და იმოქმედებთ, შეიძლება უკვე გვიანი იყოს.

💜 Claude Opus 4.6: არ არის უფრო ჭკვიანი, ნამდვილად შეუძლია დაგეხმაროთ მუშაობაში

Anthropic-ის ამ განახლების ოფიციალური ბლოგის სათაური ძალიან საინტერესოა: „ფინანსების განვითარება Claude Opus 4.6-ით“.

მათ სპეციალურად მოახდინეს ფინანსური ინდუსტრიისთვის ოპტიმიზაცია. მაგრამ ნუ იჩქარებთ გადახვევას, ეს შესაძლებლობები ჩვენთვისაც სასარგებლოა.

🔧 Cowork: საბოლოოდ შეუძლია ადგილობრივი ფაილების პირდაპირ მართვა

ეს არის ფუნქცია, რომელსაც ყველაზე მეტად ველოდი.

ადრე Claude-ის გამოყენებისას, ფაილის შინაარსის კოპირება და ჩასმა გიწევდათ.

ახლა Cowork-ის საშუალებით, შეგიძლიათ Claude-ს პირდაპირ წვდომა მისცეთ თქვენს კომპიუტერში არსებულ კონკრეტულ საქაღალდეზე, მას შეუძლია წაიკითხოს, შეცვალოს და შექმნას კიდეც ახალი ფაილები.

წარმოიდგინეთ: თქვენ აძლევთ მას დიზაინის საქაღალდეს და სთხოვთ, დაგეხმაროთ სახელების სტანდარტების ორგანიზებაში, დიზაინის დოკუმენტების გენერირებაში და სურათების სერიულად დამუშავებაში.

ეს მომავალი არ არის, ეს არის ფუნქცია, რომლის გამოყენებაც ახლავე შეგიძლიათ.

Cowork ფუნქცია

📊 Claude Excel-სა და PowerPoint-ში

Anthropic-მა Claude პირდაპირ Excel-ისა და PowerPoint-ის გვერდითა ზოლში ჩასვა.

Hebbia-ს CTO-მ თქვა: „ადრე ფინანსური PPT-ის გაკეთებას რამდენიმე საათი სჭირდებოდა, ახლა კი რამდენიმე წუთში ვასრულებთ.“

ეს ნამდვილი საჩუქარია პროდუქტის პრეზენტაციების და დიზაინის წინადადებების გასაკეთებლად.

Shortcut AI-ს თანადამფუძნებელმა თქვა: „Opus 4.6-ის შესრულების ნახტომი თითქმის წარმოუდგენელია. ის ამოცანები, რომლებიც Opus 4.5-ს რთულად ეჩვენებოდა, ახლა მოულოდნელად მარტივი გახდა.“

📈 ფინანსური სფეროს შეფასებები

ოფიციალური მონაცემები:

Finance Agent-ის შეფასება: 60.7% (5.47%-ით მეტი Opus 4.5-თან შედარებით)

TaxEval: 76.0%

Real-World Finance-ის შეფასება: 23 პროცენტული პუნქტით მეტი Sonnet 4.5-თან შედარებით

რას ნიშნავს ეს რიცხვები? Claude ნამდვილად გაძლიერდა რთული, მრავალსაფეხურიანი მსჯელობის ამოცანების დამუშავებაში.

💚 GPT-5.3 Codex: შეიცვალა ურთიერთქმედების მეთოდი, ეს არის მთავარი

⚡ სიჩქარე გაიზარდა 25%-ით, მაგრამ უფრო მნიშვნელოვანია ურთიერთქმედების მეთოდის ცვლილება

ადრე Codex-ის გამოყენებისას, შედეგის სანახავად ლოდინი გიწევდათ. მიმართულების შეცვლა გინდოდათ? უნდა გაგეჩერებინათ და თავიდან დაგეწყოთ.

ახლა სხვაგვარადაა.

GPT-5.3 Codex მუშაობის პროცესში აცნობებს პროგრესს, თქვენ კი შეგიძლიათ ნებისმიერ დროს ჩაერიოთ, დასვათ კითხვები, შეცვალოთ მიმართულება კონტექსტის დაკარგვის გარეშე.

ეს ურთიერთქმედების მეთოდი უფრო ჰგავს ნამდვილ კოლეგასთან თანამშრომლობას.

ურთიერთქმედების მეთოდების შედარება

🌐 ვებსაიტების განვითარების შესაძლებლობების გაუმჯობესება

ოფიციალურმა წარმომადგენლებმა წარმოადგინეს მაგალითი: GPT-5.3 Codex-ს და GPT-5.2 Codex-ს დაავალეს SaaS სადესანტო გვერდის გაკეთება.

GPT-5.3-ის ვერსია:

✅ ავტომატურად გარდაქმნის წლიურ ფასს საშუალო თვიურ ფასად, რაც ფასდაკლებას უფრო ინტუიციურს ხდის

✅ გააკეთა მომხმარებლის შეფასების ავტომატური კარუსელის კომპონენტი, სამი განსხვავებული შეფასებით

✅ მთლიანობაში უფრო ჰგავს პროდუქტს, რომლის გაშვებაც პირდაპირ შეიძლება

GPT-5.2-ის ვერსია შედარებით მარტივია და მეტ ხელით კორექტირებას საჭიროებს.

„მომხმარებლის განზრახვის გაგების“ ამ უნარის გაუმჯობესება ძალიან სასარგებლოა პროტოტიპების და დემოების გასაკეთებლად.

🔐 კიბერუსაფრთხოება: პირველი მოდელი, რომელიც „მაღალი შესაძლებლობებით“ აღინიშნა

ეს ინფორმაცია ბევრმა ვერ შეამჩნია.

GPT-5.3 Codex არის OpenAI-ს პირველი მოდელი, რომელიც კიბერუსაფრთხოების ამოცანებში „მაღალი შესაძლებლობების“ კატეგორიაში მოხვდა.

მათ სპეციალურად წამოიწყეს Trusted Access for Cyber პროგრამა და ასევე დაჰპირდნენ 10 მილიონი აშშ დოლარის API კრედიტის ინვესტირებას კიბერუსაფრთხოების თავდაცვის კვლევის მხარდასაჭერად.

ხელოვნური ინტელექტის შესაძლებლობების საზღვრები სწრაფად ფართოვდება.

📊 შეფასებების შედარება: ყველას თავისი ძლიერი მხარე აქვს

Terminal-Bench 2.0 (ტერმინალის პროგრამირების შესაძლებლობა)

GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 გაუმჯობესების დიაპაზონი: 13.3 პროცენტული პუნქტი

OSWorld-Verified (კომპიუტერის მართვის შესაძლებლობა)

GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 გაუმჯობესების დიაპაზონი: 26.5 პროცენტული პუნქტი

მთლიანობაში, GPT-5.3 Codex-მა მნიშვნელოვნად გააუმჯობესა ტერმინალის მართვისა და კომპიუტერის გამოყენების შესაძლებლობები.

შეფასებების შედარება

🍺 მაოტაის ლოგიკა: რა შეგიძლიათ მიიღოთ სანამ ისინი „მოკვდებიან“?

ცოტა ხნის წინ დავწერე სტატია, სადაც დუან იონგპინგის მიერ მაოტაის ყიდვის ლოგიკა გამოვიყენე ხელოვნური ინტელექტის ხელსაწყოების ღირებულების ასახსნელად.

ძირითადი მოსაზრებაა:

ჩაანაცვლებენ Copilot-ს? შესაძლოა.

აქვს Cursor-ს თავდაცვითი ზღუდე? ნამდვილად არ არის ღრმა.

არის Claude Code საბოლოო ფორმა? რა თქმა უნდა, არა.

მაგრამ ეს ყველაფერი არ არის მნიშვნელოვანი.

მნიშვნელოვანია: რამდენი დივიდენდის მიღება შეგიძლიათ მათგან, სანამ ისინი „მოკვდებიან“?

ახლა Claude Opus 4.6 და GPT-5.3 Codex მოვიდნენ, იგივე კითხვაა:

ჩაანაცვლებენ ამ ორ მოდელს? აუცილებლად.

არის ისინი ხელოვნური ინტელექტის საბოლოო ფორმა? რა თქმა უნდა, არა.

მაგრამ სანამ მათ ჩაანაცვლებენ?

ზოგი Cowork-ს გამოიყენებს დიზაინის დოკუმენტების ეფექტურობის 10-ჯერ გასაუმჯობესებლად.

ზოგი Claude Excel-ში გამოიყენებს მონაცემთა ანალიზის დროის ერთი დღიდან ერთ საათამდე შესამცირებლად.

ზოგი GPT-5.3 Codex-ის ინტერაქტიული თანამშრომლობით ერთ კვირაში სრულ SaaS-ს შექმნის.

თქვენ კი? ისევ „უკეთესი ხელსაწყოს“ გამოჩენას ელოდებით?

🎯 ჩემი არჩევანის რეკომენდაცია

დიზაინის წინადადებების, პროდუქტის პრეზენტაციების, მონაცემთა ანალიზის გაკეთება → Claude Opus 4.6

👉 Cowork + Excel/PowerPoint ინტეგრაცია, უფრო მოსახერხებელი საოფისე სცენარებისთვის

პროტოტიპების შემუშავება, კოდის წერა, გამართვა → GPT-5.3 Codex

👉 ძლიერი ტერმინალის შესაძლებლობები, კარგი ინტერაქციის გამოცდილება, სწრაფი სიჩქარე

ორივეს გამოყენება → ეს არის ჩემი არჩევანი

👉 Claude-ს გამოყენება წინასწარი კვლევისა და დოკუმენტაციისთვის, GPT-ს გამოყენება შემდგომი განვითარებისა და გამართვისთვის

ასევე არის რეალური მოსაზრება: GPT უფრო სტაბილურია ჩინეთში გამოსაყენებლად.

არჩევანის რეკომენდაცია

💰 ფასი

Claude Opus 4.6

შეყვანა: $5 / მილიონი ტოკენი გამოტანა: $25 / მილიონი ტოკენი 200 000 ტოკენზე მეტი კონტექსტი: $10 / $37.50

GPT-5.3 Codex

API ფასი ჯერ არ გამოცხადებულა ამჟამად ხელმისაწვდომია ChatGPT Plus/Pro გამოწერით

✨ ბოლოს დასაწერი

ამ განახლებამ ყველაზე დიდი შთაბეჭდილება მოახდინა არა შეფასებების გაუმჯობესებამ, არამედ ხელოვნური ინტელექტის მუშაობის მეთოდის ცვლილებამ.

Claude იწყებს თქვენი ფაილური სისტემის პირდაპირ მართვას.

GPT იწყებს თქვენთან საუბარს მუშაობის პროცესში.

ხელოვნური ინტელექტი იწყებს საკუთარ განვითარებაში მონაწილეობას.

ერთი წლის წინ ჩვენ ვმსჯელობდით, შეეძლო თუ არა ხელოვნურ ინტელექტს კოდის წერა.

ახლა ჩვენ ვმსჯელობთ, შეუძლია თუ არა ხელოვნურ ინტელექტს დამოუკიდებლად პროექტის დასრულება.

კიდევ ერთ წელიწადში?

მე არ ვიცი პასუხი.

მაგრამ ერთი რამ ვიცი: მათ, ვინც ხელოვნური ინტელექტის ხელსაწყოებით ფული გამოიმუშავეს, არ იცოდნენ, რომ ეს ხელსაწყოები ჩანაცვლდებოდა.

მათ უბრალოდ გააცნობიერეს: მომავალში მოკვდება თუ არა, ახლა თუ გამოსადეგია, გამოვიყენოთ.როდესაც "გაერკვევი", მოგება უკვე გადანაწილდება.