Claude Opus 4.6 + GPT-5.3 Codex: Mój przepływ pracy z dwoma modelami, wydajność wzrosła dwukrotnie

2/13/2026
6 min read

Przyjaciele, którzy zarywali noce, czekając na premierę nowych modeli, wszystko z wami w porządku?

Anthropic i OpenAI tego samego dnia opublikowały swoje flagowe modele. Krąg znajomych został już zalany różnymi porównaniami wyników.

Ale dzisiaj nie chcę rozmawiać o wynikach.

Chcę porozmawiać o tym: co możesz zyskać dzięki tej aktualizacji?

Przepływ pracy oparty na współpracy dwóch modeli🔥 Najpierw szczegół, który przyprawił mnie o dreszcze

W oficjalnym blogu OpenAI jest zdanie:

„GPT-5.3-Codex to nasz pierwszy model, który odegrał ważną rolę w procesie tworzenia samego siebie.”

Co to znaczy?

Zespół OpenAI podczas opracowywania GPT-5.3 używał wczesnych wersji Codex do debugowania procesu uczenia, zarządzania wdrażaniem i analizowania wyników testów.

Sami przyznają, że są „zszokowani tym, jak Codex może przyspieszyć ich własny rozwój”.

AI zaczyna uczestniczyć w swoim własnym rozwoju.

To przypomniało mi artykuł o Moutai, który napisałem wcześniej. Wtedy powiedziałem: „Nieważne, czy umrze w przyszłości, jeśli można go używać teraz, to zacznijmy go używać.”

Teraz chcę powiedzieć: tempo ewolucji AI może być szybsze, niż nam się wydaje.

Jeśli poczekasz, aż „wszystko sobie przemyślisz”, może być już za późno.

💜 Claude Opus 4.6: Nie jest mądrzejszy, naprawdę może ci pomóc w pracy

Anthropic tym razem ma bardzo interesujący tytuł na oficjalnym blogu: „Rozwój finansów dzięki Claude Opus 4.6”.

Specjalnie zoptymalizowali go dla branży finansowej. Ale nie spiesz się z przewijaniem, te możliwości są również przydatne dla nas.

🔧 Cowork: Wreszcie możesz bezpośrednio obsługiwać pliki lokalne

To funkcja, na którą czekałem najbardziej.

Wcześniej, używając Claude, musiałeś kopiować i wklejać zawartość pliku.

Dzięki Cowork możesz pozwolić Claude bezpośrednio uzyskać dostęp do folderu na twoim komputerze, może odczytywać, edytować, a nawet tworzyć nowe pliki.

Wyobraź sobie: dajesz mu folder ze szkicami projektów, pozwalasz mu uporządkować standardy nazewnictwa, wygenerować dokumentację projektową, a nawet przetwarzać obrazy wsadowo.

To nie jest przyszłość, to funkcja, której można używać już teraz.

Funkcja Cowork

📊 Claude w Excelu i PowerPoint

Anthropic umieścił Claude bezpośrednio na pasku bocznym Excela i PowerPointa.

CTO Hebbia powiedział: „Wcześniej tworzenie prezentacji finansowych zajmowało kilka godzin, teraz zajmuje to kilka minut”.

To po prostu błogosławieństwo dla nas, którzy robimy prezentacje produktów i propozycje projektowe.

Współzałożyciel Shortcut AI powiedział: „Skok wydajności Opus 4.6 jest prawie niewiarygodny. Zadania, które Opus 4.5 uważał za trudne, nagle stały się łatwe”.

📈 Wyniki w dziedzinie finansów

Dane oficjalne:

Ocena Finance Agent: 60,7% (wzrost o 5,47% w porównaniu z Opus 4.5)

TaxEval: 76,0%

Ocena Real-World Finance: wzrost o 23 punkty procentowe w porównaniu z Sonnet 4.5

Co oznaczają te liczby? Claude naprawdę stał się silniejszy w przetwarzaniu złożonych zadań, które wymagają wieloetapowego rozumowania.

💚 GPT-5.3 Codex: Zmienił się sposób interakcji, to jest najważniejsze

⚡ Przyspieszenie o 25%, ale ważniejszy jest zmieniony sposób interakcji

Wcześniej, używając Codex, musiałeś czekać, aż skończy działać, aby zobaczyć wyniki. Chcesz zmienić kierunek? Zatrzymaj i zacznij od nowa.

Teraz jest inaczej.

GPT-5.3 Codex będzie raportował postępy podczas pracy, możesz w każdej chwili wtrącić się, zadawać pytania i dostosowywać kierunek, bez utraty kontekstu.

Ten sposób interakcji bardziej przypomina współpracę z prawdziwym kolegą.

Porównanie sposobów interakcji

🌐 Poprawa możliwości tworzenia stron internetowych

Oficjalnie pokazano przykład: pozwól GPT-5.3 Codex i GPT-5.2 Codex zrobić stronę docelową SaaS.

Wersja GPT-5.3:

✅ Automatycznie przelicza cenę roczną na średnią cenę miesięczną, dzięki czemu rabat jest bardziej intuicyjny

✅ Stworzył automatycznie obracający się komponent opinii użytkowników, z trzema różnymi opiniami

✅ Ogólnie bardziej przypomina produkt, który można bezpośrednio uruchomić

Wersja GPT-5.2 jest stosunkowo prosta i wymaga więcej ręcznej regulacji.

Ta poprawa „rozumienia intencji użytkownika” jest bardzo przydatna dla nas, którzy tworzymy prototypy i dema.

🔐 Bezpieczeństwo sieci: pierwszy model oznaczony jako „wysokiej klasy”

Wiele osób nie zauważyło tej informacji.

GPT-5.3 Codex to pierwszy model OpenAI, który został sklasyfikowany jako „High capability” w zadaniach związanych z bezpieczeństwem sieci.

Specjalnie uruchomili program Trusted Access for Cyber i obiecali zainwestować 10 milionów dolarów w kredyty API, aby wspierać badania nad obroną cybernetyczną.

Granice możliwości AI szybko się rozszerzają.

📊 Porównanie wyników: każdy ma swoje mocne strony

Terminal-Bench 2.0 (możliwości programowania terminala)

GPT-5.3 Codex: 77,3% GPT-5.2 Codex: 64,0% 📈 Wzrost: 13,3 punktu procentowego

OSWorld-Verified (możliwość obsługi komputera)

GPT-5.3 Codex: 64,7% GPT-5.2 Codex: 38,2% 📈 Wzrost: 26,5 punktu procentowego

Ogólnie rzecz biorąc, GPT-5.3 Codex znacznie poprawił możliwości obsługi terminala i komputera.

Porównanie wyników

🍺 Logika Moutai: Co możesz zyskać, zanim „umrą”?

Jakiś czas temu napisałem artykuł, w którym użyłem logiki Duana Yongpinga dotyczącej kupowania Moutai, aby wyjaśnić wartość narzędzi AI.

Kluczowy punkt widzenia to:

Czy Copilot zostanie zastąpiony? Prawdopodobnie.

Czy Cursor ma fosę? Rzeczywiście nie jest głęboka.

Czy Claude Code to ostateczna forma? Na pewno nie.

Ale to wszystko nie ma znaczenia.

Najważniejsze jest: ile korzyści możesz zyskać, zanim „umrą”?

Teraz nadchodzą Claude Opus 4.6 i GPT-5.3 Codex, to samo pytanie:

Czy te dwa modele zostaną zastąpione? Na pewno.

Czy są ostateczną formą AI? Oczywiście, że nie.

Ale co zanim zostaną zastąpione?

Ktoś użyje Cowork, aby zwiększyć wydajność dokumentacji projektowej 10-krotnie.

Ktoś użyje Claude w Excelu, aby skrócić czas analizy danych z jednego dnia do jednej godziny.

Ktoś użyje interaktywnej współpracy GPT-5.3 Codex, aby w tydzień stworzyć kompletny SaaS.

A ty? Nadal czekasz na „lepsze narzędzie”?

🎯 Moje sugestie dotyczące wyboru

Tworzenie propozycji projektowych, prezentacji produktów, analizy danych → Claude Opus 4.6

👉 Integracja Cowork + Excel/PowerPoint, bardziej przyjazna dla scenariuszy biurowych

Tworzenie prototypów, pisanie kodu, debugowanie → GPT-5.3 Codex

👉 Silne możliwości terminala, dobre wrażenia z interakcji, szybkość

Używaj obu → To mój wybór

👉 Claude do wstępnych badań i dokumentacji, GPT do późniejszego rozwoju i debugowania

Jest jeszcze realne rozważenie: GPT jest bardziej stabilny w użyciu w Chinach.

Sugestie dotyczące wyboru

💰 Cena

Claude Opus 4.6

Wprowadzanie: 5 USD / milion tokenów Wyjście: 25 USD / milion tokenów Ponad 200 000 tokenów kontekstu: 10 USD / 37,50 USD

GPT-5.3 Codex

Cena API nie została jeszcze ogłoszona Obecnie używana za pośrednictwem subskrypcji ChatGPT Plus/Pro

✨ Na koniec

To, co najbardziej odczułem po tej aktualizacji, to nie to, o ile wzrosły wyniki, ale to, że zmienia się sposób pracy AI.

Claude zaczyna bezpośrednio obsługiwać twój system plików.

GPT zaczyna rozmawiać z tobą podczas pracy.

AI zaczyna uczestniczyć w swoim własnym rozwoju.

Rok temu dyskutowaliśmy o tym, czy AI może pisać kod.

Teraz dyskutujemy o tym, czy AI może samodzielnie ukończyć projekt.

Co będzie za rok?

Nie znam odpowiedzi.

Ale wiem jedno: ci, którzy zarabiają pieniądze za pomocą narzędzi AI, nie są nieświadomi, że te narzędzia zostaną zastąpione.

Po prostu zrozumieli: nieważne, czy umrze w przyszłości, jeśli można go używać teraz, to zacznijmy go używać.Czekając, aż "się zastanowisz", premie zostaną już rozdane.

Published in Technology

You Might Also Like