Claude Opus 4.6 + GPT-5.3 Codex: Mój przepływ pracy z dwoma modelami, wydajność wzrosła dwukrotnie
Przyjaciele, którzy zarywali noce, czekając na premierę nowych modeli, wszystko z wami w porządku?
Anthropic i OpenAI tego samego dnia opublikowały swoje flagowe modele. Krąg znajomych został już zalany różnymi porównaniami wyników.
Ale dzisiaj nie chcę rozmawiać o wynikach.
Chcę porozmawiać o tym: co możesz zyskać dzięki tej aktualizacji?
🔥 Najpierw szczegół, który przyprawił mnie o dreszcze
W oficjalnym blogu OpenAI jest zdanie:
„GPT-5.3-Codex to nasz pierwszy model, który odegrał ważną rolę w procesie tworzenia samego siebie.”
Co to znaczy?
Zespół OpenAI podczas opracowywania GPT-5.3 używał wczesnych wersji Codex do debugowania procesu uczenia, zarządzania wdrażaniem i analizowania wyników testów.
Sami przyznają, że są „zszokowani tym, jak Codex może przyspieszyć ich własny rozwój”.
AI zaczyna uczestniczyć w swoim własnym rozwoju.
To przypomniało mi artykuł o Moutai, który napisałem wcześniej. Wtedy powiedziałem: „Nieważne, czy umrze w przyszłości, jeśli można go używać teraz, to zacznijmy go używać.”
Teraz chcę powiedzieć: tempo ewolucji AI może być szybsze, niż nam się wydaje.
Jeśli poczekasz, aż „wszystko sobie przemyślisz”, może być już za późno.
💜 Claude Opus 4.6: Nie jest mądrzejszy, naprawdę może ci pomóc w pracy
Anthropic tym razem ma bardzo interesujący tytuł na oficjalnym blogu: „Rozwój finansów dzięki Claude Opus 4.6”.
Specjalnie zoptymalizowali go dla branży finansowej. Ale nie spiesz się z przewijaniem, te możliwości są również przydatne dla nas.
🔧 Cowork: Wreszcie możesz bezpośrednio obsługiwać pliki lokalne
To funkcja, na którą czekałem najbardziej.
Wcześniej, używając Claude, musiałeś kopiować i wklejać zawartość pliku.
Dzięki Cowork możesz pozwolić Claude bezpośrednio uzyskać dostęp do folderu na twoim komputerze, może odczytywać, edytować, a nawet tworzyć nowe pliki.
Wyobraź sobie: dajesz mu folder ze szkicami projektów, pozwalasz mu uporządkować standardy nazewnictwa, wygenerować dokumentację projektową, a nawet przetwarzać obrazy wsadowo.
To nie jest przyszłość, to funkcja, której można używać już teraz.

📊 Claude w Excelu i PowerPoint
Anthropic umieścił Claude bezpośrednio na pasku bocznym Excela i PowerPointa.
CTO Hebbia powiedział: „Wcześniej tworzenie prezentacji finansowych zajmowało kilka godzin, teraz zajmuje to kilka minut”.
To po prostu błogosławieństwo dla nas, którzy robimy prezentacje produktów i propozycje projektowe.
Współzałożyciel Shortcut AI powiedział: „Skok wydajności Opus 4.6 jest prawie niewiarygodny. Zadania, które Opus 4.5 uważał za trudne, nagle stały się łatwe”.
📈 Wyniki w dziedzinie finansów
Dane oficjalne:
Ocena Finance Agent: 60,7% (wzrost o 5,47% w porównaniu z Opus 4.5)
TaxEval: 76,0%
Ocena Real-World Finance: wzrost o 23 punkty procentowe w porównaniu z Sonnet 4.5
Co oznaczają te liczby? Claude naprawdę stał się silniejszy w przetwarzaniu złożonych zadań, które wymagają wieloetapowego rozumowania.
💚 GPT-5.3 Codex: Zmienił się sposób interakcji, to jest najważniejsze
⚡ Przyspieszenie o 25%, ale ważniejszy jest zmieniony sposób interakcji
Wcześniej, używając Codex, musiałeś czekać, aż skończy działać, aby zobaczyć wyniki. Chcesz zmienić kierunek? Zatrzymaj i zacznij od nowa.
Teraz jest inaczej.
GPT-5.3 Codex będzie raportował postępy podczas pracy, możesz w każdej chwili wtrącić się, zadawać pytania i dostosowywać kierunek, bez utraty kontekstu.
Ten sposób interakcji bardziej przypomina współpracę z prawdziwym kolegą.

🌐 Poprawa możliwości tworzenia stron internetowych
Oficjalnie pokazano przykład: pozwól GPT-5.3 Codex i GPT-5.2 Codex zrobić stronę docelową SaaS.
Wersja GPT-5.3:
✅ Automatycznie przelicza cenę roczną na średnią cenę miesięczną, dzięki czemu rabat jest bardziej intuicyjny
✅ Stworzył automatycznie obracający się komponent opinii użytkowników, z trzema różnymi opiniami
✅ Ogólnie bardziej przypomina produkt, który można bezpośrednio uruchomić
Wersja GPT-5.2 jest stosunkowo prosta i wymaga więcej ręcznej regulacji.
Ta poprawa „rozumienia intencji użytkownika” jest bardzo przydatna dla nas, którzy tworzymy prototypy i dema.
🔐 Bezpieczeństwo sieci: pierwszy model oznaczony jako „wysokiej klasy”
Wiele osób nie zauważyło tej informacji.
GPT-5.3 Codex to pierwszy model OpenAI, który został sklasyfikowany jako „High capability” w zadaniach związanych z bezpieczeństwem sieci.
Specjalnie uruchomili program Trusted Access for Cyber i obiecali zainwestować 10 milionów dolarów w kredyty API, aby wspierać badania nad obroną cybernetyczną.
Granice możliwości AI szybko się rozszerzają.
📊 Porównanie wyników: każdy ma swoje mocne strony
Terminal-Bench 2.0 (możliwości programowania terminala)
GPT-5.3 Codex: 77,3% GPT-5.2 Codex: 64,0% 📈 Wzrost: 13,3 punktu procentowego
OSWorld-Verified (możliwość obsługi komputera)
GPT-5.3 Codex: 64,7% GPT-5.2 Codex: 38,2% 📈 Wzrost: 26,5 punktu procentowego
Ogólnie rzecz biorąc, GPT-5.3 Codex znacznie poprawił możliwości obsługi terminala i komputera.

🍺 Logika Moutai: Co możesz zyskać, zanim „umrą”?
Jakiś czas temu napisałem artykuł, w którym użyłem logiki Duana Yongpinga dotyczącej kupowania Moutai, aby wyjaśnić wartość narzędzi AI.
Kluczowy punkt widzenia to:
Czy Copilot zostanie zastąpiony? Prawdopodobnie.
Czy Cursor ma fosę? Rzeczywiście nie jest głęboka.
Czy Claude Code to ostateczna forma? Na pewno nie.
Ale to wszystko nie ma znaczenia.
Najważniejsze jest: ile korzyści możesz zyskać, zanim „umrą”?
Teraz nadchodzą Claude Opus 4.6 i GPT-5.3 Codex, to samo pytanie:
Czy te dwa modele zostaną zastąpione? Na pewno.
Czy są ostateczną formą AI? Oczywiście, że nie.
Ale co zanim zostaną zastąpione?
Ktoś użyje Cowork, aby zwiększyć wydajność dokumentacji projektowej 10-krotnie.
Ktoś użyje Claude w Excelu, aby skrócić czas analizy danych z jednego dnia do jednej godziny.
Ktoś użyje interaktywnej współpracy GPT-5.3 Codex, aby w tydzień stworzyć kompletny SaaS.
A ty? Nadal czekasz na „lepsze narzędzie”?
🎯 Moje sugestie dotyczące wyboru
Tworzenie propozycji projektowych, prezentacji produktów, analizy danych → Claude Opus 4.6
👉 Integracja Cowork + Excel/PowerPoint, bardziej przyjazna dla scenariuszy biurowych
Tworzenie prototypów, pisanie kodu, debugowanie → GPT-5.3 Codex
👉 Silne możliwości terminala, dobre wrażenia z interakcji, szybkość
Używaj obu → To mój wybór
👉 Claude do wstępnych badań i dokumentacji, GPT do późniejszego rozwoju i debugowania
Jest jeszcze realne rozważenie: GPT jest bardziej stabilny w użyciu w Chinach.

💰 Cena
Claude Opus 4.6
Wprowadzanie: 5 USD / milion tokenów Wyjście: 25 USD / milion tokenów Ponad 200 000 tokenów kontekstu: 10 USD / 37,50 USD
GPT-5.3 Codex
Cena API nie została jeszcze ogłoszona Obecnie używana za pośrednictwem subskrypcji ChatGPT Plus/Pro
✨ Na koniec
To, co najbardziej odczułem po tej aktualizacji, to nie to, o ile wzrosły wyniki, ale to, że zmienia się sposób pracy AI.
Claude zaczyna bezpośrednio obsługiwać twój system plików.
GPT zaczyna rozmawiać z tobą podczas pracy.
AI zaczyna uczestniczyć w swoim własnym rozwoju.
Rok temu dyskutowaliśmy o tym, czy AI może pisać kod.
Teraz dyskutujemy o tym, czy AI może samodzielnie ukończyć projekt.
Co będzie za rok?
Nie znam odpowiedzi.
Ale wiem jedno: ci, którzy zarabiają pieniądze za pomocą narzędzi AI, nie są nieświadomi, że te narzędzia zostaną zastąpione.
Po prostu zrozumieli: nieważne, czy umrze w przyszłości, jeśli można go używać teraz, to zacznijmy go używać.Czekając, aż "się zastanowisz", premie zostaną już rozdane.





