Claude Opus 4.6 + GPT-5.3 Codex: Mein Dual-Modell-Workflow, Effizienz direkt verdoppelt

2/13/2026
7 min read
Seid ihr noch wach, Freunde, die bis zum Morgengrauen auf die Veröffentlichung neuer Modelle gewartet haben? Anthropic und OpenAI haben am selben Tag ihre jeweiligen Flaggschiffmodelle veröffentlicht. Die Freundeskreise sind bereits mit verschiedenen Benchmark-Vergleichen überschwemmt. Aber ich möchte heute nicht über Benchmarks sprechen. Ich möchte darüber sprechen: Was kannst du aus diesem Update herausholen? ![Dual-Modell-Kollaborations-Workflow](/uploads/wechat-1770803012477-mbo5aba.jpg)**🔥 Zuerst ein Detail, das mir einen Schauer über den Rücken jagt** Im offiziellen Blog von OpenAI steht ein Satz: "GPT-5.3-Codex ist unser erstes Modell, das eine wichtige Rolle bei seiner eigenen Entwicklung spielt." Was bedeutet das? Das OpenAI-Team hat bei der Entwicklung von GPT-5.3 frühe Versionen von Codex verwendet, um den Trainingsprozess zu debuggen, die Bereitstellung zu verwalten und Testergebnisse zu analysieren. Sie selbst sagen, sie seien "schockiert, wie stark Codex die eigene Entwicklung beschleunigen kann". KI beginnt, sich an ihrer eigenen Entwicklung zu beteiligen. Das erinnert mich an den Artikel über Moutai, den ich zuvor geschrieben habe. Damals sagte ich: "Egal, ob es später stirbt oder nicht, wenn es jetzt funktioniert, dann nutze es zuerst." Jetzt möchte ich sagen: Die Geschwindigkeit der KI-Evolution ist möglicherweise schneller als wir denken. Wenn du erst "nachdenkst" und dann handelst, könnte es bereits zu spät sein. ## **💜 Claude Opus 4.6: Nicht intelligenter, sondern wirklich in der Lage, dir bei der Arbeit zu helfen** Der Titel des offiziellen Blogs von Anthropic ist bei diesem Update sehr interessant: "Advancing finance with Claude Opus 4.6". Sie haben es speziell für die Finanzbranche optimiert. Aber beeile dich nicht, wegzuklicken, diese Fähigkeiten sind auch für uns nützlich. ### **🔧 Cowork: Endlich in der Lage, lokale Dateien direkt zu bearbeiten** Das ist die Funktion, auf die ich mich am meisten freue. Früher musstest du bei Claude den Inhalt der Datei kopieren und einfügen. Mit Cowork kannst du Claude jetzt direkt auf einen Ordner auf deinem Computer zugreifen lassen, er kann Dateien lesen, bearbeiten und sogar neue erstellen. Stell dir vor: Du gibst ihm den Ordner mit den Designentwürfen und lässt ihn dir helfen, die Namenskonventionen zu organisieren, Designdokumente zu erstellen oder sogar Bilder stapelweise zu bearbeiten. Das ist nicht die Zukunft, das ist eine Funktion, die jetzt schon genutzt werden kann. ![Cowork Funktion](/uploads/wechat-1770803012533-4nlg630.jpg) ### **📊 Claude in Excel und PowerPoint** Anthropic hat Claude direkt in die Seitenleiste von Excel und PowerPoint integriert. Der CTO von Hebbia sagte: "Früher hat die Erstellung einer Finanz-PPT Stunden gedauert, jetzt dauert es nur noch wenige Minuten." Das ist ein Segen für uns, die wir Produktberichte und Designvorschläge erstellen. Der Mitbegründer von Shortcut AI sagte: "Der Leistungssprung von Opus 4.6 ist fast unglaublich. Aufgaben, die Opus 4.5 früher schwerfielen, sind jetzt plötzlich einfach." ### **📈 Benchmarks im Finanzbereich** Offizielle Daten: Finance Agent Bewertung: 60,7 % (5,47 % Verbesserung gegenüber Opus 4.5) TaxEval: 76,0 % Real-World Finance Bewertung: 23 Prozentpunkte Verbesserung gegenüber Sonnet 4.5 Was bedeuten diese Zahlen? Claude ist in der Lage, komplexe Aufgaben zu bewältigen, die mehrschrittige Schlussfolgerungen erfordern, und ist tatsächlich stärker geworden. ## **💚 GPT-5.3 Codex: Die Art der Interaktion hat sich geändert, das ist der springende Punkt** ### **⚡ 25 % Geschwindigkeitssteigerung, aber wichtiger ist die veränderte Art der Interaktion** Früher musstest du bei Codex warten, bis er fertig war, um die Ergebnisse zu sehen. Wolltest du die Richtung ändern? Anhalten und von vorne beginnen. Jetzt ist es anders. GPT-5.3 Codex berichtet während der Arbeit über den Fortschritt, du kannst jederzeit eingreifen, Fragen stellen und die Richtung anpassen, ohne den Kontext zu verlieren. Diese Art der Interaktion ähnelt eher der Zusammenarbeit mit einem echten Kollegen. ![Vergleich der Interaktionsarten](/uploads/wechat-1770803012589-j1jyxt7.jpg) ### **🌐 Verbesserung der Website-Entwicklungsfähigkeiten** Die offizielle Seite zeigt ein Beispiel: GPT-5.3 Codex und GPT-5.2 Codex sollen jeweils eine SaaS-Landingpage erstellen. Die Version von GPT-5.3: ✅ Wandelt automatisch den Jahrespreis in einen durchschnittlichen Monatspreis um, um den Rabatt deutlicher zu machen ✅ Erstellt eine automatische Karussell-Komponente für Benutzerbewertungen mit drei verschiedenen Bewertungen ✅ Insgesamt ähnelt es eher einem Produkt, das direkt online gehen kann Die Version von GPT-5.2 ist relativ einfach und erfordert mehr manuelle Anpassungen. Diese Verbesserung der Fähigkeit, "Benutzerabsichten zu verstehen", ist für uns, die wir Prototypen und Demos erstellen, sehr nützlich. ### **🔐 Cybersicherheit: Das erste Modell, das als "hochfähig" eingestuft wurde** Diese Information haben viele Leute nicht bemerkt. GPT-5.3 Codex ist das erste Modell von OpenAI, das bei Cybersicherheitsaufgaben als "High capability" eingestuft wurde. Sie haben speziell das Programm Trusted Access for Cyber ins Leben gerufen und versprechen, 10 Millionen Dollar an API-Guthaben zur Unterstützung der Forschung zur Cybersicherheitsabwehr zu investieren. Die Fähigkeitsgrenzen der KI erweitern sich rasant. ## **📊 Benchmark-Vergleich: Jeder hat seine Stärken** Terminal-Bench 2.0 (Terminal-Programmierfähigkeit) GPT-5.3 Codex: 77,3 % GPT-5.2 Codex: 64,0 % 📈 Verbesserung: 13,3 Prozentpunkte OSWorld-Verified (Fähigkeit zur Computerbedienung) GPT-5.3 Codex: 64,7 % GPT-5.2 Codex: 38,2 % 📈 Verbesserung: 26,5 Prozentpunkte Insgesamt hat GPT-5.3 Codex die Terminalbedienung und die Computerbedienung erheblich verbessert. ![Benchmark-Vergleich](/uploads/wechat-1770803012662-thv896y.jpg) ## **🍺 Moutai-Logik: Was kannst du bekommen, bevor sie "sterben"?** Vor einiger Zeit habe ich einen Artikel geschrieben, in dem ich die Logik von Duan Yongping beim Kauf von Moutai verwendet habe, um den Wert von KI-Tools zu erklären. Die Kernaussage ist: Wird Copilot ersetzt werden? Vielleicht. Hat Cursor einen Burggraben? Er ist in der Tat nicht tief. Ist Claude Code die ultimative Form? Sicherlich nicht. Aber das ist alles nicht wichtig. Wichtig ist: Wie viele Dividenden kannst du bekommen, bevor sie "sterben"? Jetzt sind Claude Opus 4.6 und GPT-5.3 Codex da, die gleiche Frage: Werden diese beiden Modelle ersetzt werden? Sicherlich. Sind sie die ultimative Form der KI? Natürlich nicht. Aber was ist, bevor sie ersetzt werden? Manche Leute werden Cowork verwenden, um die Effizienz von Designdokumenten um das Zehnfache zu steigern. Manche Leute werden Claude in Excel verwenden, um die Datenanalysezeit von einem Tag auf eine Stunde zu verkürzen. Manche Leute werden die interaktive Zusammenarbeit von GPT-5.3 Codex nutzen, um in einer Woche ein komplettes SaaS zu erstellen. Und du? Wartest du immer noch auf das "bessere Tool"? ## **🎯 Meine Empfehlungen** Erstellung von Designvorschlägen, Produktberichten, Datenanalysen → Claude Opus 4.6 👉 Cowork + Excel/PowerPoint-Integration, benutzerfreundlicher für Büroszenarien Prototypenentwicklung, Schreiben von Code, Debugging → GPT-5.3 Codex 👉 Starke Terminalfähigkeiten, gute Interaktion, schnell Beide verwenden → Das ist meine Wahl 👉 Claude für Vorabrecherchen und Dokumentation, GPT für spätere Entwicklung und Debugging Es gibt auch eine realistische Überlegung: GPT ist im Inland stabiler zu verwenden. ![Auswahlvorschläge](/uploads/wechat-1770803012714-e9uiquo.jpg) ## **💰 Preis** Claude Opus 4.6 Eingabe: 5 $ / Million Token Ausgabe: 25 $ / Million Token Über 200.000 Token Kontext: 10 $ / 37,50 $ GPT-5.3 Codex Die API-Preise wurden noch nicht bekannt gegeben. Derzeit über ChatGPT Plus/Pro-Abonnement verfügbar ## **✨ Abschließende Bemerkungen** Was mich bei diesem Update am meisten beeindruckt hat, ist nicht die Verbesserung der Benchmarks, sondern die Veränderung der Arbeitsweise der KI. Claude beginnt, dein Dateisystem direkt zu bedienen. GPT beginnt, während der Arbeit mit dir zu sprechen. KI beginnt, sich an ihrer eigenen Entwicklung zu beteiligen. Vor einem Jahr haben wir noch darüber diskutiert, ob KI Code schreiben kann. Jetzt diskutieren wir, ob KI ein Projekt selbstständig abschließen kann. Was ist in einem Jahr? Ich kenne die Antwort nicht. Aber ich weiß eines: Diejenigen, die mit KI-Tools Geld verdienen, wissen nicht, dass diese Tools ersetzt werden. Sie haben nur verstanden: Egal, ob es später stirbt oder nicht, wenn es jetzt funktioniert, dann nutze es zuerst.Wann du "想清楚"的时候,红利已经被瓜分完了。
Published in Technology

You Might Also Like