Bryt ut ur Nvidias ekosystem: OpenAI släpper ny programmeringsmodell GPT-5.3-Codex-Spark, hastighet upp till 1000 tokens per sekund
Bryt ut ur Nvidias ekosystem: OpenAI släpper ny programmeringsmodell GPT-5.3-Codex-Spark, hastighet upp till 1000 tokens per sekund

Nyligen släppte OpenAI en ny programmeringsmodell som körs på ett chip stort som en tallrik och kan spotta ut över 1000 tokens per sekund.

Dess namn är GPT-5.3-Codex-Spark, och detta är första gången OpenAI helt bryter sig ut ur Nvidias ekosystem och distribuerar en programmeringsmodell på egenutvecklad hårdvara.
Kärnparametrar

- Inferenshastighet: 1000+ tokens/sekund
- Latens: Första token-latensen är bara 50ms
- Effektförbrukning: Cirka 100W (motsvarar en glödlampa)
- Programmeringsförmåga: Fokuserar på kodgenerering och förståelse
Hårdvaruarkitektur

Detta chip använder en helt ny arkitekturdesign, speciellt optimerad för Transformer-modellinferens. Jämfört med traditionella GPU:er förbättras effektiviteten avsevärt vid hantering av autoregressiva genereringsuppgifter.
Prestandajämförelse

Jämfört med liknande modeller visar GPT-5.3-Codex-Spark en fantastisk hastighetsfördel i kodgenereringsuppgifter, samtidigt som den bibehåller hög kodkvalitet.
Användningsscenarier

- Kodkomplettering i realtid
- Intelligent kodgranskning
- Automatiserad testgenerering
- Kodrefaktoriseringsförslag
Betydelse

Detta markerar att OpenAI officiellt går in i en konkurrensfas med mjuk- och hårdvaruintegration. Att inte längre vara beroende av Nvidias GPU:er innebär lägre kostnader, högre effektivitet och fullständig kontroll över leveranskedjan.
För utvecklare betyder det att AI-programmeringsassistenter kommer att bli snabbare, billigare och mer utbredda.





