Sortint de l'ecosistema Nvidia: OpenAI llança el nou model de programació GPT-5.3-Codex-Spark, amb una velocitat de 1000 tokens per segon
Sortint de l'ecosistema Nvidia: OpenAI llança el nou model de programació GPT-5.3-Codex-Spark, amb una velocitat de 1000 tokens per segon

Acaba de sortir, OpenAI ha llançat un nou model de programació que s'executa en un xip de la mida d'un plat i pot generar més de 1000 tokens per segon.

El seu nom és GPT-5.3-Codex-Spark, i és la primera vegada que OpenAI surt completament de l'ecosistema Nvidia i desplega un model de programació en maquinari de desenvolupament propi.
Paràmetres principals

- Velocitat d'inferència: 1000+ tokens/segon
- Latència: Només 50 ms de latència per al primer token
- Consum d'energia: Aproximadament 100 W (equivalent a una bombeta)
- Capacitat de programació: Centrat en la generació i comprensió de codi
Arquitectura de maquinari

Aquest xip adopta un disseny d'arquitectura completament nou, optimitzat específicament per a la inferència del model Transformer. En comparació amb les GPU tradicionals, millora significativament l'eficiència en el processament de tasques de generació autoregressiva.
Comparació de rendiment

En comparació amb models similars, GPT-5.3-Codex-Spark mostra una avantatge de velocitat sorprenent en les tasques de generació de codi, alhora que manté una alta qualitat de codi.
Escenaris d'aplicació

- Autocompletat de codi en temps real
- Revisió intel·ligent de codi
- Generació automatitzada de proves
- Suggeriments de refactorització de codi
Significat

Això marca que OpenAI entra oficialment a la fase de competència d'integració de programari i maquinari. Deixar de dependre de les GPU de Nvidia significa costos més baixos, major eficiència i control total de la cadena de subministrament.
Per als desenvolupadors, això significa que els assistents de programació d'IA seran més ràpids, més barats i més estesos.





