Claude Opus 4.6 + GPT-5.3 Codex: เวิร์กโฟลว์แบบสองโมเดลของฉัน ประสิทธิภาพเพิ่มขึ้นโดยตรงเป็นสองเท่า

เพื่อนๆ ที่อดนอนรอการเปิดตัวโมเดลใหม่ตอนเช้ามืด สบายดีกันไหม?

Anthropic และ OpenAI เปิดตัวโมเดลเรือธงของตนเองในวันเดียวกัน วงเพื่อนเต็มไปด้วยการเปรียบเทียบผลการทดสอบต่างๆ

แต่วันนี้ฉันไม่อยากคุยเรื่องผลการทดสอบ

สิ่งที่ฉันอยากคุยคือ: การอัปเดตครั้งนี้ คุณจะได้อะไรจากมัน?

เวิร์กโฟลว์การทำงานร่วมกันแบบสองโมเดล 🔥 เริ่มจากรายละเอียดที่ทำให้ฉันขนลุก

ในบล็อกอย่างเป็นทางการของ OpenAI มีประโยคหนึ่งว่า:

"GPT-5.3-Codex เป็นโมเดลแรกของเราที่มีบทบาทสำคัญในการสร้างตัวเอง"

หมายความว่าอย่างไร?

ทีมงานของ OpenAI ใช้ Codex เวอร์ชันก่อนหน้าในการดีบักกระบวนการฝึกอบรม จัดการการปรับใช้ และวิเคราะห์ผลการทดสอบในระหว่างการพัฒนา GPT-5.3

พวกเขาเองก็บอกว่า "รู้สึกตกใจกับความสามารถของ Codex ในการเร่งการพัฒนาของตัวเอง"

AI เริ่มมีส่วนร่วมในการพัฒนาของตัวเองแล้ว

สิ่งนี้ทำให้ฉันนึกถึงบทความเกี่ยวกับเหมาไถที่ฉันเขียนไว้ก่อนหน้านี้ ตอนนั้นฉันบอกว่า: "ไม่ว่ามันจะตายในอนาคตหรือไม่ ตอนนี้ใช้งานได้ ก็ใช้ไปก่อน"

ตอนนี้ฉันอยากจะบอกว่า: ความเร็วในการวิวัฒนาการของ AI อาจเร็วกว่าที่เราคิด

รอให้คุณ "คิดให้รอบคอบ" ก่อนลงมือทำ อาจจะสายเกินไปแล้ว

💜 Claude Opus 4.6: ไม่ใช่แค่ฉลาดขึ้น แต่ช่วยคุณทำงานได้จริง

การอัปเดตครั้งนี้ของ Anthropic ชื่อบล็อกอย่างเป็นทางการน่าสนใจมาก: "Advancing finance with Claude Opus 4.6"

พวกเขาปรับปรุงเป็นพิเศษสำหรับอุตสาหกรรมการเงิน แต่อย่าเพิ่งเลื่อนผ่าน ความสามารถเหล่านี้มีประโยชน์สำหรับเราเช่นกัน

🔧 Cowork: ในที่สุดก็สามารถจัดการไฟล์ในเครื่องได้โดยตรง

นี่คือฟังก์ชันที่ฉันตั้งตารอมากที่สุด

เมื่อก่อนใช้ Claude คุณต้องคัดลอกและวางเนื้อหาไฟล์เข้าไป

ตอนนี้ด้วย Cowork คุณสามารถให้ Claude เข้าถึงโฟลเดอร์ใดโฟลเดอร์หนึ่งในคอมพิวเตอร์ของคุณได้โดยตรง มันสามารถอ่าน แก้ไข หรือแม้แต่สร้างไฟล์ใหม่ได้

ลองนึกภาพ: คุณให้โฟลเดอร์แบบร่างการออกแบบแก่เขา ให้เขาช่วยคุณจัดระเบียบมาตรฐานการตั้งชื่อ สร้างเอกสารการออกแบบ หรือแม้แต่ประมวลผลรูปภาพเป็นชุด

นี่ไม่ใช่เรื่องของอนาคต แต่เป็นฟังก์ชันที่ใช้งานได้ในปัจจุบัน

ฟังก์ชัน Cowork

📊 Claude in Excel และ PowerPoint

Anthropic ใส่ Claude ลงในแถบด้านข้างของ Excel และ PowerPoint โดยตรง

CTO ของ Hebbia กล่าวว่า: "เมื่อก่อนการทำ PPT ทางการเงินต้องใช้เวลาหลายชั่วโมง ตอนนี้ใช้เวลาเพียงไม่กี่นาที"

นี่เป็นข่าวดีสำหรับเราที่ทำรายงานผลิตภัณฑ์และข้อเสนอการออกแบบ

ผู้ร่วมก่อตั้ง Shortcut AI กล่าวว่า: "การก้าวกระโดดของประสิทธิภาพของ Opus 4.6 นั้นแทบไม่น่าเชื่อ งานที่ Opus 4.5 เคยรู้สึกว่ายาก ตอนนี้กลับกลายเป็นเรื่องง่าย"

📈 ผลการทดสอบในสาขาการเงิน

ข้อมูลอย่างเป็นทางการ:

การประเมิน Finance Agent: 60.7% (เพิ่มขึ้น 5.47% เมื่อเทียบกับ Opus 4.5)

TaxEval: 76.0%

การประเมิน Real-World Finance: เพิ่มขึ้น 23 เปอร์เซ็นต์เมื่อเทียบกับ Sonnet 4.5

ตัวเลขเหล่านี้บ่งบอกอะไร? Claude แข็งแกร่งขึ้นจริง ๆ ในการจัดการงานที่ซับซ้อนซึ่งต้องใช้การให้เหตุผลหลายขั้นตอน

💚 GPT-5.3 Codex: วิธีการโต้ตอบเปลี่ยนไป นี่คือประเด็นสำคัญ

⚡ ความเร็วเพิ่มขึ้น 25% แต่สิ่งที่สำคัญกว่าคือวิธีการโต้ตอบเปลี่ยนไป

เมื่อก่อนใช้ Codex คุณต้องรอให้มันทำงานเสร็จก่อนจึงจะเห็นผลลัพธ์ ต้องการเปลี่ยนทิศทาง? หยุดแล้วเริ่มใหม่

ตอนนี้ไม่เหมือนเดิมแล้ว

GPT-5.3 Codex จะรายงานความคืบหน้าขณะทำงาน คุณสามารถแทรกแซง ถามคำถาม และปรับทิศทางได้ตลอดเวลา โดยไม่สูญเสียบริบท

วิธีการโต้ตอบนี้เหมือนกับการทำงานร่วมกับเพื่อนร่วมงานจริง ๆ มากกว่า

การเปรียบเทียบวิธีการโต้ตอบ

🌐 การปรับปรุงความสามารถในการพัฒนาเว็บไซต์

เจ้าหน้าที่ได้แสดงตัวอย่าง: ให้ GPT-5.3 Codex และ GPT-5.2 Codex สร้างหน้า Landing Page ของ SaaS

เวอร์ชันของ GPT-5.3:

✅ แปลงราคาปีเป็นราคาเฉลี่ยต่อเดือนโดยอัตโนมัติ ทำให้ส่วนลดชัดเจนขึ้น

✅ สร้างคอมโพเนนต์รีวิวผู้ใช้แบบหมุนอัตโนมัติ โดยมีรีวิวที่แตกต่างกันสามรายการ

✅ โดยรวมแล้วเหมือนผลิตภัณฑ์ที่สามารถเปิดตัวได้โดยตรง

เวอร์ชันของ GPT-5.2 ค่อนข้างเรียบง่ายและต้องมีการปรับด้วยตนเองมากขึ้น

การปรับปรุงความสามารถในการ "ทำความเข้าใจความตั้งใจของผู้ใช้" นี้มีประโยชน์มากสำหรับเราที่ทำต้นแบบและ Demo

🔐 ความปลอดภัยทางไซเบอร์: โมเดลแรกที่ถูกระบุว่าเป็น "ความสามารถสูง"

ข้อมูลนี้หลายคนไม่ได้สังเกต

GPT-5.3 Codex เป็นโมเดลแรกของ OpenAI ที่ถูกจัดประเภทเป็นโมเดล "ความสามารถสูง" ในงานด้านความปลอดภัยทางไซเบอร์

พวกเขาเปิดตัวโครงการ Trusted Access for Cyber โดยเฉพาะ และยังสัญญาว่าจะลงทุน API มูลค่า 10 ล้านดอลลาร์เพื่อสนับสนุนการวิจัยด้านการป้องกันความปลอดภัยทางไซเบอร์

ขอบเขตความสามารถของ AI กำลังขยายตัวอย่างรวดเร็ว

📊 การเปรียบเทียบผลการทดสอบ: แต่ละคนมีจุดแข็งของตัวเอง

Terminal-Bench 2.0 (ความสามารถในการเขียนโปรแกรม Terminal)

GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 อัตราการปรับปรุง: 13.3 เปอร์เซ็นต์

OSWorld-Verified (ความสามารถในการใช้งานคอมพิวเตอร์)

GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 อัตราการปรับปรุง: 26.5 เปอร์เซ็นต์

โดยรวมแล้ว GPT-5.3 Codex มีการปรับปรุงอย่างมากในด้านการใช้งาน Terminal และความสามารถในการใช้งานคอมพิวเตอร์

การเปรียบเทียบผลการทดสอบ

🍺 ตรรกะของเหมาไถ: ก่อนที่พวกมันจะ "ตาย" คุณจะได้อะไร?

เมื่อไม่นานมานี้ ฉันได้เขียนบทความโดยใช้ตรรกะของ Duan Yongping ในการซื้อเหมาไถเพื่ออธิบายคุณค่าของเครื่องมือ AI

ประเด็นสำคัญคือ:

Copilot จะถูกแทนที่หรือไม่? อาจจะ

Cursor มีปราการหรือไม่? ไม่ลึกจริง ๆ

Claude Code เป็นรูปแบบสุดท้ายหรือไม่? ไม่แน่นอน

แต่สิ่งเหล่านี้ไม่สำคัญ

สิ่งที่สำคัญคือ: ก่อนที่พวกมันจะ "ตาย" คุณจะได้รับผลประโยชน์มากแค่ไหน?

ตอนนี้ Claude Opus 4.6 และ GPT-5.3 Codex มาแล้ว คำถามเดียวกัน:

โมเดลทั้งสองนี้จะถูกแทนที่หรือไม่? แน่นอน

พวกมันเป็นรูปแบบสุดท้ายของ AI หรือไม่? แน่นอนว่าไม่ใช่

แต่ก่อนที่พวกมันจะถูกแทนที่ล่ะ?

บางคนจะใช้ Cowork เพื่อปรับปรุงประสิทธิภาพของเอกสารการออกแบบให้ดีขึ้น 10 เท่า

บางคนจะใช้ Claude in Excel เพื่อลดเวลาในการวิเคราะห์ข้อมูลจากหนึ่งวันเหลือหนึ่งชั่วโมง

บางคนจะใช้การทำงานร่วมกันแบบโต้ตอบของ GPT-5.3 Codex เพื่อสร้าง SaaS ที่สมบูรณ์ในหนึ่งสัปดาห์

แล้วคุณล่ะ? ยังรอให้ "เครื่องมือที่ดีกว่า" ออกมาอยู่หรือเปล่า?

🎯 คำแนะนำในการเลือกของฉัน

ทำข้อเสนอการออกแบบ รายงานผลิตภัณฑ์ การวิเคราะห์ข้อมูล → Claude Opus 4.6

👉 การรวม Cowork + Excel/PowerPoint เป็นมิตรกับสถานการณ์สำนักงานมากขึ้น

ทำต้นแบบ พัฒนา เขียนโค้ด ดีบัก → GPT-5.3 Codex

👉 ความสามารถของ Terminal แข็งแกร่ง ประสบการณ์การโต้ตอบดี ความเร็วสูง

ใช้ทั้งสองอย่าง → นี่คือตัวเลือกของฉัน

👉 Claude ทำการวิจัยและเอกสารเบื้องต้น GPT ทำการพัฒนาและดีบักในภายหลัง

อีกประเด็นที่ต้องพิจารณาคือ: GPT มีเสถียรภาพในการใช้งานในประเทศจีนมากกว่า

คำแนะนำในการเลือก

💰 ราคา

Claude Opus 4.6

อินพุต: $5 / ล้านโทเค็น เอาต์พุต: $25 / ล้านโทเค็น บริบทมากกว่า 200,000 โทเค็น: $10 / $37.50

GPT-5.3 Codex

ยังไม่ได้ประกาศราคา API ปัจจุบันใช้งานผ่านการสมัครสมาชิก ChatGPT Plus/Pro

✨ เขียนส่งท้าย

สิ่งที่ฉันรู้สึกมากที่สุดจากการอัปเดตครั้งนี้ ไม่ใช่ผลการทดสอบที่ปรับปรุงขึ้นมากเท่าไหร่ แต่เป็นวิธีการทำงานของ AI ที่กำลังเปลี่ยนไป

Claude เริ่มจัดการระบบไฟล์ของคุณโดยตรง

GPT เริ่มสนทนากับคุณขณะทำงาน

AI เริ่มมีส่วนร่วมในการพัฒนาของตัวเอง

เมื่อหนึ่งปีที่แล้ว เรายังถกเถียงกันว่า AI สามารถเขียนโค้ดได้หรือไม่

ตอนนี้เรากำลังถกเถียงกันว่า AI สามารถทำโครงการให้เสร็จสมบูรณ์ได้ด้วยตัวเองหรือไม่

อีกหนึ่งปีต่อมาล่ะ?

ฉันไม่รู้คำตอบ

แต่ฉันรู้สิ่งหนึ่ง: คนที่หาเงินได้จากเครื่องมือ AI ไม่ใช่ว่าพวกเขาไม่รู้ว่าเครื่องมือเหล่านี้จะถูกแทนที่

พวกเขาแค่คิดออกว่า: ไม่ว่ามันจะตายในอนาคตหรือไม่ ตอนนี้ใช้งานได้ ก็ใช้ไปก่อนรอให้คุณ "คิดให้ดี" เสียก่อน โอกาสทองก็ถูกแบ่งปันไปหมดแล้ว

Claude Opus 4.6 + GPT-5.3 Codex: เวิร์กโฟลว์แบบสองโมเดลของฉัน ประสิทธิภาพเพิ่มขึ้นโดยตรงเป็นสองเท่า

💜 Claude Opus 4.6: ไม่ใช่แค่ฉลาดขึ้น แต่ช่วยคุณทำงานได้จริง

🔧 Cowork: ในที่สุดก็สามารถจัดการไฟล์ในเครื่องได้โดยตรง

📊 Claude in Excel และ PowerPoint

📈 ผลการทดสอบในสาขาการเงิน

💚 GPT-5.3 Codex: วิธีการโต้ตอบเปลี่ยนไป นี่คือประเด็นสำคัญ

⚡ ความเร็วเพิ่มขึ้น 25% แต่สิ่งที่สำคัญกว่าคือวิธีการโต้ตอบเปลี่ยนไป

🌐 การปรับปรุงความสามารถในการพัฒนาเว็บไซต์

🔐 ความปลอดภัยทางไซเบอร์: โมเดลแรกที่ถูกระบุว่าเป็น "ความสามารถสูง"

📊 การเปรียบเทียบผลการทดสอบ: แต่ละคนมีจุดแข็งของตัวเอง

🍺 ตรรกะของเหมาไถ: ก่อนที่พวกมันจะ "ตาย" คุณจะได้อะไร?

🎯 คำแนะนำในการเลือกของฉัน

💰 ราคา

✨ เขียนส่งท้าย

You Might Also Like

Claude Code Buddy แก้ไขคู่มือ: วิธีการรับสัตว์เลี้ยงระดับตำนานที่เปล่งประกาย

Obsidian เปิดตัว Defuddle ยกระดับ Obsidian Web Clipper สู่ระดับใหม่

OpenAI突然宣布"三合一"：浏览器+编程+ChatGPT合并，内部承认过去一年走错了

2026，不再逼自己"自律"！做好这8件小事，健康自然来

แม่ๆ ที่พยายามลดน้ำหนักแต่ไม่สำเร็จ แน่นอนว่าต้องเจอปัญหานี้

AI Browser 24 ชั่วโมงการทำงานที่เสถียร