Claude Opus 4.6 + GPT-5.3 Codex: เวิร์กโฟลว์แบบสองโมเดลของฉัน ประสิทธิภาพเพิ่มขึ้นโดยตรงเป็นสองเท่า
เพื่อนๆ ที่อดนอนรอการเปิดตัวโมเดลใหม่ตอนเช้ามืด สบายดีกันไหม?
Anthropic และ OpenAI เปิดตัวโมเดลเรือธงของตนเองในวันเดียวกัน วงเพื่อนเต็มไปด้วยการเปรียบเทียบผลการทดสอบต่างๆ
แต่วันนี้ฉันไม่อยากคุยเรื่องผลการทดสอบ
สิ่งที่ฉันอยากคุยคือ: การอัปเดตครั้งนี้ คุณจะได้อะไรจากมัน?
🔥 เริ่มจากรายละเอียดที่ทำให้ฉันขนลุก
ในบล็อกอย่างเป็นทางการของ OpenAI มีประโยคหนึ่งว่า:
"GPT-5.3-Codex เป็นโมเดลแรกของเราที่มีบทบาทสำคัญในการสร้างตัวเอง"
หมายความว่าอย่างไร?
ทีมงานของ OpenAI ใช้ Codex เวอร์ชันก่อนหน้าในการดีบักกระบวนการฝึกอบรม จัดการการปรับใช้ และวิเคราะห์ผลการทดสอบในระหว่างการพัฒนา GPT-5.3
พวกเขาเองก็บอกว่า "รู้สึกตกใจกับความสามารถของ Codex ในการเร่งการพัฒนาของตัวเอง"
AI เริ่มมีส่วนร่วมในการพัฒนาของตัวเองแล้ว
สิ่งนี้ทำให้ฉันนึกถึงบทความเกี่ยวกับเหมาไถที่ฉันเขียนไว้ก่อนหน้านี้ ตอนนั้นฉันบอกว่า: "ไม่ว่ามันจะตายในอนาคตหรือไม่ ตอนนี้ใช้งานได้ ก็ใช้ไปก่อน"
ตอนนี้ฉันอยากจะบอกว่า: ความเร็วในการวิวัฒนาการของ AI อาจเร็วกว่าที่เราคิด
รอให้คุณ "คิดให้รอบคอบ" ก่อนลงมือทำ อาจจะสายเกินไปแล้ว
💜 Claude Opus 4.6: ไม่ใช่แค่ฉลาดขึ้น แต่ช่วยคุณทำงานได้จริง
การอัปเดตครั้งนี้ของ Anthropic ชื่อบล็อกอย่างเป็นทางการน่าสนใจมาก: "Advancing finance with Claude Opus 4.6"
พวกเขาปรับปรุงเป็นพิเศษสำหรับอุตสาหกรรมการเงิน แต่อย่าเพิ่งเลื่อนผ่าน ความสามารถเหล่านี้มีประโยชน์สำหรับเราเช่นกัน
🔧 Cowork: ในที่สุดก็สามารถจัดการไฟล์ในเครื่องได้โดยตรง
นี่คือฟังก์ชันที่ฉันตั้งตารอมากที่สุด
เมื่อก่อนใช้ Claude คุณต้องคัดลอกและวางเนื้อหาไฟล์เข้าไป
ตอนนี้ด้วย Cowork คุณสามารถให้ Claude เข้าถึงโฟลเดอร์ใดโฟลเดอร์หนึ่งในคอมพิวเตอร์ของคุณได้โดยตรง มันสามารถอ่าน แก้ไข หรือแม้แต่สร้างไฟล์ใหม่ได้
ลองนึกภาพ: คุณให้โฟลเดอร์แบบร่างการออกแบบแก่เขา ให้เขาช่วยคุณจัดระเบียบมาตรฐานการตั้งชื่อ สร้างเอกสารการออกแบบ หรือแม้แต่ประมวลผลรูปภาพเป็นชุด
นี่ไม่ใช่เรื่องของอนาคต แต่เป็นฟังก์ชันที่ใช้งานได้ในปัจจุบัน

📊 Claude in Excel และ PowerPoint
Anthropic ใส่ Claude ลงในแถบด้านข้างของ Excel และ PowerPoint โดยตรง
CTO ของ Hebbia กล่าวว่า: "เมื่อก่อนการทำ PPT ทางการเงินต้องใช้เวลาหลายชั่วโมง ตอนนี้ใช้เวลาเพียงไม่กี่นาที"
นี่เป็นข่าวดีสำหรับเราที่ทำรายงานผลิตภัณฑ์และข้อเสนอการออกแบบ
ผู้ร่วมก่อตั้ง Shortcut AI กล่าวว่า: "การก้าวกระโดดของประสิทธิภาพของ Opus 4.6 นั้นแทบไม่น่าเชื่อ งานที่ Opus 4.5 เคยรู้สึกว่ายาก ตอนนี้กลับกลายเป็นเรื่องง่าย"
📈 ผลการทดสอบในสาขาการเงิน
ข้อมูลอย่างเป็นทางการ:
การประเมิน Finance Agent: 60.7% (เพิ่มขึ้น 5.47% เมื่อเทียบกับ Opus 4.5)
TaxEval: 76.0%
การประเมิน Real-World Finance: เพิ่มขึ้น 23 เปอร์เซ็นต์เมื่อเทียบกับ Sonnet 4.5
ตัวเลขเหล่านี้บ่งบอกอะไร? Claude แข็งแกร่งขึ้นจริง ๆ ในการจัดการงานที่ซับซ้อนซึ่งต้องใช้การให้เหตุผลหลายขั้นตอน
💚 GPT-5.3 Codex: วิธีการโต้ตอบเปลี่ยนไป นี่คือประเด็นสำคัญ
⚡ ความเร็วเพิ่มขึ้น 25% แต่สิ่งที่สำคัญกว่าคือวิธีการโต้ตอบเปลี่ยนไป
เมื่อก่อนใช้ Codex คุณต้องรอให้มันทำงานเสร็จก่อนจึงจะเห็นผลลัพธ์ ต้องการเปลี่ยนทิศทาง? หยุดแล้วเริ่มใหม่
ตอนนี้ไม่เหมือนเดิมแล้ว
GPT-5.3 Codex จะรายงานความคืบหน้าขณะทำงาน คุณสามารถแทรกแซง ถามคำถาม และปรับทิศทางได้ตลอดเวลา โดยไม่สูญเสียบริบท
วิธีการโต้ตอบนี้เหมือนกับการทำงานร่วมกับเพื่อนร่วมงานจริง ๆ มากกว่า

🌐 การปรับปรุงความสามารถในการพัฒนาเว็บไซต์
เจ้าหน้าที่ได้แสดงตัวอย่าง: ให้ GPT-5.3 Codex และ GPT-5.2 Codex สร้างหน้า Landing Page ของ SaaS
เวอร์ชันของ GPT-5.3:
✅ แปลงราคาปีเป็นราคาเฉลี่ยต่อเดือนโดยอัตโนมัติ ทำให้ส่วนลดชัดเจนขึ้น
✅ สร้างคอมโพเนนต์รีวิวผู้ใช้แบบหมุนอัตโนมัติ โดยมีรีวิวที่แตกต่างกันสามรายการ
✅ โดยรวมแล้วเหมือนผลิตภัณฑ์ที่สามารถเปิดตัวได้โดยตรง
เวอร์ชันของ GPT-5.2 ค่อนข้างเรียบง่ายและต้องมีการปรับด้วยตนเองมากขึ้น
การปรับปรุงความสามารถในการ "ทำความเข้าใจความตั้งใจของผู้ใช้" นี้มีประโยชน์มากสำหรับเราที่ทำต้นแบบและ Demo
🔐 ความปลอดภัยทางไซเบอร์: โมเดลแรกที่ถูกระบุว่าเป็น "ความสามารถสูง"
ข้อมูลนี้หลายคนไม่ได้สังเกต
GPT-5.3 Codex เป็นโมเดลแรกของ OpenAI ที่ถูกจัดประเภทเป็นโมเดล "ความสามารถสูง" ในงานด้านความปลอดภัยทางไซเบอร์
พวกเขาเปิดตัวโครงการ Trusted Access for Cyber โดยเฉพาะ และยังสัญญาว่าจะลงทุน API มูลค่า 10 ล้านดอลลาร์เพื่อสนับสนุนการวิจัยด้านการป้องกันความปลอดภัยทางไซเบอร์
ขอบเขตความสามารถของ AI กำลังขยายตัวอย่างรวดเร็ว
📊 การเปรียบเทียบผลการทดสอบ: แต่ละคนมีจุดแข็งของตัวเอง
Terminal-Bench 2.0 (ความสามารถในการเขียนโปรแกรม Terminal)
GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 อัตราการปรับปรุง: 13.3 เปอร์เซ็นต์
OSWorld-Verified (ความสามารถในการใช้งานคอมพิวเตอร์)
GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 อัตราการปรับปรุง: 26.5 เปอร์เซ็นต์
โดยรวมแล้ว GPT-5.3 Codex มีการปรับปรุงอย่างมากในด้านการใช้งาน Terminal และความสามารถในการใช้งานคอมพิวเตอร์

🍺 ตรรกะของเหมาไถ: ก่อนที่พวกมันจะ "ตาย" คุณจะได้อะไร?
เมื่อไม่นานมานี้ ฉันได้เขียนบทความโดยใช้ตรรกะของ Duan Yongping ในการซื้อเหมาไถเพื่ออธิบายคุณค่าของเครื่องมือ AI
ประเด็นสำคัญคือ:
Copilot จะถูกแทนที่หรือไม่? อาจจะ
Cursor มีปราการหรือไม่? ไม่ลึกจริง ๆ
Claude Code เป็นรูปแบบสุดท้ายหรือไม่? ไม่แน่นอน
แต่สิ่งเหล่านี้ไม่สำคัญ
สิ่งที่สำคัญคือ: ก่อนที่พวกมันจะ "ตาย" คุณจะได้รับผลประโยชน์มากแค่ไหน?
ตอนนี้ Claude Opus 4.6 และ GPT-5.3 Codex มาแล้ว คำถามเดียวกัน:
โมเดลทั้งสองนี้จะถูกแทนที่หรือไม่? แน่นอน
พวกมันเป็นรูปแบบสุดท้ายของ AI หรือไม่? แน่นอนว่าไม่ใช่
แต่ก่อนที่พวกมันจะถูกแทนที่ล่ะ?
บางคนจะใช้ Cowork เพื่อปรับปรุงประสิทธิภาพของเอกสารการออกแบบให้ดีขึ้น 10 เท่า
บางคนจะใช้ Claude in Excel เพื่อลดเวลาในการวิเคราะห์ข้อมูลจากหนึ่งวันเหลือหนึ่งชั่วโมง
บางคนจะใช้การทำงานร่วมกันแบบโต้ตอบของ GPT-5.3 Codex เพื่อสร้าง SaaS ที่สมบูรณ์ในหนึ่งสัปดาห์
แล้วคุณล่ะ? ยังรอให้ "เครื่องมือที่ดีกว่า" ออกมาอยู่หรือเปล่า?
🎯 คำแนะนำในการเลือกของฉัน
ทำข้อเสนอการออกแบบ รายงานผลิตภัณฑ์ การวิเคราะห์ข้อมูล → Claude Opus 4.6
👉 การรวม Cowork + Excel/PowerPoint เป็นมิตรกับสถานการณ์สำนักงานมากขึ้น
ทำต้นแบบ พัฒนา เขียนโค้ด ดีบัก → GPT-5.3 Codex
👉 ความสามารถของ Terminal แข็งแกร่ง ประสบการณ์การโต้ตอบดี ความเร็วสูง
ใช้ทั้งสองอย่าง → นี่คือตัวเลือกของฉัน
👉 Claude ทำการวิจัยและเอกสารเบื้องต้น GPT ทำการพัฒนาและดีบักในภายหลัง
อีกประเด็นที่ต้องพิจารณาคือ: GPT มีเสถียรภาพในการใช้งานในประเทศจีนมากกว่า

💰 ราคา
Claude Opus 4.6
อินพุต: $5 / ล้านโทเค็น เอาต์พุต: $25 / ล้านโทเค็น บริบทมากกว่า 200,000 โทเค็น: $10 / $37.50
GPT-5.3 Codex
ยังไม่ได้ประกาศราคา API ปัจจุบันใช้งานผ่านการสมัครสมาชิก ChatGPT Plus/Pro
✨ เขียนส่งท้าย
สิ่งที่ฉันรู้สึกมากที่สุดจากการอัปเดตครั้งนี้ ไม่ใช่ผลการทดสอบที่ปรับปรุงขึ้นมากเท่าไหร่ แต่เป็นวิธีการทำงานของ AI ที่กำลังเปลี่ยนไป
Claude เริ่มจัดการระบบไฟล์ของคุณโดยตรง
GPT เริ่มสนทนากับคุณขณะทำงาน
AI เริ่มมีส่วนร่วมในการพัฒนาของตัวเอง
เมื่อหนึ่งปีที่แล้ว เรายังถกเถียงกันว่า AI สามารถเขียนโค้ดได้หรือไม่
ตอนนี้เรากำลังถกเถียงกันว่า AI สามารถทำโครงการให้เสร็จสมบูรณ์ได้ด้วยตัวเองหรือไม่
อีกหนึ่งปีต่อมาล่ะ?
ฉันไม่รู้คำตอบ
แต่ฉันรู้สิ่งหนึ่ง: คนที่หาเงินได้จากเครื่องมือ AI ไม่ใช่ว่าพวกเขาไม่รู้ว่าเครื่องมือเหล่านี้จะถูกแทนที่
พวกเขาแค่คิดออกว่า: ไม่ว่ามันจะตายในอนาคตหรือไม่ ตอนนี้ใช้งานได้ ก็ใช้ไปก่อนรอให้คุณ "คิดให้ดี" เสียก่อน โอกาสทองก็ถูกแบ่งปันไปหมดแล้ว





