सामग्री में जाएं
1 मिनट लाल chain-of-thought

START: सोचने के एक नए तरीके से AI में क्रांति लाना

डिस्कवर स्टार्ट: एआई की एक नई पीढ़ी जो चरणबद्ध सोचती है और समस्या-समाधान टूल का उपयोग करती है जानें कि यह कैसे काम करता है और यह हमारे ग्रह को कैसे प्रभावित करेगा।

 

คุณเคยสงสัยมั้ยครับ ว่าทำไมบางครั้ง AI ถึงตอบคำถามผิดๆ หรือให้ข้อมูลที่ไม่สมเหตุสมผล?

ปัญหานี้กำลังจะหมดไป เพราะนักวิจัยจาก Alibaba และ University of Science and Technology of China ได้พัฒนา AI ตัวใหม่ที่ชื่อว่า START (Self-Taught Reasoner with Tools) หรือแปลเป็นไทยง่ายๆ ว่า "ระบบเรียนรู้การใช้เหตุผลด้วยตนเองพร้อมเครื่องมือ"

START ไม่ใช่แค่ AI ธรรมดา แต่มันเป็น AI ที่คิดเป็นขั้นเป็นตอน และรู้จักใช้เครื่องมือช่วยคิด เหมือนกับที่เราใช้เครื่องคิดเลขหรือโปรแกรมคอมพิวเตอร์ช่วยแก้ปัญหายากๆ นั่นเอง ทำให้ START มีความสามารถในการแก้ปัญหาที่ซับซ้อนได้ดีกว่า AI รุ่นก่อนๆ


START ทำงานอย่างไร? อะไรที่ทำให้ START แตกต่าง

START เป็น AI ที่ต่อยอดมาจากแนวคิด Large Reasoning Models (LRMs) หรือโมเดลภาษาขนาดใหญ่ที่เน้นการใช้เหตุผลเป็นหลัก โดย START มีคุณสมบัติเด่นที่น่าสนใจดังนี้:


กลไกการทำงานของ START 

(เทคนิคหน่อย ข้ามไปได้ครับ)

รูปภาพประกอบการทำงานของ START จากเปเปอร์งานวิจัย

START ทำงานผ่านกระบวนการสำคัญ 2 ขั้นตอน:

  1. Hint-infer:
    • ในขั้นตอนนี้ START จะแทรก "คำใบ้" (hints) เข้าไปในกระบวนการให้เหตุผล เพื่อกระตุ้นให้โมเดลเรียกใช้เครื่องมือภายนอก
    • ตัวอย่างคำใบ้ เช่น "Wait, maybe using Python here is a good idea." ซึ่งจะถูกแทรกเข้าไปหลังคำเชื่อมต่างๆ หรือก่อน stop token 1
  2. Hint Rejection Sampling Fine-Tuning (Hint-RFT):
    • ขั้นตอนนี้จะนำผลลัพธ์จาก Hint-infer มาคัดกรอง ให้คะแนน และปรับแต่ง เพื่อสร้างชุดข้อมูลคุณภาพสูง (Dseed)
    • จากนั้นจะนำ Dseed ไป fine-tune โมเดลพื้นฐาน (QwQ-32B-Preview) เพื่อสร้าง START-0
    • START-0 จะถูกใช้ในการสร้างชุดข้อมูลที่หลากหลายยิ่งขึ้น (DSTART) ซึ่งจะนำไปสู่การ fine-tune ครั้งสุดท้ายเพื่อสร้าง START

START เก่งแค่ไหน? ตัวอย่างความสามารถที่น่าทึ่ง

START ไม่ใช่แค่ "เก่ง" แต่มัน "เก่งมาก" ครับ
ลองดูตัวอย่างความสามารถที่น่าทึ่งของ START กัน

ที่น่าทึ่งไปกว่านั้นคือ START ทำสิ่งเหล่านี้ได้โดยไม่ต้องมีคนคอยบอกทุกขั้นตอน มันรู้จักคิด วิเคราะห์ และแก้ปัญหาด้วยตัวเอง คล้ายกับที่มนุษย์เราทำ 

เก่งขึ้นจนน่าตกใจ (แอบกลัวเบาๆ 😆)


เทคโนโลยีเบื้องหลัง START: QwQ-32B-Preview และ Fine-Tuning

START สร้างขึ้นจากพื้นฐานของโมเดล QwQ-32B-Preview ซึ่งเป็น Large Language Model (LLM) ที่มีประสิทธิภาพสูง และใช้ภาษา Python เป็นเครื่องมือสำคัญในการช่วยคิดและประมวลผลข้อมูล

นอกจากนี้ START ยังใช้กระบวนการ Fine-Tuning แบบสองขั้นตอน (Two-Phase Fine-Tuning) เพื่อปรับแต่งโมเดลให้มีความสามารถในการใช้เหตุผลและการใช้เครื่องมือได้ดียิ่งขึ้น


START จะเปลี่ยนโลกของเราไปอย่างไร? ศักยภาพในการประยุกต์ใช้

START มีศักยภาพในการปฏิวัติและเปลี่ยนแปลงโลกของเราในหลายๆ ด้าน เช่น


อนาคตของ AI ที่ "คิดเป็น" ไม่ใช่แค่ "จำได้"

START ไม่ใช่แค่ AI ธรรมดา แต่เป็นก้าวกระโดดครั้งใหญ่ของวงการเทคโนโลยีปัญญาประดิษฐ์ มันแสดงให้เห็นว่า AI สามารถ "คิดเป็น" ได้จริงๆ ไม่ใช่แค่จำข้อมูลมาตอบ

แม้ว่า START จะยังมีข้อจำกัดบางอย่าง เช่น ความสามารถในการทำงานกับภาษาอื่นๆ นอกเหนือจาก Python

แต่ก็เปิดประตูสู่โลกใหม่ของ AI ที่ฉลาดขึ้น เข้าใจบริบทมากขึ้น และพร้อมที่จะช่วยมนุษย์แก้ปัญหาที่ซับซ้อนยิ่งขึ้นในอนาคต

ใครจะรู้ ในอีกไม่กี่ปีข้างหน้า เราอาจได้เห็น AI ที่สามารถโต้ตอบและให้เหตุผลได้เหมือนมนุษย์จริงๆ ก็เป็นได้

START อาจเป็นจุดเริ่มต้นของการปฏิวัติครั้งใหญ่ในวงการ AI ที่จะเปลี่ยนโลกของเราไปตลอดกาล


शोध पत्रों के साथ चैट करें


แหล่งอ้างอิง