AI กับความท้าทายของภาษาไทย จากเหตุการณ์ Gemini ลิมิตการแปลภาษาอื่น (ชั่วคราว)

มีนาคม 9, 2024

Written by

Wirat Suptaweewut

สารบัญ

สวัสดีครับทุกคน แคร์ดิจิตัลอยากมาคุยกันเรื่อง AI กันหน่อยครับเพราะในช่วงไม่กี่เดือนที่ผ่านมานี้ เราก็ได้ลองทดสอบ AI เองหลายตัวเลยทีเดียว ต้องบอกว่าในช่วงไม่กี่ปีที่ผ่านมา ปัญญาประดิษฐ์หรือ AI นั้นได้ก้าวหน้าไปอย่างก้าวกระโดดมาก โมเดลอย่าง GPT-4, Claude 3 และ Gemini Advanced 1.5 (ณ เวลาที่เขียนคอนเทนต์นี้) ต่างก็แสดงให้เห็นถึงความสามารถที่น่าทึ่งในการสร้างคำตอบและตอบสนองเรื่องยาก ๆ ที่คุณถามไปได้ แต่มันยังมีสิ่งหนึ่งที่ติดใจเราอยู่ครับ ถึงแม้ Localization หรือการโต้ตอบภาษาไทยเนี่ย ใน Gemini กับ Claude 3 จะสุดยอดมาก ๆ

แต่มันก็ยังไม่สมบูรณ์แบบซะทีเดียว คืออ่านแล้วยังแปลก ๆ ไม่เหมือนคนจริงอยู่ ต้องบอกว่า AI ยังคงเจอกับความท้าทายที่ไม่ธรรมดาสำหรับภาษาปราบเซียนอย่างภาษาไทย (รวมถึงภาษาอื่น ๆ) รวมไปถึงปัญหาใหญ่ที่เราเจอจาก Gemini ซึ่งบางคนอาจจะสังเกตเห็นในช่วงที่ผ่านมาคือ ปฏิเสธการแปลเป็นภาษาไทยโดยสิ้นเชิงเลย! ในบทความนี้ เราจะมาดูกันว่าตอนนี้ AI ในการประมวลผลภาษาไทยเป็นยังไง มีอุปสรรคอะไรบ้างที่ยังทำให้มันไม่สมบูรณ์ แล้วจะทิศทางต่อไปของการ Localization ภาษาจะเป็นอย่างไรจากการคาดการณ์

สถานการณ์ปัจจุบันของ AI กับภาษาไทย (และภาษาอื่น ๆ)

ต้องบอกว่าโมเดล AI กับภาษาอังกฤษนี่ทำได้แทบจะสมบูรณ์แบบเลยครับ แต่พอมาเจอกับภาษาไทยแล้ว โมเดลอย่าง Claude 3 และ Gemini Advanced ก็ให้ผลลัพธ์ที่น่าประทับใจมาก ๆ ในการสร้างและแปลข้อความภาษาไทย เรียกว่าพัฒนาจาก GPT-4 ขึ้นเยอะมากจนแทบจะโต้ตอบได้แบบไหลลื่นแล้ว

แต่คนไทยแท้ ๆ อย่างเรา ๆ อ่านแล้วก็ยังสังเกตเห็นความผิดปกติบางอย่างในผลลัพธ์ได้อยู่ดี ณ ตอนนี้ ข้อความที่ AI สร้างขึ้นมานั้นอาจเรียกได้ว่าใช้ได้เลยซัก 90% ได้เลยมั้ง ซึ่งก็บ่งบอกว่ายังมีจุดที่ต้องปรับปรุงอีกหลายอย่างก่อนจะเอาไปใช้งานจริง ๆ ได้อย่างเนียน ๆ (เรียกว่าไม่ได้เติมน้ำร้อนแล้วพร้อมทานเลย) ในขณะที่เรายอมรับเลยว่า Claude 3 ใช้งานภาษาไทยได้ดีมาก ๆ แต่เราก็ยังสามารถบอกได้ว่าอันไหน AI หากทำ Blind Test จริง ๆ เหตุผลอาจเป็นเพราะสาเหตุต่อไปนี้

ทำไมภาษาไทยถึงท้าทาย AI ขนาดนี้ล่ะ?

เหตุผลหลัก ๆ ที่ AI มีปัญหากับการประมวลผลภาษาไทยก็คือ โครงสร้างเฉพาะของภาษาไทยนั่นเองครับ สำหรับภาษาอังกฤษด้วยการที่คำแยกจากกันด้วยเว้นวรรค มันทำให้ง่ายต่อการแยกคำและบริบทครับ จนถึงตอนนี้ที่เทคโนโลยีก้าวล้ำสุด ๆ มุก ‘แปลภาษาด้วย Google Translate มาหรือเปล่า’ ก็ยังอยู่ถึง 2024 เลยครับ มันแสดงให้เห็นถึงปัญหาด้านการแปลภาษาที่ยังไงก็สู้คนแปลไม่ได้เพราะความซับซ้อนนี่แหละ

พอเป็นภาษาไทย ประโยคที่เราใช้กันมันติดกันยาวเหยียดไปหมดแบบไม่มีช่องว่างให้หายใจเลยแม้แต่นิดเดียว สิ่งนี้เลยทำให้โมเดล AI ปวดหัวมากเลยครับว่าจะตีความและสร้างข้อความภาษาไทยยังไงดี ความซับซ้อนแบบนี้ไม่ได้มีแค่ภาษาไทยหรอกนะ ภาษาอื่น ๆ ที่มีลักษณะคล้าย ๆ กันก็เจอปัญหาแบบเดียวกันเลยล่ะครับ คุณลองคิดภาพฝรั่งที่ใช้ภาษาอังกฤษที่มีเว้นวรรคมาทั้งชีวิต มาเรียนภาษาไทยทีต้องหงายหลังกับความติดกันเป็นพืชจนเขาชอบแซวภาษาในเอเชียว่าเป็นเส้นก๋วยเตี๋ยว หรือเส้นมาม่านั่นเอง

ปัญหาที่ตามมา: การกำกับดูแล AI และการแบนเนื้อหา

เมื่อไม่นานมานี้ Gemini เพิ่งอัพเดตอะไรบางอย่างแบบเงียบ ๆ (Google ไม่ได้ประกาศออกมาครับ แต่มีทีมงานเราใช้อยู่แล้วสังเกตทันพอดี) อัพเดทที่ว่าไปบล็อกการแสดงผลกับการแปลภาษาไทยไปเลยแบบอ้อมยังไงก็ไม่ย้อมแปลให้ ทั้งการป้อนว่าเป็นคนไทยก็แล้ว หรือแปลเพื่อการศึกษาเฉย ๆ ก็ยังไม่ยอม (ก่อนหน้านี้คือมีการแบนภาษาไทยบ้าง แต่ยังพอใส่ Prompt อ้อม ๆ ได้) ซึ่งคาดว่ามาจากการที่ทุกฝ่ายต้องการควบคุมดูแล AI (AI Regulation) ไม่ให้ลามเป็น Skynet ยึดครองโลกนี่แหละครับ (อาจจะไม่ถึงขั้นนั้น แต่ AI ก็มีการตอบกลับเป็นเนื้อหาที่ไม่ควรหลายอย่าง)

แต่การจำกัดขนาดนี้มันส่งผลกระทบกับคำตอบที่ไม่ได้ละเอียดอ่อนอะไรเลย เรียกว่าบล็อคภาษาเลยก็ได้ครับ เลยทำให้ผู้ใช้อย่างเรา ๆ ลำบากไปด้วยแทนที่จะได้ใช้ AI เพื่อจุดประสงค์ที่ถูกต้อง ซึ่งตอนนี้ดูเหมือนว่าจะกลับมาเป็นปกติแล้ว แต่ไม่มีอะไรการันตีได้ว่าจำไม่เกิดเหตุการณ์แบบนี้ขึ้นอีกในอนาคตเมื่อมีการพบคอนเทนต์ที่ไม่เหมาะสมในเน็ตแล้วผู้พัฒนาก็ต้องมาไล่แบน มันจึงเป็นกรณีศึกษาที่ดีให้เราพร้อมรับมือครับ

ทำไมถึงไม่แบนคำหรือเนื้อหาเฉพาะ แต่กลับแบนทั้งภาษาเลย?

ถึงแม้ว่าตอนนี้จะกลับเป็นปกติแล้ว (แต่เราพบว่าด้วย Prompt เดิม การสร้างภาษาไทยดูเก่งน้อยลงไปครับ) เราสามารถพอสันนิษฐานได้ครับว่าเกิดจากความยากของภาษาไทยที่ตัว AI เข้าใจได้ยากนี่แหละ เวลาที่เราป้อนภาษาไทยเข้าไป การจะตีความว่าเนื้อหา Sensitive หรือไม่ AIไม่สามารถฟันธงแบบ 100% เหมือนคนเราได้ครับ ทั้งประโยคและบริบทมันยากเหลือเกิน การตั้งแบนเกือบทั้งหมดของภาษานั้นดูจะง่ายกว่าเยอะ ซึ่งสิ่งนี้ไม่ได้เกิดเฉพาะภาษาไทยนะครับ

ผู้ใช้ Reddit คนนึงต้องการแปลภาษาละตินเพื่อการศึกษา ก็ยังโดนปฏิเสธไม่ยอมแปลให้เลยครับ ถึงแม้จะชี้แจงว่าเพื่อการศึกษาและไม่มีเนื้อหาอะไรไม่ดี ก็ไม่ยอมหยวน ๆ ให้เลยเจ้า AI (คอมเม้นท์ต้นทางบอกว่า แน่ล่ะ ภาษาละตินคือภาษาที่ใช้เรียกปิศาจนี่นา ฮ่าๆ) งั้นทางออกที่ผู้นำเทรนด์ AI ทุกคนสรุปมาคือ การเทรนให้ AI เพื่อใช้ในภาษานั้นเฉพาะน่าจะเป็นทางออก (Localized AI Training)

การฝึก AI แบบ Localized จะช่วยได้มั้ย?

วิธีแก้ปัญหาที่น่าสนใจสำหรับความท้าทายในการประมวลผลภาษาไทยก็คือ การทำ Localization นั่นเอง บริษัทในบ้านเราอย่าง SCB10x ก็กำลังฝึกโมเดล AI โดยใช้ข้อมูลภาษาไทยโดยเฉพาะเลยชื่อโครงการว่า Typhoon ซึ่งพวกเขาบอกว่าโมเดลนี้มีแนวโน้มที่จะทำได้ดีเทียบเท่ากับ GPT-3.5 เลยทีเดียว! เป็นเรื่องดีมาก ๆ ที่เราควรสนับสนุนครับ แต่การฝึก AI แบบ Localization มันก็มีความท้าทายของมันเองเช่นกันครับ

ดาบสองคมของการฝึก AI เฉพาะภาษา

ใช่ครับ การฝึกโมเดล AI น่ะมันกินทรัพยากรและงบประมาณแบบลากเลือดเลย แต่ทรัพยากรที่ดูจะขาดทุนที่สุดในอุตสาหกรรมนี่คือ ‘เวลา’ ครับ กว่าจะฝึกเสร็จ โมเดลใหม่ ๆ ที่เจ๋งกว่าก็ออกมาเพียบ ยกตัวอย่างเช่น GPT-4 นี่มีมาตั้งแต่มีนาคม 2023 (หรือปีที่แล้วนี่เอง) และในช่วงแค่ปีเดียว เราก็ได้เห็น Gemini Advanced 1.5 และ Claude 3 ที่เหนือชั้นกว่า GPT-4 แบบหลายเท่าตัวมาก ๆ ทั้งในแง่ความสามารถและความฉลาดเลยล่ะ เทคโนโลยี AI มันพัฒนาไวยิ่งกว่าอุตสาหกรรมไหน ๆ บริษัทต่าง ๆ เลยลังเลที่จะลงทุนไปกับการฝึกแบบ Localized เพราะกลัวว่ากว่าที่เราฝึกมันจะเสร็จออกมา เราก็ตามหลังไปเยอะเลยครับและมีแนวโน้มว่า User ก็อาจจะไปใช้ตัวใหม่ ๆ มากกว่าแล้ว

สำหรับความเห็นของเรา ถ้า GPT-3.5 ออกมาแล้วสามารถใช้ภาษาไทยได้เก่งพอ ๆ กับเราเลย ผมว่า Use Case มันก็ยังใช้อะไรได้อีกเยอะมากในทางธุรกิจ ด้วยความท้าทายของ AI ในการทำ Localization ภาษาไทยนี่มันซับซ้อนและหลากหลายมิติมาก ๆ ถึงแม้ว่าโมเดลอย่าง Claude 3 และ Gemini Advanced 1.5 จะก้าวหน้าไปมากแล้ว แต่ก็ยังมีช่องว่างอีกเยอะให้ปรับปรุง โดยเฉพาะเวลาต้องรับมือกับภาษาที่มีโครงสร้างซับซ้อนอย่างภาษาไทย การฝึก AI แบบ Localized อาจจะเป็นหนึ่งในคำตอบนะ เราต้องมาดู Real World Test กันอีกทีนึงครับ

แล้วสรุปว่ายังไงต่อดีล่ะกับการฝึกภาษาเจ้า AI?

บริษัทต่าง ๆ ที่ลงทุนก็ต้องมานั่งคิดให้ดี ๆ ทุกรอบเพราะ AI มันวิวัฒนาการไปเร็วมาก ๆ คุณคิดภาพว่า ระหว่างการใช้ GPT-4 กับ Claude 3 Opus เป็นตัวตั้งต้นในการเทรนภาษาไทยโดยเฉพาะ พอทำสำเร็จออกมา Claude 3 Opus ย่อมทำอะไรได้มากกว่าหลายเท่าตัวเลย อัพเดต: GPT4o ถือว่าทำได้ดีเลยครับ แต่เราก็ยังประทับใจ Claude มากกว่าในด้านภาษาไทย

ตอนนี้เรากำลังเดินทางในเส้นทางที่ไม่คุ้นเคยและเปลี่ยนแปลงไวที่สุดเท่าที่มนุษยชาติเคยเจอเลยครับ สิ่งสำคัญคือเราต้องคำนึงถึงประโยชน์ต่อสังคมของการทำ Localization AI ควบคู่ไปกับผลกระทบด้านธุรกิจด้วย แล้วคุณล่ะครับ คิดว่าอนาคตของ AI กับภาษาไทยจะเป็นยังไง? และเราจะหาจุดสมดุลระหว่างการAI กับธุรกิจ รวมไปถึงการควบคุม AI ได้ยังไง?

แชร์คอนเทนต์ให้ทุกคนได้อ่าน