
AI Voice Agent คือเอเจนต์ที่ประมวลผลกระบวนการต่างๆ ตั้งแต่การถอดความเสียงเป็นข้อความ (STT) การใช้ LLM เพื่อทำความเข้าใจเจตนาและสร้างคำตอบ ไปจนถึงการสังเคราะห์เสียงเพื่อตอบกลับ (TTS) โดยทั้งหมดนี้ดำเนินการในลักษณะที่ให้ความรู้สึกใกล้เคียงกับเวลาจริง (Real-time) ในบทความนี้ เราจะสรุปกลไก การเลือก Stack และขั้นตอนการนำ AI เสียงไปใช้สำหรับบริษัทที่ขยายธุรกิจเข้าสู่ประเทศลาว เพื่อนำไปประยุกต์ใช้ในคอลเซ็นเตอร์ งานหน้างาน และการรับ-ส่งคำสั่งซื้อ เนื่องจากภาษาลาวถูกจัดว่าเป็นภาษาที่มีทรัพยากรน้อย (Low-resource language) ในระดับสากล การใช้สมมติฐานเดียวกับภาษาอังกฤษจึงอาจนำไปสู่ความล้มเหลวได้ จากประสบการณ์ที่เราได้มีส่วนร่วมในโครงการ AI เสียงในประเทศลาว เราจะนำเสนอโครงสร้างที่ใช้งานได้จริงและข้อควรระวัง โดยผสมผสานมุมมองจากหน้างานจริงมาให้ทราบ
ก่อนอื่น เรามาทำความเข้าใจกันก่อนว่า Voice AI Agent คืออะไร และการพัฒนาด้วยภาษาลาวมีความแตกต่างจากภาษาอังกฤษอย่างไร หากเห็นภาพรวมของกลไกการทำงานแล้ว จะช่วยให้การตัดสินใจในขั้นตอนการคัดเลือกและการนำไปใช้งานจริงรวดเร็วยิ่งขึ้น
โดยทั่วไปแล้ว ภายในของ Voice AI Agent จะแบ่งออกเป็น 3 เลเยอร์ ดังนี้:
ในปัจจุบัน เริ่มมีโมเดลแบบ "Voice-native" เช่น OpenAI Realtime API และ Gemini Live ที่รวมกระบวนการ STT → LLM → TTS ไว้ใน API เดียวกัน โมเดลเหล่านี้มีค่าความหน่วง (Latency) ต่ำ ทำให้สามารถสร้างประสบการณ์การสนทนาที่ใกล้เคียงกับมนุษย์ได้ง่ายขึ้น อย่างไรก็ตาม เนื่องจากมีข้อจำกัดด้านภาษาที่รองรับ ต้นทุน และความสามารถในการปรับแต่ง (Customizability) ที่แตกต่างจากโครงสร้าง 3 เลเยอร์แบบเดิม จึงจำเป็นต้องเลือกใช้ให้เหมาะสมกับกรณีการใช้งาน (Use case)
ภาษาลาวมีจำนวนผู้พูดทั่วโลกอยู่ที่ประมาณ 7 ล้านคน ซึ่งถือว่าน้อยกว่าภาษาอังกฤษ ภาษาจีน และภาษาสเปนอย่างมหาศาล ส่งผลกระทบต่อเกือบทุกชั้นของโครงสร้าง AI ด้านเสียง (Voice AI Stack) ดังนี้:
กล่าวคือ หากนำโครงสร้าง Voice AI ที่ทำงานได้ดีในภาษาอังกฤษมาปรับใช้กับภาษาลาวโดยตรง ประสบการณ์การใช้งานจริงของผู้ใช้จะมีความแม่นยำลดลงอย่างมาก ดังนั้น เมื่อบริษัทของเราเริ่มพัฒนาเวอร์ชันภาษาลาว เราจึงไม่เคยตั้งสมมติฐานว่า "ถ้าทำงานได้ในภาษาอังกฤษ ก็จะทำงานได้ในภาษาลาวด้วย" แต่เราได้วางกรอบการประเมินโดยตั้งอยู่บนพื้นฐานของภาษาที่มีทรัพยากรน้อย (Low-resource language) และออกแบบการดำเนินงานที่รวมเอา HITL (Human-in-the-loop) เข้าไว้ด้วยตั้งแต่ต้น
การนำ AI เสียงภาษาลาวไปใช้งานจริงจะมุ่งเน้นไปที่งานภาคสนามซึ่งการใช้ข้อความแชททำได้ยาก โดยจะขอนำเสนอ 3 สถานการณ์ตัวอย่างที่สำคัญ ดังนี้
ศูนย์บริการข้อมูลของบริษัทญี่ปุ่นที่เข้ามาดำเนินธุรกิจในลาวมีการสลับภาษาที่ใช้ตามคู่สนทนา โดยเป็นเรื่องปกติที่จะใช้ภาษาไทยหรือภาษาอังกฤษกับผู้บริหารภายในบริษัท ใช้ภาษาลาวกับพนักงานหน้างาน (Operator) และผู้ใช้งานปลายทาง (End user) และใช้ภาษาญี่ปุ่นในการติดต่อกับสำนักงานใหญ่
การจัดหาพนักงานที่เป็นมนุษย์ให้รองรับได้หลายภาษานั้นทำได้ยากทั้งในด้านการสรรหาและการฝึกอบรม การนำระบบ Voice AI มาใช้เป็นจุดรับสายด่านแรกจึงเป็นแนวทางที่สมเหตุสมผล โดยระบบจะทำหน้าที่คัดกรองภาษาที่โทรเข้ามาโดยอัตโนมัติ หากเป็นการสอบถามข้อมูลทั่วไป AI จะเป็นผู้ตอบ แต่หากเป็นเนื้อหาที่ซับซ้อน ระบบจะโอนสายไปยังพนักงานที่เป็นมนุษย์ซึ่งสามารถรองรับได้
หัวใจสำคัญในการนำระบบมาใช้มี 3 ประการ ได้แก่ (a) ความแม่นยำในการจดจำภาษาลาวต้องเพียงพอต่อการใช้งานในเชิงธุรกิจ (b) การตั้งค่าเกณฑ์การตัดสินภาษาอัตโนมัติให้ต่ำไว้ก่อน เพื่อให้ระบบ "โอนสายให้มนุษย์หากไม่แน่ใจ" และ (c) การบันทึกเสียงและถอดความไว้เสมอ พร้อมตรวจสอบบันทึก (Log) ทุกสัปดาห์เพื่อนำไปปรับปรุง ทั้งนี้ แทนที่จะมุ่งหวังความเป็นอัตโนมัติเต็มรูปแบบตั้งแต่ต้น การตั้ง KPI ที่เป็นจริงได้ เช่น "ลดภาระของพนักงานที่เป็นมนุษย์ลง 30%" จะช่วยให้โครงการดำเนินต่อไปได้อย่างยั่งยืน
ในหน้างานที่ต้องใช้มือทั้งสองข้างตลอดเวลา เช่น โรงงาน คลังสินค้าโลจิสติกส์ หรือไซต์งานก่อสร้าง การป้อนข้อมูลผ่านคีย์บอร์ดบนแท็บเล็ตหรือ PC นั้นไม่สามารถใช้งานได้จริง หากสามารถสอบถามสต็อก รายงานการทำงาน และแจ้งเหตุขัดข้องได้ด้วยเสียง จะช่วยให้ผลิตภาพ (Productivity) ในหน้างานเปลี่ยนไปอย่างเห็นได้ชัด
ควรเริ่มต้นจากสถานการณ์ง่ายๆ เช่น "เมื่ออ่านหมายเลขสต็อก AI จะตรวจสอบระบบคลังสินค้าและแจ้งจำนวนคงเหลือกลับมาด้วยเสียง" หรือ "เมื่อพูดคำสำคัญว่างานเสร็จสิ้น ระบบจะบันทึกว่างานเสร็จสมบูรณ์" การเน้นไปที่รูปแบบ "วลีที่กำหนด → การประมวลผลที่กำหนด" จะจัดการได้ง่ายกว่าทั้งในด้านความแม่นยำและภาระในการดำเนินงาน เมื่อเทียบกับการโต้ตอบที่ซับซ้อน
การเลือกชุดหูฟัง (Headset) หรือสมาร์ทโฟนสำหรับใช้งานในองค์กรก็เป็นปัจจัยชี้ขาดความสำเร็จเช่นกัน ในหน้างานที่มีเสียงดัง ความแม่นยำในการจดจำเสียงจะเปลี่ยนไปอย่างมาก ขึ้นอยู่กับว่าไมโครโฟนมีฟังก์ชันตัดเสียงรบกวน (Noise Cancelling) หรือไม่ สำหรับในลาว เนื่องจากสภาพอากาศที่ร้อนจัดในฤดูร้อนซึ่งอาจทำให้อุปกรณ์มีอุณหภูมิสูงขึ้น จึงจำเป็นต้องตรวจสอบความทนทานและความเสถียรของการสื่อสารผ่านการทดสอบนำร่อง (Pilot) ก่อนเสมอ
ในประเทศลาว การสั่งซื้อสินค้าและสอบถามข้อมูลผ่านโทรศัพท์พื้นฐานหรือการโทรผ่าน WhatsApp ยังคงมีอยู่มาก การเปลี่ยนไปใช้ Web form ทั้งหมดอาจไม่สมเหตุสมผลนักเมื่อพิจารณาจากทักษะทางดิจิทัลและพฤติกรรมของลูกค้า
การนำระบบ Voice IVR มาผสมผสานกับ AI จะช่วยให้สามารถสร้างโครงสร้างการทำงานได้ดังนี้: (a) ระบบตอบรับอัตโนมัติเพื่อตอบคำถามทั่วไป เช่น สต็อกสินค้า เวลาทำการ หรือที่ตั้งร้านค้าได้ตลอด 24 ชั่วโมง (b) รับคำสั่งซื้อผ่านเสียงและถอดความเป็นข้อความเพื่อส่งให้เจ้าหน้าที่ผ่าน LINE/WhatsApp และ (c) โอนสายเฉพาะกรณีที่มีความเร่งด่วนสูงให้พนักงานเป็นผู้ดูแล
ความท้าทายในการนำไปใช้งานจริงคือ ความแม่นยำในการจดจำการอ่านตัวเลข (ราคาและจำนวน) ที่เป็นเอกลักษณ์ของภาษาลาว รวมถึงการจัดการกับคำเฉพาะ (ชื่อสินค้า ชื่อสถานที่ และชื่อบุคคล) จึงจำเป็นต้องมีการออกแบบระบบที่ไม่ยอมให้เกิดข้อผิดพลาด เช่น การสร้างพจนานุกรมคำเฉพาะไว้ที่ฝั่ง Gateway และการให้ระบบทวนคำสั่งทุกครั้งเพื่อยืนยันความถูกต้อง
โครงสร้างของ AI เสียงภาษาลาวสามารถแบ่งออกได้เป็น 3 ประเภทหลัก ได้แก่ ระบบ Realtime API, การผสมผสานระหว่าง STT/TTS แบบดั้งเดิม และการโฮสต์ OSS ด้วยตนเอง โดยจะสรุปคุณลักษณะของแต่ละประเภทโดยคำนึงถึงความเป็นจริงของความแม่นยำในภาษาลาว ดังนี้
OpenAI Realtime API และ Gemini Live คือ API ที่รับข้อมูลเสียงแบบสตรีมมิ่งและส่งการตอบกลับจาก LLM กลับมาเป็นเสียงแบบสตรีมมิ่งเช่นกัน ซึ่งมีค่าความหน่วง (Latency) ต่ำ ทำให้สามารถสร้างประสบการณ์การสนทนาที่ใกล้เคียงกับการคุยกับมนุษย์ได้ง่าย
ข้อดีคือความง่ายในการนำไปใช้งาน โดยไม่จำเป็นต้องจัดการการเชื่อมต่อระหว่าง STT, LLM และ TTS ด้วยตนเอง หากใช้ SDK ก็สามารถสร้างเดโมที่ใช้งานได้จริงด้วยโค้ดเพียงไม่กี่ร้อยบรรทัด
อย่างไรก็ตาม สถานะการรองรับภาษาลาวจะขึ้นอยู่กับผู้ให้บริการและช่วงเวลา ดังนั้นก่อนนำไปใช้งานจริง ต้องตรวจสอบภาษาที่รองรับและความแม่นยำในการจดจำเสียงจากเอกสารอย่างเป็นทางการเสมอ ในกรณีที่เป็นภาษาที่ไม่อยู่ในรายการรองรับ ความแม่นยำอาจลดลงอย่างมากเมื่อเจอสำเนียงเฉพาะหรือคำศัพท์เฉพาะทาง สำหรับบริษัทของเรา เมื่อต้องใช้ระบบกลุ่ม Realtime API ในโปรเจกต์ภาษาลาว เราจะทำการประเมินนำร่อง (Pilot evaluation) ด้วยตัวอย่างเสียงที่เป็นตัวแทนของกลุ่มผู้ใช้งานจริงเสมอ
ในการเลือกใช้ STT สำหรับโครงสร้างแบบ 3 ชั้น (3-tier architecture) แบบดั้งเดิม ตัวเลือกที่เป็นตัวแทนหลักคือ Whisper (จาก OpenAI ซึ่งมีเวอร์ชัน OSS ด้วย) และ Google Cloud Speech-to-Text
Whisper เป็นโมเดลที่เรียนรู้หลายภาษาและสามารถรองรับภาษาได้หลากหลาย รวมถึงภาษาลาว เวอร์ชัน OSS สามารถนำไปโฮสต์เองได้ (Self-host) จึงง่ายต่อการนำไปใช้ในหน้างานที่ไม่สามารถนำข้อมูลออกไปภายนอกได้ อย่างไรก็ตาม เมื่อเทียบกับโมเดลเชิงพาณิชย์ที่ได้รับการปรับปรุงมาเพื่อภาษาลาวโดยเฉพาะ อาจมีความแตกต่างในด้านความแม่นยำสำหรับศัพท์เฉพาะทางหรือภาษาถิ่น
Google STT เป็นบริการแบบ Managed Service ที่มีการอัปเดตภาษาที่รองรับและความแม่นยำค่อนข้างรวดเร็ว สถานะการรองรับภาษาลาวจะขึ้นอยู่กับ Region, API Version และ Model Type ดังนั้นเมื่อเลือกใช้งาน จำเป็นต้องตรวจสอบหน้าเว็บไซต์อย่างเป็นทางการที่ระบุภาษาที่รองรับโดยตรง
ไม่ว่าจะเลือกใช้ตัวเลือกใด ควรพิจารณาว่ากลไกการเสริมด้วย Dictionary Hints สำหรับคำศัพท์เฉพาะทางในธุรกิจ (เช่น ชื่อสินค้า หรือคำย่อภายในบริษัท) เป็นสิ่งที่แทบจะขาดไม่ได้สำหรับภาษาลาว
การสังเคราะห์เสียง (TTS) ภาษาลาวอาจไม่ได้ให้เสียงที่ดูเป็นธรรมชาติเท่ากับภาษาอังกฤษ ในการนำไปใช้งานควรคำนึงถึงสิ่งต่อไปนี้:
ในทางปฏิบัติ แทนที่จะมุ่งเน้นความสมบูรณ์แบบของเสียง TTS การตั้งเป้าหมายว่า "วลีที่จำเป็นต่อการทำงานสามารถเล่นได้อย่างเสถียรและมีคุณภาพที่ฟังเข้าใจ" จะเป็นแนวทางที่นำไปสู่ทางออกที่สมเหตุสมผลมากกว่า เนื่องจากข้อความยาวๆ มักจะฟังดูไม่เป็นธรรมชาติเมื่ออ่านรวดเดียว การปรับแต่งด้วยวิธีต่างๆ เช่น การแบ่งข้อความตอบกลับให้เป็นประโยคสั้นๆ หรือการใช้เสียงบันทึกจริงสำหรับประโยคที่เป็นรูปแบบตายตัว (Fixed phrases) จึงเป็นวิธีที่มีประสิทธิภาพเช่นกัน

เมื่อพูดคุยเรื่อง AI เสียงภาษาลาวภายในบริษัท มักจะถูกตั้งสมมติฐานว่า "ก็ทำงานด้วยภาษาอังกฤษได้อยู่แล้วไม่ใช่หรือ?" หรือ "แค่ LLM ฉลาดก็เพียงพอแล้วไม่ใช่หรือ?" ซึ่งทั้งสองอย่างนี้เป็นความเข้าใจผิดที่อันตรายและจำเป็นต้องแก้ไขให้ชัดเจนตั้งแต่ต้น
เดโม AI เสียงภาษาอังกฤษมีความแม่นยำเพิ่มขึ้นทุกปี จนถึงระดับที่แทบแยกไม่ออกจากการสนทนาของมนุษย์ อย่างไรก็ตาม ความแม่นยำดังกล่าวไม่สามารถนำมาประยุกต์ใช้กับภาษาลาวได้โดยตรง
เหตุผลง่ายๆ คือ ปริมาณข้อมูลที่ใช้เรียนรู้ (Training Data) นั้นแตกต่างกันอย่างมหาศาล แม้จะเป็นสถาปัตยกรรมโมเดลเดียวกัน ในกรณีที่ภาษาอังกฤษให้ความแม่นยำในการจดจำสูง แต่สำหรับภาษาลาวมักจะได้ค่าที่ต่ำกว่าอย่างเห็นได้ชัด (ตัวเลขที่แน่ชัดขึ้นอยู่กับโมเดล ผู้พูด และหัวข้อสนทนา จึงจำเป็นต้องมีการประเมินด้วยข้อมูลของบริษัทเองผ่านการทำ Pilot เสมอ)
การจะลดช่องว่างนี้จำเป็นต้องอาศัยการปรับแต่งหลายอย่างร่วมกัน เช่น (a) การใส่พจนานุกรม/คำศัพท์เฉพาะทาง (Hotwords) ที่เกี่ยวข้องกับธุรกิจลงใน STT, (b) การออกแบบให้ผู้ใช้งานช่วยทวนคำพูด, (c) การให้ LLM แปลงข้อมูลที่กำกวมให้เป็นคำถามเพื่อยืนยันความถูกต้อง การอธิบายภายในบริษัทว่า "ถ้าภาษาอังกฤษใช้งานได้ดี ภาษาลาวก็ต้องทำได้" จะทำให้สูญเสียความเชื่อมั่นทันทีหากเกิดความผิดพลาดหน้างาน การออกแบบโดยตั้งสมมติฐานถึงช่องว่างของความแม่นยำตั้งแต่ต้นจึงเป็นแนวทางที่ปลอดภัยกว่า
มีคำถามเข้ามาบ่อยครั้งว่า "ได้ยินมาว่า LLM รุ่นใหม่ๆ รองรับหลายภาษาได้ดี ดังนั้นแค่เรียกใช้ LLM อย่างเดียวก็สามารถสร้าง AI เสียงได้เลยไม่ใช่หรือ?" ในความเป็นจริงแล้ว LLM เพียงอย่างเดียวไม่สามารถทำให้ระบบ AI เสียงสมบูรณ์ได้
STT ที่แปลงเสียงพูดเป็นข้อความ, TTS ที่แปลงข้อความกลับเป็นเสียง และการเรียกใช้เครื่องมือต่างๆ เพื่อเชื่อมต่อกับระบบธุรกิจ (เช่น การจัดการสต็อก การรับคำสั่งซื้อ และการจัดการลูกค้า) ล้วนเป็นหน้าที่ของส่วนประกอบอื่นที่อยู่นอกเหนือจาก LLM หากเปลี่ยนเพียงแค่ตัว LLM แต่ส่วนประกอบรอบข้างเหล่านี้ยังไม่มีประสิทธิภาพ ประสบการณ์ของผู้ใช้งานก็จะไม่ดีขึ้น
นอกจากนี้ ในการนำ AI มาใช้หน้างานจริง จำเป็นต้องมีการออกแบบโดยตั้งสมมติฐานว่า "ต้องมีมนุษย์เข้ามาแทรกแซงในกรณีที่ LLM ไม่สามารถตอบคำถามได้อย่างถูกต้อง" หากปล่อยให้ LLM รับผิดชอบทั้งหมดโดยไม่มีกระบวนการ HITL (Human-in-the-Loop) อาการหลอน (Hallucination) ของ AI จะกลายเป็นความผิดพลาดในการบริการลูกค้าโดยตรง เมื่อบริษัทของเราเริ่มโปรเจกต์ AI เสียงภาษาลาว เราจะตกลงกันตั้งแต่ต้นเสมอว่าจะต้องวางโครงสร้างการดำเนินงานโดยแบ่งเป็น "5 เลเยอร์ ได้แก่ STT, LLM, TTS, ระบบธุรกิจ และมนุษย์" ไม่ใช่แค่การใช้ LLM เพียงอย่างเดียว

การพัฒนา AI เสียงภาษาลาวจะประสบปัญหาหากใช้วิธีเดียวกับโครงการ AI เสียงภาษาอังกฤษ จากประสบการณ์การดำเนินงานหลายโครงการของบริษัท เราได้สรุปแนวทางที่นำไปสู่ผลลัพธ์ที่มั่นคงออกเป็น 3 ระยะ ดังนี้
หลักการสำคัญของเฟสแรกคือ "ห้ามนำไปใช้งานจริงทันที" โดยเด็ดขาด
ขั้นตอนการดำเนินการมีดังนี้:
ในขั้นตอนนี้ จะเริ่มเห็นช่องว่างของความแม่นยำที่เฉพาะเจาะจงสำหรับภาษาลาว หากได้ข้อสรุปว่า "ยากกว่าที่คาดไว้" นั่นไม่ใช่ความล้มเหลว แต่เป็นข้อมูลที่จะนำไปใช้ในการออกแบบ Phase 2 ต่อไป
จากผลการประเมินใน Phase 1 เราจะเริ่มการใช้งานจริงแบบค่อยเป็นค่อยไป โดยยังไม่มุ่งเน้นไปที่ระบบอัตโนมัติเต็มรูปแบบในขณะนี้
โดยมีรายละเอียดโครงสร้างดังนี้:
สำหรับบริษัทที่ขยายธุรกิจเข้าสู่ประเทศลาว การออกแบบระบบโดยใส่เงื่อนไข "หากค่าต่ำกว่าเกณฑ์ให้ส่งต่อให้มนุษย์" ถือเป็นปัจจัยชี้ขาดอายุการใช้งานของโปรเจกต์ ยิ่งตั้งเป้าหมายไปที่ระบบอัตโนมัติเต็มรูปแบบมากเท่าใด ปัญหาความรับผิดชอบเมื่อเกิดความผิดพลาดหน้างานก็จะยิ่งเพิ่มมากขึ้น และมีโอกาสสูงที่การใช้งานจะถูกระงับไปในที่สุด
เมื่อการดำเนินงานใน Phase 2 มีความเสถียรและสามารถวัดผล KPI ได้แล้ว ก็จะเข้าสู่ขั้นตอนการขยายขอบเขตงานและจำนวนผู้ใช้งาน
สิ่งที่สำคัญในการขยายขนาด (Scale) คือการเตรียมความพร้อมด้านองค์กรมากกว่าด้านเทคนิค
เมื่อมาถึงจุดนี้ ตำแหน่งของ AI เสียงจะเปลี่ยนจาก "PoC เชิงทดลอง" ไปสู่ "โครงสร้างพื้นฐานทางธุรกิจของบริษัทในพื้นที่" หากองค์กรมีความพร้อมในการรับผิดชอบการดำเนินงาน ก็จะเข้าสู่ขั้นตอนที่สามารถเห็นผลตอบแทนจากการลงทุน (ROI) ในระยะยาวได้

สรุปประเด็นสำคัญในการนำ AI Voice Agent ภาษาลาวมาใช้งาน:
จากประสบการณ์ของเรา AI เสียงภาษาลาวจะประสบปัญหาแน่นอนหาก "ดำเนินการด้วยความรู้สึกเดียวกับภาษาอังกฤษ" แต่จะสร้างผลลัพธ์ที่มั่นคงหาก "ออกแบบอย่างระมัดระวังโดยคำนึงถึงข้อจำกัดของภาษาที่มีทรัพยากรต่ำ" สำหรับองค์กรที่ต้องการสร้างให้เป็นโครงสร้างพื้นฐานในการทำงานในพื้นที่ นี่เป็นส่วนที่คุ้มค่าที่จะใช้เวลาในการออกแบบโครงสร้างพื้นฐานและกฎการดำเนินงานตั้งแต่เริ่มต้น
Chi
ศึกษาเอกวิทยาการสารสนเทศที่มหาวิทยาลัยแห่งชาติลาว และระหว่างศึกษาได้มีส่วนร่วมในการพัฒนาซอฟต์แวร์ทางสถิติ สั่งสมพื้นฐานด้านการวิเคราะห์ข้อมูลและการเขียนโปรแกรมอย่างเป็นรูปธรรม ตั้งแต่ปี 2021 ได้ก้าวเข้าสู่เส้นทางการพัฒนา Web และแอปพลิเคชัน และตั้งแต่ปี 2023 เริ่มสั่งสมประสบการณ์การพัฒนาอย่างจริงจังทั้งในด้าน Frontend และ Backend ในบริษัทปัจจุบันรับผิดชอบการออกแบบและพัฒนาบริการ Web ที่ใช้ AI โดยมีส่วนร่วมในโครงการที่นำการประมวลผลภาษาธรรมชาติ (NLP) การเรียนรู้ของเครื่อง (Machine Learning) และ Generative AI รวมถึงโมเดลภาษาขนาดใหญ่ (LLM) มาผสานรวมกับระบบงานจริง มีความกระตือรือร้นในการติดตามเทคโนโลยีล่าสุดอยู่เสมอ และให้ความสำคัญกับความรวดเร็วในการดำเนินงานตั้งแต่การพิสูจน์แนวคิดทางเทคนิคไปจนถึงการนำไปใช้งานจริง