ทำความรู้จัก "Model Editing" แก้ไขความรู้ LLM โดยไม่ต้องเทรนใหม่

4 มิถุนายน 2569

บทนำ

Model Editing คือเทคโนโลยีที่ใช้แก้ไขความรู้เฉพาะจุดภายในโมเดลภาษาขนาดใหญ่ (LLM) โดยไม่จำเป็นต้องทำการฝึกสอน (Retraining) โมเดลใหม่ จุดเด่นที่สำคัญที่สุดคือความสามารถในการแก้ไขข้อเท็จจริงที่ผิดพลาด ข้อมูลที่ล้าสมัย หรือข้อมูลส่วนบุคคลที่จำเป็นต้องลบออก โดยไม่ต้องสร้างโมเดลขึ้นมาใหม่ทั้งหมด บทความนี้จัดทำขึ้นสำหรับผู้รับผิดชอบและวิศวกรในองค์กรที่กำลังพิจารณาเรื่องธรรมาภิบาล AI และการคุ้มครองข้อมูลส่วนบุคคล โดยจะอธิบายตั้งแต่แนวคิดพื้นฐานของ Model Editing วิธีการที่เป็นตัวแทนของเทคนิคนี้ ความแตกต่างจาก Machine Unlearning ไปจนถึงการประยุกต์ใช้ในทางปฏิบัติสำหรับ PDPA และ "สิทธิในการถูกลืม" (Right to be Forgotten) เมื่ออ่านจบ คุณจะสามารถตัดสินใจได้ว่าควรเลือกใช้เครื่องมือใดในสถานการณ์ใดขององค์กรของคุณ

Model Editing คืออะไร?

หัวใจสำคัญของการแก้ไขโมเดล (Model Editing) ไม่ใช่การเรียนรู้พารามิเตอร์หลายพันล้านตัวใหม่ทั้งหมด แต่เป็นการมุ่งเป้าไปที่การเขียนทับ "น้ำหนักเพียงบางส่วน" ที่รับผิดชอบต่อความรู้นั้นโดยเฉพาะ ก่อนอื่น เรามาทำความเข้าใจความแตกต่างจากการเรียนรู้ใหม่ (Retraining) ความสัมพันธ์กับการปรับจูนละเอียด (Fine-tuning) และเบื้องหลังที่ทำให้เรื่องนี้ได้รับความสนใจตามลำดับกันก่อน

ทำความเข้าใจความแตกต่างจากการเรียนรู้ใหม่ (Retraining)

「โมเดลตอบชื่อบริษัทเก่า」——เมื่อเผชิญกับปัญหานี้ สิ่งแรกที่นึกถึงคงเป็นวิธีการแก้ไขข้อมูลการเรียนรู้แล้วทำการเทรนใหม่ (Retraining) แต่การเทรนโมเดลขนาดใหญ่ใหม่นั้นต้องใช้ทรัพยากรคำนวณ เวลา และบุคลากรผู้เชี่ยวชาญมหาศาล ซึ่งการทำเช่นนั้นเพียงเพื่อแก้ไขข้อเท็จจริงเพียงเรื่องเดียวนั้นไม่สมเหตุสมผล การแก้ไขโมเดล (Model Editing) เข้ามาเปลี่ยนสมมติฐานนี้ โดยการระบุเฉพาะค่าน้ำหนัก (Weights) ที่สอดคล้องกับความรู้ที่ต้องการอัปเดตและเขียนทับเฉพาะส่วนนั้น ทำให้การแก้ไขอาจเสร็จสิ้นภายในเวลาไม่กี่วินาทีถึงไม่กี่นาที หากเปรียบการเทรนใหม่ว่าเป็นการ「พิมพ์ตำราเรียนใหม่ทั้งเล่ม」 การแก้ไขโมเดลก็เปรียบเสมือนการ「แก้ไขข้อความเฉพาะหน้าที่มีปัญหา」 อย่างไรก็ตาม ทั้งสองวิธีไม่ได้แยกขาดจากกัน ในทางปฏิบัติแล้ว การเลือกใช้ให้เหมาะสมคือหากข้อผิดพลาดครอบคลุมเป็นวงกว้างให้ใช้วิธีเทรนใหม่ แต่หากเป็นการแก้ไขข้อเท็จจริงเฉพาะจุดให้ใช้วิธีการแก้ไขโมเดล

ความสัมพันธ์กับ Fine-tuning และ LoRA

แม้ว่า Fine-tuning และ LoRA จะมีความคล้ายคลึงกับ Model Editing ในแง่ของ "การปรับแต่งโมเดลในภายหลัง" แต่มีวัตถุประสงค์และความละเอียดที่แตกต่างกัน Fine-tuning เป็นวิธีการปรับน้ำหนัก (weights) ของโมเดลทั้งหมด (หรือชั้นเลเยอร์ส่วนใหญ่) ด้วยชุดข้อมูลจำนวนหนึ่ง เพื่อเปลี่ยน "พฤติกรรมโดยรวม" เช่น รูปแบบภาษา การปรับตัวเข้ากับโดเมน หรือความเชี่ยวชาญเฉพาะงาน ส่วน LoRA จะใช้วิธีแทรกเมทริกซ์ขนาดเล็กที่มี Rank ต่ำเข้าไป เพื่อทำการปรับตัวในลักษณะเดียวกันโดยลดจำนวนพารามิเตอร์ที่ต้องปรับลงอย่างมาก ในขณะที่เทคนิคเหล่านี้เป็นการ "เปลี่ยนแนวโน้มของโมเดลในเชิงระนาบ" แต่ Model Editing จะให้ภาพที่ใกล้เคียงกับการ "เปลี่ยนจุดที่เป็นข้อเท็จจริงเฉพาะเจาะจง" มากกว่า ตัวอย่างเช่น การแก้ไขความรู้เฉพาะส่วนอย่างตำแหน่งหน้าที่ของบุคคลหนึ่ง โดยพยายามลดผลกระทบต่อความรู้อื่นๆ ให้เหลือน้อยที่สุด ด้วยเหตุนี้ จึงรวมถึงวิธีการคำนวณและอัปเดตน้ำหนักเป้าหมายโดยตรง ซึ่งแตกต่างจาก Fine-tuning ที่ต้องเตรียมชุดข้อมูลและรัน Gradient Descent ดังนั้น จุดเริ่มต้นในการพิจารณาคือ หากต้องการแก้ไขข้อเท็จจริงจำนวนน้อยให้ถูกต้องแม่นยำควรใช้ Model Editing แต่หากต้องการยกระดับพฤติกรรมโดยรวมของโมเดลควรใช้ Fine-tuning

เบื้องหลังความสนใจใน Model Editing

ในตอนแรก มักมีความคิดที่ว่าข้อผิดพลาดของโมเดลนั้น "สามารถแก้ไขได้ด้วยการฝึกฝนใหม่ (re-training) ในเวอร์ชันถัดไป" อย่างไรก็ตาม เมื่อเริ่มนำไปใช้งานจริง กลับมีสถานการณ์ที่แนวคิดดังกล่าวไม่สามารถรับมือได้ทันเกิดขึ้นอย่างต่อเนื่อง ไม่ว่าจะเป็นชื่อองค์กรหรือระเบียบข้อบังคับที่มีการเปลี่ยนแปลงอยู่บ่อยครั้ง ข้อมูลที่ผิดพลาดหรืออาการหลอน (hallucination) ที่ถูกตรวจพบเป็นรายกรณี ไปจนถึงความจำเป็นที่ต้องลบข้อมูลเฉพาะเจาะจงออก "ทันที" เช่น กรณีคำร้องขอให้ลบข้อมูลส่วนบุคคล หากต้องรอการฝึกฝนใหม่ การตอบสนองจะล่าช้าและไม่คุ้มค่าใช้จ่าย ด้วยความต้องการจากหน้างานเหล่านี้ ทำให้ "การแก้ไขโมเดล" (model editing) ซึ่งสามารถแก้ไขความรู้เฉพาะส่วนได้อย่างรวดเร็วด้วยต้นทุนต่ำ จึงได้รับความสนใจมากขึ้น

เบื้องหลังของเรื่องนี้ยังรวมถึงการเปลี่ยนแปลงของสภาพแวดล้อมด้านกฎระเบียบด้วย โดยเริ่มจาก EU AI Act ที่มีผลบังคับใช้เต็มรูปแบบแล้ว ซึ่งกระแสที่เรียกร้องให้องค์กรมีความรับผิดชอบต่อผลลัพธ์ของ AI และการจัดการข้อมูลนั้นทวีความรุนแรงขึ้น ทำให้ "ความสามารถในการควบคุมความรู้ที่โมเดลถือครองอยู่" กลายเป็นข้อกำหนดด้านธรรมาภิบาล (governance) ไปโดยปริยาย ทั้งในแง่ของความสะดวกทางเทคนิคและความจำเป็นเชิงสถาบัน การแก้ไขโมเดลจึงถูกยกระดับขึ้นมาเป็นหัวข้อสำคัญในการปฏิบัติงานจริง

แตกต่างจาก Machine Unlearning อย่างไร?

หากการแก้ไขโมเดล (Model Editing) คือ "การเขียนทับความรู้" Machine Unlearning ก็เป็นเทคโนโลยีที่มุ่งเน้นไปที่ "การลบข้อมูลที่เรียนรู้ไปแล้ว" แม้ทั้งสองจะมีส่วนที่คาบเกี่ยวกัน แต่มีจุดประสงค์ วิธีการประเมิน และความเกี่ยวข้องกับกฎระเบียบที่แตกต่างกัน ในที่นี้จะขอสรุปคำจำกัดความ เกณฑ์การเลือกใช้งาน และความสัมพันธ์ที่มีต่อ "สิทธิที่จะถูกลืม" (Right to be forgotten)

นิยามและวัตถุประสงค์ของ Machine Unlearning

Machine Unlearning คือเทคโนโลยีที่ใช้ในการลบอิทธิพลของข้อมูลที่เคยใช้ในการเรียนรู้ออกไปจากโมเดล เพื่อให้โมเดลกลับไปอยู่ในสถานะที่ "เสมือนว่าไม่ได้เรียนรู้ข้อมูลนั้นมาตั้งแต่ต้น" โดยมีจุดประสงค์หลักอยู่ที่การกำจัดร่องรอยที่ข้อมูลเฉพาะเจาะจงทิ้งไว้ มากกว่าการแก้ไขความรู้โดยตรง ตัวอย่างเช่น ในกรณีที่ข้อมูลการเรียนรู้มีข้อมูลส่วนบุคคลของผู้ใช้หรือข้อความที่มีปัญหาด้านลิขสิทธิ์รวมอยู่ด้วย เทคโนโลยีนี้จะตอบโจทย์ความต้องการในการดึงเอาอิทธิพลของข้อมูลเหล่านั้นออกไปในภายหลัง

วิธีการดำเนินการแบ่งออกเป็นสองแนวทางหลัก ได้แก่ แนวทางแบบ "แม่นยำ" (Exact) ซึ่งใช้วิธีแบ่งข้อมูลออกเป็นส่วนๆ ในการเรียนรู้ แล้วทำการเรียนรู้ใหม่เฉพาะส่วนที่มีข้อมูลที่ต้องการลบออก และแนวทางแบบ "ประมาณการ" (Approximate) ซึ่งใช้วิธีการต่างๆ เช่น การปรับค่า Gradient ในทิศทางตรงกันข้ามเพื่อลบล้างอิทธิพลของข้อมูลเป้าหมาย แม้วิธีการแบบแม่นยำจะมีความน่าเชื่อถือสูงแต่ก็มีต้นทุนที่สูงตามไปด้วย ในขณะที่วิธีการแบบประมาณการจะมีน้ำหนักเบากว่าแต่ยากที่จะรับประกันความสมบูรณ์ของการลบข้อมูลได้ การเลือกว่าจะใช้วิธีใดจึงขึ้นอยู่กับระดับความแน่นอนที่ต้องการ

เกณฑ์การเลือกใช้ระหว่าง Model Editing กับ Machine Unlearning

การเลือกใช้ทั้งสองวิธีขึ้นอยู่กับว่า "ต้องการบรรลุเป้าหมายใด" หากต้องการแก้ไขข้อเท็จจริงให้เป็นค่าที่ถูกต้อง ควรใช้ Model Editing แต่หากต้องการลบอิทธิพลของข้อมูลเฉพาะเจาะจงออกไป Machine Unlearning จะเหมาะสมกว่า

มุมมอง	Model Editing	Machine Unlearning
วัตถุประสงค์หลัก	เขียนทับความรู้ให้เป็นค่าที่ถูกต้อง	ลบอิทธิพลของข้อมูลที่ใช้ฝึกสอน
กรณีการใช้งานทั่วไป	การแก้ไขข้อมูลผิดพลาด/ข้อเท็จจริงที่ล้าสมัย	การลบข้อมูลส่วนบุคคล/การกำจัดข้อมูลที่ละเมิดสิทธิ์
จุดเน้นในการประเมิน	ความสำเร็จของผลลัพธ์และผลข้างเคียง	ความสมบูรณ์ของการลบและความเสี่ยงที่หลงเหลือ
ความสัมพันธ์กับกฎระเบียบ	ความถูกต้องของผลลัพธ์และความรับผิดชอบ	สิทธิในการถูกลืมและการคุ้มครองข้อมูล

ในการปฏิบัติงานจริง มักมีการใช้ทั้งสองวิธีร่วมกัน ตัวอย่างเช่น ในกรณีที่เกี่ยวข้องกับข้อมูลส่วนบุคคล การดำเนินการแบบเป็นขั้นตอนโดยเริ่มจากการแก้ไขความรู้ดังกล่าวให้เป็นค่าที่ไม่เป็นอันตราย จากนั้นจึงพิจารณาลบร่องรอยการฝึกสอนออกไปถือเป็นแนวทางที่สมเหตุสมผล ไม่ควรคิดว่าวิธีใดวิธีหนึ่งจะเพียงพอ แต่ควรใช้เสริมกันตามวัตถุประสงค์ที่ต้องการ

บริบทของสิทธิในการถูกลืม (Right to be Forgotten) และกฎระเบียบ AI

「สิทธิที่จะถูกลืม」 (Right to be Forgotten) ถูกบัญญัติไว้เป็นสิทธิในการลบข้อมูลส่วนบุคคลตามคำร้องขอของเจ้าของข้อมูล เช่น สิทธิในการลบข้อมูล (Right to Erasure) ตามมาตรา 17 ของ GDPR นอกจากนี้ ข้อกำหนดในลักษณะเดียวกันยังแพร่หลายไปในกฎหมายคุ้มครองข้อมูลส่วนบุคคลของแต่ละประเทศ รวมถึง PDPA ของประเทศไทยด้วย (ความแตกต่างของแต่ละประเทศได้สรุปไว้ใน การเปรียบเทียบกฎหมายคุ้มครองข้อมูลส่วนบุคคล 4 ประเทศในอาเซียน) ปัญหาคือ แม้การลบเรคคอร์ดในฐานข้อมูลจะเป็นเรื่องง่าย แต่การลบข้อมูลที่หลอมรวมเข้าไปอยู่ในน้ำหนักของโมเดล (Model weights) ผ่านการเรียนรู้ไปแล้วนั้นเป็นเรื่องยากในทางเทคนิค นี่คือเหตุผลที่ Machine Unlearning ถูกคาดหวังให้เป็นทางออกในเชิงเทคนิค ยิ่งไปกว่านั้น ภายใต้กรอบการทำงานอย่าง EU AI Act ที่มีผลบังคับใช้เต็มรูปแบบแล้ว ซึ่งกำหนดให้องค์กรต้องมีความโปร่งใสและการจัดการความเสี่ยงของระบบ AI ความสำคัญของการอธิบายได้ว่า 「ข้อมูลที่ใช้ในการเรียนรู้มีอะไรบ้าง และจะควบคุมข้อมูลเหล่านั้นได้อย่างไร」 จึงเพิ่มสูงขึ้น การที่ฝ่ายกฎหมายและฝ่ายกำกับดูแล (Compliance) กับฝ่ายเทคนิคได้หารือและประสานงานกันล่วงหน้าเกี่ยวกับความเป็นไปได้ในการตอบสนองต่อคำร้องขอให้ลบข้อมูล จะเป็นทางลัดในการลดความเสี่ยงด้านการปฏิบัติตามกฎระเบียบได้

มีเทคนิคหลักอะไรบ้าง?

วิธีการแก้ไขโมเดลสามารถแบ่งออกเป็นสองประเภทหลัก ได้แก่ "การแก้ไขแบบเฉพาะจุด" (Local Editing) ซึ่งเป็นการคำนวณและเขียนทับค่าน้ำหนัก (weights) ของโมเดลโดยตรง และ "การแก้ไขแบบใช้เมตาเลิร์นนิง" (Meta-learning based) ซึ่งเป็นการสอนวิธีการแก้ไขให้กับโมเดลโดยเฉพาะ เนื่องจากทั้งสองวิธีต้องอาศัยการปรับเปลี่ยนค่าน้ำหนักของโมเดล จึงสามารถใช้ได้เฉพาะกับโมเดลแบบเปิด (Open-weight models) ที่เราสามารถเข้าถึงค่าน้ำหนักและนำมาใช้งานเองได้เท่านั้น การเลือกใช้วิธีการจะขึ้นอยู่กับปริมาณความรู้ที่ต้องการแก้ไขและความแม่นยำที่คาดหวัง ต่อไปเราจะมาดูวิธีการที่เป็นตัวแทนและมุมมองในการเปรียบเทียบแต่ละวิธีกัน

กลไกของเทคนิค Local Editing (เช่น ROME, MEMIT)

วิธีการแก้ไขแบบเฉพาะจุด (Local editing) คือแนวทางที่มุ่งระบุว่า "ข้อเท็จจริงหนึ่งๆ ถูกเก็บไว้ที่น้ำหนัก (weights) ส่วนใดของโมเดล" แล้วทำการแก้ไขเฉพาะจุดนั้นๆ โดยตรง วิธีที่เป็นตัวแทนของแนวทางนี้คือ ROME (Rank-One Model Editing) ซึ่งมองว่า MLP ในชั้นกลางของ Transformer เป็นหน่วยความจำแบบเชื่อมโยง (associative memory) ชนิดหนึ่ง ที่มีอินพุต (ประธาน) เป็นคีย์ และเอาต์พุต (ข้อเท็จจริง) เป็นค่า โดยจะใช้การวิเคราะห์เชิงสาเหตุเพื่อระบุว่าชั้นใดเป็นผู้รับผิดชอบต่อข้อเท็จจริงนั้นๆ จากนั้นจึงทำการอัปเดตน้ำหนักของชั้นดังกล่าวเพียงเล็กน้อยเพื่อให้ "เมื่อใส่คีย์เดิมเข้าไป จะได้ค่าใหม่ที่ต้องการ" เป็นการเขียนทับความรู้เดิม ส่วน MEMIT (Mass-Editing Memory in a Transformer) เป็นวิธีการที่ต่อยอดแนวคิดนี้ไปสู่การแก้ไขหลายชั้นและหลายพันรายการพร้อมกัน ซึ่งเปรียบเสมือนการสลับเปลี่ยนข้อมูลเฉพาะรายการในหน่วยความจำแบบเชื่อมโยง โดยมีข้อดีคือไม่ต้องส่งผลกระทบต่อโมเดลทั้งหมดเหมือนการเทรนใหม่ (re-training) อย่างไรก็ตาม หากไม่สามารถระบุตำแหน่งของข้อเท็จจริงได้อย่างถูกต้อง อาจส่งผลกระทบไปยังส่วนที่ไม่ต้องการได้ ดังนั้น ความแม่นยำในการระบุตำแหน่งที่จะแก้ไขจึงเป็นปัจจัยสำคัญที่กำหนดคุณภาพของผลลัพธ์

เทคนิคที่ใช้ Meta-learning (เช่น MALMEN)

วิธีการแบบ Meta-learning จะให้เครือข่ายเสริมเรียนรู้กฎที่ว่า "จะแก้ไขน้ำหนัก (weights) อย่างไรโดยไม่ส่งผลกระทบเชิงลบต่อส่วนอื่น" ตัวอย่างที่สำคัญคือ MEND ซึ่งจะฝึกฝนเครือข่ายขนาดเล็ก (Editor) ไว้ล่วงหน้า เพื่อแปลงค่า Gradient ที่ได้จากกรณีที่ต้องการแก้ไขให้เป็นการอัปเดตน้ำหนักที่เหมาะสมสำหรับโมเดลหลัก ในการแก้ไขจริง Editor นี้จะส่งค่าการอัปเดตออกมาทันที จึงไม่จำเป็นต้องคำนวณใหม่ทั้งหมดทุกครั้ง ส่วน MALMEN เป็นวิธีการที่ต่อยอดแนวคิดนี้สำหรับการแก้ไขจำนวนมาก ทำให้สามารถประมวลผลการแก้ไขหลายรายการพร้อมกันได้อย่างมีประสิทธิภาพ ความแตกต่างที่สำคัญคือ ในขณะที่การแก้ไขแบบ Local จะเป็นการ "ออกแบบวิธีการแก้ไขด้วยมือ" แต่วิธีการแบบ Meta-learning คือการ "เรียนรู้วิธีการแก้ไขจากข้อมูล" แม้จะมีต้นทุนในการฝึกฝนล่วงหน้า แต่เมื่อเตรียมการเสร็จสิ้นแล้ว จะสามารถทำซ้ำการแก้ไขได้ง่าย และยิ่งมีขนาดการแก้ไขที่ใหญ่ขึ้นเท่าใด ก็ยิ่งแสดงประสิทธิภาพได้ดีขึ้นเท่านั้น

การเปรียบเทียบความแม่นยำ ผลข้างเคียง และต้นทุนของแต่ละเทคนิค

ในการเลือกวิธีการนั้น ประเด็นสำคัญคือการพิจารณาทั้งสามด้านควบคู่กันไป ได้แก่ ความแม่นยำในการแก้ไข, ผลข้างเคียง (การส่งผลกระทบไปยังความรู้ที่ไม่เกี่ยวข้อง) และต้นทุนในการดำเนินงาน

มุมมอง	การแก้ไขเฉพาะจุด (ROME / MEMIT)	อิงตามเมตาเลิร์นนิง (MEND / MALMEN)
การเตรียมการล่วงหน้า	ไม่จำเป็นถึงน้อยมาก	จำเป็นต้องมีการฝึกสอน Editor ล่วงหน้า
การแก้ไขจำนวนน้อย	ทำได้ดี	ทำได้ แต่ต้นทุนการเตรียมการค่อนข้างสูง
การแก้ไขจำนวนมาก	รองรับด้วย MEMIT	รองรับด้วย MALMEN
การควบคุมผลข้างเคียง	ขึ้นอยู่กับความแม่นยำของการระบุตำแหน่ง	ขึ้นอยู่กับคุณภาพของการฝึกสอน

ทุกวิธีการมีโจทย์ร่วมกันคือ "ในขณะที่ความรู้ที่แก้ไขนั้นถูกต้อง แต่จะเกิดผลข้างเคียงต่อความรู้โดยรอบหรือความสามารถในการสร้างข้อความหรือไม่" ดังนั้น ก่อนนำไปใช้งานจริง จำเป็นต้องมีขั้นตอนการประเมินว่านอกจากเป้าหมายที่แก้ไขแล้ว "ความรู้ที่เกี่ยวข้องที่ไม่ได้แก้ไข" ยังคงอยู่ครบถ้วนหรือไม่ ความเหนือกว่าของตัวเลขนั้นเปลี่ยนแปลงไปตามเกณฑ์มาตรฐาน (Benchmark) ที่เผยแพร่และโครงสร้างของโมเดล ดังนั้นการตรวจสอบกับโมเดลเป้าหมายของบริษัทตนเองจึงเป็นสิ่งที่ขาดไม่ได้

จะนำไปประยุกต์ใช้กับ PDPA และธรรมาภิบาล AI อย่างไร?

Model Editing และ Machine Unlearning อาจกลายเป็นวิธีการนำไปใช้จริงเพื่อตอบสนองต่อคำขอลบข้อมูลส่วนบุคคลและข้อกำหนดด้าน AI Governance โดยไม่ต้องพึ่งพาการเรียนรู้ใหม่ (Retraining) ซึ่งช่วยประหยัดต้นทุนได้ อย่างไรก็ตาม เทคโนโลยีเพียงอย่างเดียวไม่สามารถแก้ปัญหาได้ทั้งหมด จำเป็นต้องออกแบบควบคู่ไปกับขั้นตอนการทำงาน (Workflow) และระบบการประเมินผล โดยจะพิจารณาประเด็นสำคัญในการนำไปใช้จริงจาก 3 มุมมอง ดังนี้

ขั้นตอนการปฏิบัติงานเมื่อมีการร้องขอให้ลบข้อมูลส่วนบุคคล

การเตรียมพร้อมรับมือกับคำขอให้ลบข้อมูลส่วนบุคคล จำเป็นต้องกำหนดขั้นตอนการดำเนินงานที่ครอบคลุมทั้งก่อนและหลังการดำเนินการทางเทคนิค ดังนี้:

การรับเรื่องและยืนยันตัวตน: ระบุเนื้อหาของคำขอและขอบเขตที่เกี่ยวข้องให้ชัดเจน
การระบุเป้าหมาย: ตรวจสอบว่าข้อมูลดังกล่าวส่งผลกระทบต่อข้อมูลที่ใช้ฝึกสอน (Training Data) หรือผลลัพธ์ของโมเดล (Model Output) อย่างไร
การเลือกวิธีการ: หากเพียงแค่แก้ไขผลลัพธ์ให้เป็นค่าที่ไม่เป็นอันตรายก็เพียงพอ ให้ใช้วิธีการแก้ไข (Editing) แต่หากจำเป็นต้องกำจัดร่องรอยการเรียนรู้ออกไป ให้พิจารณาใช้ Machine Unlearning
การนำไปใช้: ดำเนินการแก้ไขหรือลบข้อมูลตามวิธีการที่เลือกไว้
การตรวจสอบ: ยืนยันว่าข้อมูลเป้าหมายจะไม่ถูกแสดงออกมาอีก และฟังก์ชันการทำงานส่วนอื่นที่ไม่เกี่ยวข้องจะไม่ได้รับความเสียหาย
การบันทึก: บันทึกรายละเอียดการดำเนินการและเหตุผลประกอบการตัดสินใจ เพื่อเตรียมพร้อมสำหรับความรับผิดชอบในการชี้แจง (Accountability)

เนื่องจากวิธีการที่เหมาะสมที่สุดจะแตกต่างกันไปตามลักษณะของคำขอ การกำหนดเกณฑ์การตัดสินใจว่า "ในกรณีใดควรใช้วิธีใด" ไว้ในขั้นตอนการทำงาน จะช่วยลดความไม่สม่ำเสมอในการรับมือได้

จุดเชื่อมโยงกับธรรมาภิบาล AI และ EU AI Act

「AI ของบริษัทสามารถแก้ไขหรือลบความรู้ที่ถือครองอยู่ได้ตามความจำเป็นหรือไม่」— ในมุมมองของ AI Governance การที่สามารถตอบคำถามนี้ได้กำลังกลายเป็นสิ่งที่ถูกตั้งคำถาม EU AI Act ซึ่งมีผลบังคับใช้เต็มรูปแบบแล้ว ได้กำหนดให้ AI ที่มีการใช้งานที่มีความเสี่ยงสูงต้องมีความโปร่งใส มีการจัดการข้อมูล และมีกลไกในการลดความเสี่ยง ซึ่งทำให้การปล่อยให้โมเดลแสดงข้อมูลที่ผิดพลาดหรือไม่เหมาะสมอย่างต่อเนื่องเป็นสิ่งที่ยอมรับได้ยากขึ้นเรื่อยๆ Model Editing และ Machine Unlearning อาจกลายเป็นวิธีการที่เป็นรูปธรรมในการแสดงให้เห็นว่า "สามารถควบคุมผลลัพธ์ได้" และ "สามารถตอบสนองต่อคำขอให้ลบข้อมูลได้ทางเทคนิค" เพื่อรองรับข้อกำหนดเหล่านี้ สิ่งสำคัญคือการไม่มองว่าสิ่งเหล่านี้เป็นเพียงเครื่องมือแก้ไขปัญหาเฉพาะหน้า แต่ต้องวางตำแหน่งให้เป็นส่วนหนึ่งของระบบธรรมาภิบาล ใครเป็นผู้ตัดสินใจแก้ไขตามเกณฑ์ใด บันทึกไว้อย่างไร และตรวจสอบอย่างไร— เทคโนโลยีจะทำหน้าที่เป็นเครื่องยืนยันการปฏิบัติตามกฎระเบียบได้ก็ต่อเมื่อมีการออกแบบรวมไปถึงกฎเกณฑ์ในการดำเนินงานด้วย สำหรับภาพรวมของการสร้างระบบ สามารถอ้างอิงได้จาก คู่มือการสร้างระบบ AI Governance สำหรับบริษัทที่ขยายธุรกิจสู่ ASEAN

การประยุกต์ใช้เพื่อแก้ไขปัญหาอาการหลอน (Hallucination)

เมื่อพูดถึงมาตรการรับมือกับอาการประสาทหลอน (Hallucination) วิธีแรกที่มักถูกหยิบยกมาคือการใช้ Retrieval-Augmented Generation (RAG) เพื่อป้อนข้อมูลที่ถูกต้องให้กับโมเดล (สามารถดูรายละเอียดจุดสำคัญในการนำไปใช้งานได้ที่ วิธีเพิ่มความแม่นยำของ RAG) อย่างไรก็ตาม หากตัวโมเดลเองมีความจำที่ฝังใจในข้อมูลที่เป็นเท็จอย่างรุนแรง การป้อนข้อมูลที่ถูกต้องจากภายนอกเข้าไปก็อาจถูกความรู้เดิมที่ผิดพลาดฉุดรั้งไว้ได้ ในจุดนี้เองที่ Model Editing จะเข้ามามีบทบาทเสริม หากเราแก้ไขข้อมูลที่เป็นเท็จเฉพาะจุดให้เป็นค่าที่ถูกต้องในระดับความรู้ภายในของโมเดลได้ ก็จะช่วยลดการเกิดข้อผิดพลาดซ้ำได้โดยไม่ต้องพึ่งพาการค้นหาเพียงอย่างเดียว

อย่างไรก็ตาม การพยายามกำจัดอาการประสาทหลอนทั้งหมดด้วยการแก้ไขโมเดลนั้นไม่ใช่เรื่องที่ทำได้จริง ในส่วนของข้อมูลที่มีการเปลี่ยนแปลงบ่อยครั้ง การใช้ RAG เพื่ออ้างอิงข้อมูลล่าสุดจากภายนอกถือว่าเหมาะสมกว่า ส่วนข้อมูลที่เป็นข้อเท็จจริงคงที่แต่โมเดลมักจะจำผิดซ้ำๆ การใช้ Model Editing เพื่อแก้ไขโดยตรงจะเป็นวิธีที่มีประสิทธิภาพมากกว่า การแบ่งหน้าที่เช่นนี้จึงเป็นแนวทางที่ได้ผลดี การแก้ไขโมเดลเป็นเพียงวิธีการที่ใช้จัดการกับ "ข้อผิดพลาดคงที่ในความรู้ภายใน" เท่านั้น ซึ่งไม่ใช่สิ่งที่ต้องเลือกอย่างใดอย่างหนึ่งแทนที่ RAG แต่การนำมาใช้ร่วมกันจะช่วยยกระดับความแม่นยำโดยรวมของมาตรการรับมือกับอาการประสาทหลอนให้สูงขึ้นได้

เหตุผลที่ควรทราบถึงความเข้าใจผิดและข้อจำกัดทั่วไป

การแก้ไขโมเดล (Model Editing) และ Machine Unlearning ไม่ใช่ทางแก้ครอบจักรวาล และความเข้าใจที่ว่า "แก้ไขเพียงครั้งเดียวแล้วจะหายขาดหรือถูกต้องสมบูรณ์" นั้นเป็นเรื่องที่ผิด หากนำไปใช้โดยไม่ประเมินความเสี่ยงที่ยังหลงเหลืออยู่หรือผลข้างเคียงให้ถูกต้อง การทำไปโดย "คิดว่า" แก้ไขแล้วจะเป็นสิ่งที่อันตรายที่สุด ต่อไปนี้คือความเข้าใจผิดที่พบบ่อยสองประการ

ความเชื่อที่ว่า "ลบได้หมดจด" คือความผิดพลาด: ความเสี่ยงที่ยังคงอยู่

การคิดว่า "ข้อมูลที่ลบไปแล้วจะไม่มีวันกลับมาอีก" เป็นความคิดที่เสี่ยง โดยเฉพาะอย่างยิ่งใน Machine Unlearning แบบประมาณการ (approximate) การลดอิทธิพลของข้อมูลเป้าหมายไม่ได้หมายความว่าร่องรอยจะหายไปอย่างสมบูรณ์เสมอไป มีการชี้ให้เห็นว่าเนื้อหาที่ควรจะถูกลบไปแล้วอาจถูกกู้คืนกลับมาได้บางส่วนผ่านวิธีการตั้งคำถามที่แยบยลหรือการคาดเดาจากข้อมูลที่เกี่ยวข้อง ซึ่งเป็นผลมาจากความรู้ไม่ได้ถูกเก็บไว้ในจุดเดียว แต่กระจายตัวอยู่ภายในโมเดล ดังนั้น ในทางปฏิบัติ มุมมองเชิงความน่าจะเป็นที่ว่า "ลดความเสี่ยงลงได้มากน้อยเพียงใด" แทนที่จะเป็น "ลบออกไปได้แล้ว" จึงเป็นสิ่งที่ขาดไม่ได้ ในการตรวจสอบ ไม่เพียงแต่ต้องยืนยันว่าข้อมูลไม่ปรากฏออกมาด้วยคำถามง่ายๆ เท่านั้น แต่ยังต้องประเมินระดับของข้อมูลที่หลงเหลืออยู่โดยใช้การเรียบเรียงคำใหม่หรือข้อมูลโดยรอบประกอบด้วย หากให้ความสำคัญกับความแน่นอนเป็นอันดับแรก การตัดสินใจเลือกใช้วิธีที่เข้มงวดซึ่งรวมถึงการฝึกฝนโมเดลใหม่ (retraining) แม้จะมีต้นทุนสูงกว่า ก็อาจเป็นทางเลือกที่เหมาะสม

กรณีที่เกิดผลกระทบต่อเนื่อง (Side Effects) จากการแก้ไข

การแก้ไขไม่ได้จำกัดอยู่เพียงแค่ข้อเท็จจริงที่เป็นเป้าหมายเท่านั้น แต่อาจส่งผลกระทบไปถึงความรู้ที่เกี่ยวข้องด้วย ตัวอย่างเช่น เมื่อแก้ไขสังกัดของบุคคลหนึ่ง คำตอบสำหรับคำถามอื่นที่เกี่ยวข้องกับบุคคลนั้นอาจเกิดความไม่เสถียรตามไปด้วย ซึ่งเป็นผลกระทบต่อเนื่องที่เกิดขึ้นเนื่องจากความรู้ภายในโมเดลมีความเชื่อมโยงกัน ในตอนแรกเรามักจะคิดว่า "แค่แก้ไขจุดเดียวก็พอ" แต่ในความเป็นจริง ควรพิจารณาว่าการตรวจสอบว่า "สิ่งที่อยู่รอบๆ จุดที่แก้ไขนั้นยังคงถูกต้องหรือไม่" เป็นส่วนหนึ่งของงานด้วย

เพื่อลดผลกระทบต่อเนื่อง (Ripple effect) การจำกัดขอบเขตของสิ่งที่แก้ไขให้เหลือน้อยที่สุดเท่าที่จำเป็น และการตรวจสอบพฤติกรรมของโมเดลด้วยชุดทดสอบที่ครอบคลุมความรู้ที่เกี่ยวข้องหลังการแก้ไขถือเป็นวิธีที่มีประสิทธิภาพ นอกจากนี้ ในกรณีที่ต้องการใช้การแก้ไขจำนวนมากพร้อมกัน อาจเกิดการแทรกแซงกันเองระหว่างการแก้ไขจนทำให้คุณภาพลดลงได้ ดังนั้น การแบ่งจำนวนการแก้ไขออกเป็นขั้นตอนและทำการประเมินในแต่ละขั้นตอนจึงเป็นแนวทางที่ปลอดภัยกว่า ควรมีแนวคิดในการจัดการโดยกำหนดขอบเขตที่ยอมรับได้ โดยตั้งอยู่บนสมมติฐานที่ว่าผลข้างเคียงไม่สามารถทำให้เป็นศูนย์ได้

ขั้นตอนแรกในการเริ่มต้นใช้งานคืออะไร?

ก้าวแรกไม่ใช่การเลือกใช้วิธีการขั้นสูง แต่คือการทำให้ Use case ชัดเจนว่า "ต้องการแก้ไขความรู้ใด เพราะเหตุใด และด้วยความมั่นใจระดับใด" เมื่อกำหนดวัตถุประสงค์ได้แล้ว วิธีการที่จำเป็นและวิธีการประเมินก็จะถูกจำกัดให้แคบลงโดยอัตโนมัติ ต่อไปนี้คือแนวทางการเริ่มต้นโดยการทดสอบจากจุดเล็กๆ

การระบุ Use Case และการจัดลำดับความสำคัญ

สิ่งแรกที่ควรทำคือการระบุสถานการณ์ภายในองค์กรที่ต้องการ "แก้ไขหรือลบความรู้" ออก และจัดลำดับความสำคัญ ตัวอย่างเช่น การแก้ไขข้อเท็จจริงที่มีการเปลี่ยนแปลงบ่อย การตอบสนองต่อคำขอให้ลบข้อมูลส่วนบุคคล หรือการแก้ไขอาการประสาทหลอน (Hallucination) แบบคงที่ที่เกิดขึ้นซ้ำๆ ซึ่งวิธีการที่เหมาะสมจะแตกต่างกันไปตามวัตถุประสงค์ โดยมีเกณฑ์การตัดสินใจที่เรียบง่าย 3 ประการคือ "ต้องการแก้ไขให้เป็นค่าที่ถูกต้อง หรือต้องการลบผลกระทบออก", "เป็นจำนวนน้อยหรือจำนวนมาก" และ "ต้องการความแน่นอนระดับไหน" หากเป็นข้อเท็จจริงเฉพาะจุดที่ต้องการเพียงแค่ให้ผลลัพธ์ถูกต้อง ก็อาจเริ่มจากการประยุกต์ใช้ Model Editing ในระดับเล็ก แต่หากเป็นข้อมูลส่วนบุคคลที่ต้องคำนึงถึงความถูกต้องแม่นยำเพื่อรองรับกฎระเบียบ ก็ควรเริ่มจากการพิจารณาวิธีการที่เข้มงวดกว่า

การพยายามจัดการทุกอย่างพร้อมกันจะทำให้การประเมินผลล้มเหลว ดังนั้นจึงควรเลือกกรณีการใช้งาน (Use case) เพียงหนึ่งกรณีที่มีผลกระทบสูงและตรวจสอบได้ง่าย เพื่อประเมินผลดีและผลข้างเคียงก่อนที่จะขยายผลออกไปในวงกว้าง การเลือกเป้าหมายแรกเริ่มจะเป็นรากฐานสำคัญสำหรับการออกแบบการดำเนินงานในอนาคต

วิธีเลือกเครื่องมือ Open Source และตัวชี้วัดการประเมินผล

โดยพื้นฐานแล้ว วิธีการเหล่านี้สามารถใช้ได้กับโมเดลแบบ Open-weights ที่สามารถดาวน์โหลดน้ำหนัก (weights) มาใช้งานในเครื่องได้เท่านั้น (เช่น Llama, Mistral, Qwen, Gemma หรือโมเดลบางส่วนของ OpenAI ที่เปิดเผยน้ำหนัก) ส่วนโมเดลแบบปิด (Closed models) เช่น Claude หรือ API ของ GPT และ Gemini นั้น ไม่สามารถเข้าถึงน้ำหนักจากภายนอกได้ จึงไม่สามารถนำมาแก้ไขด้วยวิธีนี้ได้ สำหรับโมเดลแบบปิดเหล่านี้ การปรับปรุงความรู้จะทำได้ผ่านการใช้ RAG, System Prompt หรือฟังก์ชัน Fine-tuning ที่ผู้ให้บริการจัดเตรียมไว้ให้

สำหรับการเลือกเครื่องมือ เฟรมเวิร์กแบบ Open-source อย่าง EasyEdit ซึ่งรวบรวมวิธีการแก้ไขโมเดลต่างๆ ไว้ให้ทดลองใช้ ถือเป็นจุดเริ่มต้นที่ดีสำหรับการทดสอบในระดับเล็ก เนื่องจากสามารถเปรียบเทียบ ROME, MEMIT, MEND และวิธีอื่นๆ ภายใต้กรอบการทำงานเดียวกันได้

สิ่งที่สำคัญยิ่งกว่าเครื่องมือคือการออกแบบตัวชี้วัด (Evaluation metrics) โดยพื้นฐานแล้ว คุณภาพของการแก้ไขโมเดลจะวัดจาก 3 ปัจจัยหลัก ได้แก่ ความรู้ที่ต้องการถูกแก้ไขจริงหรือไม่ (Reliability), คำตอบยังคงมีความสอดคล้องแม้จะเปลี่ยนรูปแบบการถามหรือไม่ (Generalization) และความรู้หรือความสามารถในการสร้างข้อความที่ไม่เกี่ยวข้องกับการแก้ไขยังคงอยู่ครบถ้วนหรือไม่ (Locality) การเตรียมชุดข้อมูลสำหรับประเมินผลที่สอดคล้องกับโมเดลและกรณีการใช้งาน (Use case) ขององค์กร รวมถึงการวัดผลเหล่านี้ในทุกครั้ง ถือเป็นเงื่อนไขสำคัญก่อนที่จะนำไปใช้งานจริงอย่างปลอดภัย

คำถามที่พบบ่อย (FAQ)

Q. ควรเลือกใช้ Model Editing หรือ Fine-tuning ดี? หากต้องการแก้ไขข้อเท็จจริงจำนวนน้อยให้ถูกต้องแม่นยำ ควรเลือกใช้ Model Editing แต่หากต้องการปรับเปลี่ยนพฤติกรรมโดยรวมของโมเดล เช่น รูปแบบการเขียน (Style) หรือการปรับให้เข้ากับโดเมนเฉพาะ (Domain Adaptation) ควรเลือกใช้ Fine-tuning ทั้งสองวิธีนี้ไม่ได้แยกขาดจากกัน โดยหลักการแล้วควรเลือกใช้ตามวัตถุประสงค์ที่แตกต่างกัน

Q. การใช้ Machine Unlearning สามารถลบข้อมูลการเรียนรู้ได้อย่างสมบูรณ์หรือไม่? ไม่สามารถรับประกันการลบข้อมูลได้อย่างสมบูรณ์ โดยเฉพาะในวิธีแบบประมาณการ (Approximate methods) ที่อาจยังหลงเหลือร่องรอยอยู่ ดังนั้นการประเมินจึงควรเน้นที่ "สามารถลดความเสี่ยงได้มากน้อยเพียงใด" แทนที่จะมองว่า "ลบออกไปได้แล้ว" หากต้องการความแน่นอนสูงสุด จำเป็นต้องพิจารณาวิธีการที่เข้มงวดซึ่งรวมถึงการเรียนรู้ใหม่ (Retraining)

Q. เทคโนโลยีนี้พร้อมใช้งานสำหรับการรองรับ PDPA หรือสิทธิในการถูกลืม (Right to be Forgotten) แล้วหรือยัง? แม้เทคโนโลยีจะเริ่มเข้าสู่ขั้นตอนการใช้งานจริงแล้ว แต่ก็ไม่สามารถใช้เพื่อรองรับกฎระเบียบได้โดยลำพังเพียงอย่างเดียว การจะนำมาใช้เป็นหลักฐานรองรับการปฏิบัติตามกฎหมายได้นั้น จำเป็นต้องมีการจัดเตรียมกระบวนการทำงานตั้งแต่การรับคำร้องขอให้ลบข้อมูล ไปจนถึงการตรวจสอบและบันทึกผล รวมถึงระบบการประเมินเพื่อวัดผลกระทบข้างเคียงควบคู่ไปด้วย

ผู้เขียน・ผู้ตรวจสอบ

Yusuke Ishihara

เริ่มเขียนโปรแกรมตั้งแต่อายุ 13 ปี ด้วย MSX หลังจบการศึกษาจากมหาวิทยาลัย Musashi ได้ทำงานพัฒนาระบบขนาดใหญ่ รวมถึงระบบหลักของสายการบิน และโครงสร้าง Windows Server Hosting/VPS แห่งแรกของญี่ปุ่น ร่วมก่อตั้ง Site Engine Inc. ในปี 2008 ก่อตั้ง Unimon Inc. ในปี 2010 และ Enison Inc. ในปี 2025 นำทีมพัฒนาระบบธุรกิจ การประมวลผลภาษาธรรมชาติ และแพลตฟอร์ม ปัจจุบันมุ่งเน้นการพัฒนาผลิตภัณฑ์และการส่งเสริม AI/DX โดยใช้ generative AI และ Large Language Models (LLM)

ติดต่อเรา

บทความแนะนำ

อัปเดต: 14 กรกฎาคม 2569

การออกแบบหน่วยความจำระยะยาวสำหรับ AI Agent: วิธีรักษาบริบทงานด้วย MemGPT และ GraphRAG

อัปเดต: 13 กรกฎาคม 2569