
**モデル編集(Model Editing)**とは、大規模言語モデル(LLM)を再学習させることなく、特定の知識だけをピンポイントで書き換える技術である。誤った事実や古くなった情報、削除すべき個人情報を、モデル全体を作り直すことなく修正できる点が最大の特徴だ。本記事は、AIガバナンスや個人情報保護への対応を検討する企業の担当者・エンジニアを対象に、モデル編集の基本概念から代表的な手法、Machine Unlearningとの違い、PDPAや「忘れられる権利」への実務的な活用までを順を追って解説する。読み終えるころには、自社のどの場面で何を使えばよいかの判断軸が持てるはずだ。
หัวใจสำคัญของการแก้ไขโมเดล (Model Editing) ไม่ใช่การเรียนรู้พารามิเตอร์หลายพันล้านตัวใหม่ทั้งหมด แต่เป็นการมุ่งเป้าไปที่การเขียนทับ "น้ำหนักเพียงบางส่วน" ที่รับผิดชอบต่อความรู้นั้นโดยเฉพาะ ก่อนอื่น เรามาทำความเข้าใจความแตกต่างจากการเรียนรู้ใหม่ (Retraining) ความสัมพันธ์กับการปรับจูนละเอียด (Fine-tuning) และเบื้องหลังที่ทำให้เรื่องนี้ได้รับความสนใจตามลำดับกันก่อน
「โมเดลตอบชื่อบริษัทเก่า」——เมื่อเผชิญกับปัญหานี้ สิ่งแรกที่นึกถึงคงเป็นวิธีการแก้ไขข้อมูลการเรียนรู้แล้วทำการเทรนใหม่ (Retraining) แต่การเทรนโมเดลขนาดใหญ่ใหม่นั้นต้องใช้ทรัพยากรคำนวณ เวลา และบุคลากรผู้เชี่ยวชาญมหาศาล ซึ่งการทำเช่นนั้นเพียงเพื่อแก้ไขข้อเท็จจริงเพียงเรื่องเดียวนั้นไม่สมเหตุสมผล การแก้ไขโมเดล (Model Editing) เข้ามาเปลี่ยนสมมติฐานนี้ โดยการระบุเฉพาะค่าน้ำหนัก (Weights) ที่สอดคล้องกับความรู้ที่ต้องการอัปเดตและเขียนทับเฉพาะส่วนนั้น ทำให้การแก้ไขอาจเสร็จสิ้นภายในเวลาไม่กี่วินาทีถึงไม่กี่นาที หากเปรียบการเทรนใหม่ว่าเป็นการ「พิมพ์ตำราเรียนใหม่ทั้งเล่ม」 การแก้ไขโมเดลก็เปรียบเสมือนการ「แก้ไขข้อความเฉพาะหน้าที่มีปัญหา」 อย่างไรก็ตาม ทั้งสองวิธีไม่ได้แยกขาดจากกัน ในทางปฏิบัติแล้ว การเลือกใช้ให้เหมาะสมคือหากข้อผิดพลาดครอบคลุมเป็นวงกว้างให้ใช้วิธีเทรนใหม่ แต่หากเป็นการแก้ไขข้อเท็จจริงเฉพาะจุดให้ใช้วิธีการแก้ไขโมเดล
แม้ว่า Fine-tuning และ LoRA จะมีความคล้ายคลึงกับ Model Editing ในแง่ของ "การปรับแต่งโมเดลในภายหลัง" แต่มีวัตถุประสงค์และความละเอียดที่แตกต่างกัน Fine-tuning เป็นวิธีการปรับน้ำหนัก (weights) ของโมเดลทั้งหมด (หรือชั้นเลเยอร์ส่วนใหญ่) ด้วยชุดข้อมูลจำนวนหนึ่ง เพื่อเปลี่ยน "พฤติกรรมโดยรวม" เช่น รูปแบบภาษา การปรับตัวเข้ากับโดเมน หรือความเชี่ยวชาญเฉพาะงาน ส่วน LoRA จะใช้วิธีแทรกเมทริกซ์ขนาดเล็กที่มี Rank ต่ำเข้าไป เพื่อทำการปรับตัวในลักษณะเดียวกันโดยลดจำนวนพารามิเตอร์ที่ต้องปรับลงอย่างมาก ในขณะที่เทคนิคเหล่านี้เป็นการ "เปลี่ยนแนวโน้มของโมเดลในเชิงระนาบ" แต่ Model Editing จะให้ภาพที่ใกล้เคียงกับการ "เปลี่ยนจุดที่เป็นข้อเท็จจริงเฉพาะเจาะจง" มากกว่า ตัวอย่างเช่น การแก้ไขความรู้เฉพาะส่วนอย่างตำแหน่งหน้าที่ของบุคคลหนึ่ง โดยพยายามลดผลกระทบต่อความรู้อื่นๆ ให้เหลือน้อยที่สุด ด้วยเหตุนี้ จึงรวมถึงวิธีการคำนวณและอัปเดตน้ำหนักเป้าหมายโดยตรง ซึ่งแตกต่างจาก Fine-tuning ที่ต้องเตรียมชุดข้อมูลและรัน Gradient Descent ดังนั้น จุดเริ่มต้นในการพิจารณาคือ หากต้องการแก้ไขข้อเท็จจริงจำนวนน้อยให้ถูกต้องแม่นยำควรใช้ Model Editing แต่หากต้องการยกระดับพฤติกรรมโดยรวมของโมเดลควรใช้ Fine-tuning
ในตอนแรก มักมีความคิดที่ว่าข้อผิดพลาดของโมเดลนั้น "สามารถแก้ไขได้ด้วยการฝึกฝนใหม่ (re-training) ในเวอร์ชันถัดไป" อย่างไรก็ตาม เมื่อเริ่มนำไปใช้งานจริง กลับมีสถานการณ์ที่แนวคิดดังกล่าวไม่สามารถรับมือได้ทันเกิดขึ้นอย่างต่อเนื่อง ไม่ว่าจะเป็นชื่อองค์กรหรือระเบียบข้อบังคับที่มีการเปลี่ยนแปลงอยู่บ่อยครั้ง ข้อมูลที่ผิดพลาดหรืออาการหลอน (hallucination) ที่ถูกตรวจพบเป็นรายกรณี ไปจนถึงความจำเป็นที่ต้องลบข้อมูลเฉพาะเจาะจงออก "ทันที" เช่น กรณีคำร้องขอให้ลบข้อมูลส่วนบุคคล หากต้องรอการฝึกฝนใหม่ การตอบสนองจะล่าช้าและไม่คุ้มค่าใช้จ่าย ด้วยความต้องการจากหน้างานเหล่านี้ ทำให้ "การแก้ไขโมเดล" (model editing) ซึ่งสามารถแก้ไขความรู้เฉพาะส่วนได้อย่างรวดเร็วด้วยต้นทุนต่ำ จึงได้รับความสนใจมากขึ้น
เบื้องหลังของเรื่องนี้ยังรวมถึงการเปลี่ยนแปลงของสภาพแวดล้อมด้านกฎระเบียบด้วย โดยเริ่มจาก EU AI Act ที่มีผลบังคับใช้เต็มรูปแบบแล้ว ซึ่งกระแสที่เรียกร้องให้องค์กรมีความรับผิดชอบต่อผลลัพธ์ของ AI และการจัดการข้อมูลนั้นทวีความรุนแรงขึ้น ทำให้ "ความสามารถในการควบคุมความรู้ที่โมเดลถือครองอยู่" กลายเป็นข้อกำหนดด้านธรรมาภิบาล (governance) ไปโดยปริยาย ทั้งในแง่ของความสะดวกทางเทคนิคและความจำเป็นเชิงสถาบัน การแก้ไขโมเดลจึงถูกยกระดับขึ้นมาเป็นหัวข้อสำคัญในการปฏิบัติงานจริง
หากการแก้ไขโมเดล (Model Editing) คือ "การเขียนทับความรู้" Machine Unlearning ก็เป็นเทคโนโลยีที่มุ่งเน้นไปที่ "การลบข้อมูลที่เรียนรู้ไปแล้ว" แม้ทั้งสองจะมีส่วนที่คาบเกี่ยวกัน แต่มีจุดประสงค์ วิธีการประเมิน และความเกี่ยวข้องกับกฎระเบียบที่แตกต่างกัน ในที่นี้จะขอสรุปคำจำกัดความ เกณฑ์การเลือกใช้งาน และความสัมพันธ์ที่มีต่อ "สิทธิที่จะถูกลืม" (Right to be forgotten)
Machine Unlearning คือเทคโนโลยีที่ใช้ในการลบอิทธิพลของข้อมูลที่เคยใช้ในการเรียนรู้ออกไปจากโมเดล เพื่อให้โมเดลกลับไปอยู่ในสถานะที่ "เสมือนว่าไม่ได้เรียนรู้ข้อมูลนั้นมาตั้งแต่ต้น" โดยมีจุดประสงค์หลักอยู่ที่การกำจัดร่องรอยที่ข้อมูลเฉพาะเจาะจงทิ้งไว้ มากกว่าการแก้ไขความรู้โดยตรง ตัวอย่างเช่น ในกรณีที่ข้อมูลการเรียนรู้มีข้อมูลส่วนบุคคลของผู้ใช้หรือข้อความที่มีปัญหาด้านลิขสิทธิ์รวมอยู่ด้วย เทคโนโลยีนี้จะตอบโจทย์ความต้องการในการดึงเอาอิทธิพลของข้อมูลเหล่านั้นออกไปในภายหลัง
วิธีการดำเนินการแบ่งออกเป็นสองแนวทางหลัก ได้แก่ แนวทางแบบ "แม่นยำ" (Exact) ซึ่งใช้วิธีแบ่งข้อมูลออกเป็นส่วนๆ ในการเรียนรู้ แล้วทำการเรียนรู้ใหม่เฉพาะส่วนที่มีข้อมูลที่ต้องการลบออก และแนวทางแบบ "ประมาณการ" (Approximate) ซึ่งใช้วิธีการต่างๆ เช่น การปรับค่า Gradient ในทิศทางตรงกันข้ามเพื่อลบล้างอิทธิพลของข้อมูลเป้าหมาย แม้วิธีการแบบแม่นยำจะมีความน่าเชื่อถือสูงแต่ก็มีต้นทุนที่สูงตามไปด้วย ในขณะที่วิธีการแบบประมาณการจะมีน้ำหนักเบากว่าแต่ยากที่จะรับประกันความสมบูรณ์ของการลบข้อมูลได้ การเลือกว่าจะใช้วิธีใดจึงขึ้นอยู่กับระดับความแน่นอนที่ต้องการ
การเลือกใช้ทั้งสองวิธีขึ้นอยู่กับว่า "ต้องการบรรลุเป้าหมายใด" หากต้องการแก้ไขข้อเท็จจริงให้เป็นค่าที่ถูกต้อง ควรใช้ Model Editing แต่หากต้องการลบอิทธิพลของข้อมูลเฉพาะเจาะจงออกไป Machine Unlearning จะเหมาะสมกว่า
| มุมมอง | Model Editing | Machine Unlearning |
|---|---|---|
| วัตถุประสงค์หลัก | เขียนทับความรู้ให้เป็นค่าที่ถูกต้อง | ลบอิทธิพลของข้อมูลที่ใช้ฝึกสอน |
| กรณีการใช้งานทั่วไป | การแก้ไขข้อมูลผิดพลาด/ข้อเท็จจริงที่ล้าสมัย | การลบข้อมูลส่วนบุคคล/การกำจัดข้อมูลที่ละเมิดสิทธิ์ |
| จุดเน้นในการประเมิน | ความสำเร็จของผลลัพธ์และผลข้างเคียง | ความสมบูรณ์ของการลบและความเสี่ยงที่หลงเหลือ |
| ความสัมพันธ์กับกฎระเบียบ | ความถูกต้องของผลลัพธ์และความรับผิดชอบ | สิทธิในการถูกลืมและการคุ้มครองข้อมูล |
ในการปฏิบัติงานจริง มักมีการใช้ทั้งสองวิธีร่วมกัน ตัวอย่างเช่น ในกรณีที่เกี่ยวข้องกับข้อมูลส่วนบุคคล การดำเนินการแบบเป็นขั้นตอนโดยเริ่มจากการแก้ไขความรู้ดังกล่าวให้เป็นค่าที่ไม่เป็นอันตราย จากนั้นจึงพิจารณาลบร่องรอยการฝึกสอนออกไปถือเป็นแนวทางที่สมเหตุสมผล ไม่ควรคิดว่าวิธีใดวิธีหนึ่งจะเพียงพอ แต่ควรใช้เสริมกันตามวัตถุประสงค์ที่ต้องการ
「สิทธิที่จะถูกลืม」 (Right to be Forgotten) ถูกบัญญัติไว้เป็นสิทธิในการลบข้อมูลส่วนบุคคลตามคำร้องขอของเจ้าของข้อมูล เช่น สิทธิในการลบข้อมูล (Right to Erasure) ตามมาตรา 17 ของ GDPR นอกจากนี้ ข้อกำหนดในลักษณะเดียวกันยังแพร่หลายไปในกฎหมายคุ้มครองข้อมูลส่วนบุคคลของแต่ละประเทศ รวมถึง PDPA ของประเทศไทยด้วย (ความแตกต่างของแต่ละประเทศได้สรุปไว้ใน การเปรียบเทียบกฎหมายคุ้มครองข้อมูลส่วนบุคคล 4 ประเทศในอาเซียน) ปัญหาคือ แม้การลบเรคคอร์ดในฐานข้อมูลจะเป็นเรื่องง่าย แต่การลบข้อมูลที่หลอมรวมเข้าไปอยู่ในน้ำหนักของโมเดล (Model weights) ผ่านการเรียนรู้ไปแล้วนั้นเป็นเรื่องยากในทางเทคนิค นี่คือเหตุผลที่ Machine Unlearning ถูกคาดหวังให้เป็นทางออกในเชิงเทคนิค ยิ่งไปกว่านั้น ภายใต้กรอบการทำงานอย่าง EU AI Act ที่มีผลบังคับใช้เต็มรูปแบบแล้ว ซึ่งกำหนดให้องค์กรต้องมีความโปร่งใสและการจัดการความเสี่ยงของระบบ AI ความสำคัญของการอธิบายได้ว่า 「ข้อมูลที่ใช้ในการเรียนรู้มีอะไรบ้าง และจะควบคุมข้อมูลเหล่านั้นได้อย่างไร」 จึงเพิ่มสูงขึ้น การที่ฝ่ายกฎหมายและฝ่ายกำกับดูแล (Compliance) กับฝ่ายเทคนิคได้หารือและประสานงานกันล่วงหน้าเกี่ยวกับความเป็นไปได้ในการตอบสนองต่อคำร้องขอให้ลบข้อมูล จะเป็นทางลัดในการลดความเสี่ยงด้านการปฏิบัติตามกฎระเบียบได้
วิธีการแก้ไขโมเดลสามารถแบ่งออกเป็นสองประเภทหลัก ได้แก่ "การแก้ไขแบบเฉพาะจุด" (Local Editing) ซึ่งเป็นการคำนวณและเขียนทับค่าน้ำหนัก (weights) ของโมเดลโดยตรง และ "การแก้ไขแบบใช้เมตาเลิร์นนิง" (Meta-learning based) ซึ่งเป็นการสอนวิธีการแก้ไขให้กับโมเดลโดยเฉพาะ เนื่องจากทั้งสองวิธีต้องอาศัยการปรับเปลี่ยนค่าน้ำหนักของโมเดล จึงสามารถใช้ได้เฉพาะกับโมเดลแบบเปิด (Open-weight models) ที่เราสามารถเข้าถึงค่าน้ำหนักและนำมาใช้งานเองได้เท่านั้น การเลือกใช้วิธีการจะขึ้นอยู่กับปริมาณความรู้ที่ต้องการแก้ไขและความแม่นยำที่คาดหวัง ต่อไปเราจะมาดูวิธีการที่เป็นตัวแทนและมุมมองในการเปรียบเทียบแต่ละวิธีกัน
วิธีการแก้ไขแบบเฉพาะจุด (Local editing) คือแนวทางที่มุ่งระบุว่า "ข้อเท็จจริงหนึ่งๆ ถูกเก็บไว้ที่น้ำหนัก (weights) ส่วนใดของโมเดล" แล้วทำการแก้ไขเฉพาะจุดนั้นๆ โดยตรง วิธีที่เป็นตัวแทนของแนวทางนี้คือ ROME (Rank-One Model Editing) ซึ่งมองว่า MLP ในชั้นกลางของ Transformer เป็นหน่วยความจำแบบเชื่อมโยง (associative memory) ชนิดหนึ่ง ที่มีอินพุต (ประธาน) เป็นคีย์ และเอาต์พุต (ข้อเท็จจริง) เป็นค่า โดยจะใช้การวิเคราะห์เชิงสาเหตุเพื่อระบุว่าชั้นใดเป็นผู้รับผิดชอบต่อข้อเท็จจริงนั้นๆ จากนั้นจึงทำการอัปเดตน้ำหนักของชั้นดังกล่าวเพียงเล็กน้อยเพื่อให้ "เมื่อใส่คีย์เดิมเข้าไป จะได้ค่าใหม่ที่ต้องการ" เป็นการเขียนทับความรู้เดิม ส่วน MEMIT (Mass-Editing Memory in a Transformer) เป็นวิธีการที่ต่อยอดแนวคิดนี้ไปสู่การแก้ไขหลายชั้นและหลายพันรายการพร้อมกัน ซึ่งเปรียบเสมือนการสลับเปลี่ยนข้อมูลเฉพาะรายการในหน่วยความจำแบบเชื่อมโยง โดยมีข้อดีคือไม่ต้องส่งผลกระทบต่อโมเดลทั้งหมดเหมือนการเทรนใหม่ (re-training) อย่างไรก็ตาม หากไม่สามารถระบุตำแหน่งของข้อเท็จจริงได้อย่างถูกต้อง อาจส่งผลกระทบไปยังส่วนที่ไม่ต้องการได้ ดังนั้น ความแม่นยำในการระบุตำแหน่งที่จะแก้ไขจึงเป็นปัจจัยสำคัญที่กำหนดคุณภาพของผลลัพธ์
วิธีการแบบ Meta-learning จะให้เครือข่ายเสริมเรียนรู้กฎที่ว่า "จะแก้ไขน้ำหนัก (weights) อย่างไรโดยไม่ส่งผลกระทบเชิงลบต่อส่วนอื่น" ตัวอย่างที่สำคัญคือ MEND ซึ่งจะฝึกฝนเครือข่ายขนาดเล็ก (Editor) ไว้ล่วงหน้า เพื่อแปลงค่า Gradient ที่ได้จากกรณีที่ต้องการแก้ไขให้เป็นการอัปเดตน้ำหนักที่เหมาะสมสำหรับโมเดลหลัก ในการแก้ไขจริง Editor นี้จะส่งค่าการอัปเดตออกมาทันที จึงไม่จำเป็นต้องคำนวณใหม่ทั้งหมดทุกครั้ง ส่วน MALMEN เป็นวิธีการที่ต่อยอดแนวคิดนี้สำหรับการแก้ไขจำนวนมาก ทำให้สามารถประมวลผลการแก้ไขหลายรายการพร้อมกันได้อย่างมีประสิทธิภาพ ความแตกต่างที่สำคัญคือ ในขณะที่การแก้ไขแบบ Local จะเป็นการ "ออกแบบวิธีการแก้ไขด้วยมือ" แต่วิธีการแบบ Meta-learning คือการ "เรียนรู้วิธีการแก้ไขจากข้อมูล" แม้จะมีต้นทุนในการฝึกฝนล่วงหน้า แต่เมื่อเตรียมการเสร็จสิ้นแล้ว จะสามารถทำซ้ำการแก้ไขได้ง่าย และยิ่งมีขนาดการแก้ไขที่ใหญ่ขึ้นเท่าใด ก็ยิ่งแสดงประสิทธิภาพได้ดีขึ้นเท่านั้น
ในการเลือกวิธีการนั้น ประเด็นสำคัญคือการพิจารณาทั้งสามด้านควบคู่กันไป ได้แก่ ความแม่นยำในการแก้ไข, ผลข้างเคียง (การส่งผลกระทบไปยังความรู้ที่ไม่เกี่ยวข้อง) และต้นทุนในการดำเนินงาน
| มุมมอง | การแก้ไขเฉพาะจุด (ROME / MEMIT) | อิงตามเมตาเลิร์นนิง (MEND / MALMEN) |
|---|---|---|
| การเตรียมการล่วงหน้า | ไม่จำเป็นถึงน้อยมาก | จำเป็นต้องมีการฝึกสอน Editor ล่วงหน้า |
| การแก้ไขจำนวนน้อย | ทำได้ดี | ทำได้ แต่ต้นทุนการเตรียมการค่อนข้างสูง |
| การแก้ไขจำนวนมาก | รองรับด้วย MEMIT | รองรับด้วย MALMEN |
| การควบคุมผลข้างเคียง | ขึ้นอยู่กับความแม่นยำของการระบุตำแหน่ง | ขึ้นอยู่กับคุณภาพของการฝึกสอน |
ทุกวิธีการมีโจทย์ร่วมกันคือ "ในขณะที่ความรู้ที่แก้ไขนั้นถูกต้อง แต่จะเกิดผลข้างเคียงต่อความรู้โดยรอบหรือความสามารถในการสร้างข้อความหรือไม่" ดังนั้น ก่อนนำไปใช้งานจริง จำเป็นต้องมีขั้นตอนการประเมินว่านอกจากเป้าหมายที่แก้ไขแล้ว "ความรู้ที่เกี่ยวข้องที่ไม่ได้แก้ไข" ยังคงอยู่ครบถ้วนหรือไม่ ความเหนือกว่าของตัวเลขนั้นเปลี่ยนแปลงไปตามเกณฑ์มาตรฐาน (Benchmark) ที่เผยแพร่และโครงสร้างของโมเดล ดังนั้นการตรวจสอบกับโมเดลเป้าหมายของบริษัทตนเองจึงเป็นสิ่งที่ขาดไม่ได้
Model Editing และ Machine Unlearning อาจกลายเป็นวิธีการนำไปใช้จริงเพื่อตอบสนองต่อคำขอลบข้อมูลส่วนบุคคลและข้อกำหนดด้าน AI Governance โดยไม่ต้องพึ่งพาการเรียนรู้ใหม่ (Retraining) ซึ่งช่วยประหยัดต้นทุนได้ อย่างไรก็ตาม เทคโนโลยีเพียงอย่างเดียวไม่สามารถแก้ปัญหาได้ทั้งหมด จำเป็นต้องออกแบบควบคู่ไปกับขั้นตอนการทำงาน (Workflow) และระบบการประเมินผล โดยจะพิจารณาประเด็นสำคัญในการนำไปใช้จริงจาก 3 มุมมอง ดังนี้
การเตรียมพร้อมรับมือกับคำขอให้ลบข้อมูลส่วนบุคคล จำเป็นต้องกำหนดขั้นตอนการดำเนินงานที่ครอบคลุมทั้งก่อนและหลังการดำเนินการทางเทคนิค ดังนี้:
เนื่องจากวิธีการที่เหมาะสมที่สุดจะแตกต่างกันไปตามลักษณะของคำขอ การกำหนดเกณฑ์การตัดสินใจว่า "ในกรณีใดควรใช้วิธีใด" ไว้ในขั้นตอนการทำงาน จะช่วยลดความไม่สม่ำเสมอในการรับมือได้
「AI ของบริษัทสามารถแก้ไขหรือลบความรู้ที่ถือครองอยู่ได้ตามความจำเป็นหรือไม่」— ในมุมมองของ AI Governance การที่สามารถตอบคำถามนี้ได้กำลังกลายเป็นสิ่งที่ถูกตั้งคำถาม EU AI Act ซึ่งมีผลบังคับใช้เต็มรูปแบบแล้ว ได้กำหนดให้ AI ที่มีการใช้งานที่มีความเสี่ยงสูงต้องมีความโปร่งใส มีการจัดการข้อมูล และมีกลไกในการลดความเสี่ยง ซึ่งทำให้การปล่อยให้โมเดลแสดงข้อมูลที่ผิดพลาดหรือไม่เหมาะสมอย่างต่อเนื่องเป็นสิ่งที่ยอมรับได้ยากขึ้นเรื่อยๆ Model Editing และ Machine Unlearning อาจกลายเป็นวิธีการที่เป็นรูปธรรมในการแสดงให้เห็นว่า "สามารถควบคุมผลลัพธ์ได้" และ "สามารถตอบสนองต่อคำขอให้ลบข้อมูลได้ทางเทคนิค" เพื่อรองรับข้อกำหนดเหล่านี้ สิ่งสำคัญคือการไม่มองว่าสิ่งเหล่านี้เป็นเพียงเครื่องมือแก้ไขปัญหาเฉพาะหน้า แต่ต้องวางตำแหน่งให้เป็นส่วนหนึ่งของระบบธรรมาภิบาล ใครเป็นผู้ตัดสินใจแก้ไขตามเกณฑ์ใด บันทึกไว้อย่างไร และตรวจสอบอย่างไร— เทคโนโลยีจะทำหน้าที่เป็นเครื่องยืนยันการปฏิบัติตามกฎระเบียบได้ก็ต่อเมื่อมีการออกแบบรวมไปถึงกฎเกณฑ์ในการดำเนินงานด้วย สำหรับภาพรวมของการสร้างระบบ สามารถอ้างอิงได้จาก คู่มือการสร้างระบบ AI Governance สำหรับบริษัทที่ขยายธุรกิจสู่ ASEAN
เมื่อพูดถึงมาตรการรับมือกับอาการประสาทหลอน (Hallucination) วิธีแรกที่มักถูกหยิบยกมาคือการใช้ Retrieval-Augmented Generation (RAG) เพื่อป้อนข้อมูลที่ถูกต้องให้กับโมเดล (สามารถดูรายละเอียดจุดสำคัญในการนำไปใช้งานได้ที่ วิธีเพิ่มความแม่นยำของ RAG) อย่างไรก็ตาม หากตัวโมเดลเองมีความจำที่ฝังใจในข้อมูลที่เป็นเท็จอย่างรุนแรง การป้อนข้อมูลที่ถูกต้องจากภายนอกเข้าไปก็อาจถูกความรู้เดิมที่ผิดพลาดฉุดรั้งไว้ได้ ในจุดนี้เองที่ Model Editing จะเข้ามามีบทบาทเสริม หากเราแก้ไขข้อมูลที่เป็นเท็จเฉพาะจุดให้เป็นค่าที่ถูกต้องในระดับความรู้ภายในของโมเดลได้ ก็จะช่วยลดการเกิดข้อผิดพลาดซ้ำได้โดยไม่ต้องพึ่งพาการค้นหาเพียงอย่างเดียว
อย่างไรก็ตาม การพยายามกำจัดอาการประสาทหลอนทั้งหมดด้วยการแก้ไขโมเดลนั้นไม่ใช่เรื่องที่ทำได้จริง ในส่วนของข้อมูลที่มีการเปลี่ยนแปลงบ่อยครั้ง การใช้ RAG เพื่ออ้างอิงข้อมูลล่าสุดจากภายนอกถือว่าเหมาะสมกว่า ส่วนข้อมูลที่เป็นข้อเท็จจริงคงที่แต่โมเดลมักจะจำผิดซ้ำๆ การใช้ Model Editing เพื่อแก้ไขโดยตรงจะเป็นวิธีที่มีประสิทธิภาพมากกว่า การแบ่งหน้าที่เช่นนี้จึงเป็นแนวทางที่ได้ผลดี การแก้ไขโมเดลเป็นเพียงวิธีการที่ใช้จัดการกับ "ข้อผิดพลาดคงที่ในความรู้ภายใน" เท่านั้น ซึ่งไม่ใช่สิ่งที่ต้องเลือกอย่างใดอย่างหนึ่งแทนที่ RAG แต่การนำมาใช้ร่วมกันจะช่วยยกระดับความแม่นยำโดยรวมของมาตรการรับมือกับอาการประสาทหลอนให้สูงขึ้นได้
การแก้ไขโมเดล (Model Editing) และ Machine Unlearning ไม่ใช่ทางแก้ครอบจักรวาล และความเข้าใจที่ว่า "แก้ไขเพียงครั้งเดียวแล้วจะหายขาดหรือถูกต้องสมบูรณ์" นั้นเป็นเรื่องที่ผิด หากนำไปใช้โดยไม่ประเมินความเสี่ยงที่ยังหลงเหลืออยู่หรือผลข้างเคียงให้ถูกต้อง การทำไปโดย "คิดว่า" แก้ไขแล้วจะเป็นสิ่งที่อันตรายที่สุด ต่อไปนี้คือความเข้าใจผิดที่พบบ่อยสองประการ
การคิดว่า "ข้อมูลที่ลบไปแล้วจะไม่มีวันกลับมาอีก" เป็นความคิดที่เสี่ยง โดยเฉพาะอย่างยิ่งใน Machine Unlearning แบบประมาณการ (approximate) การลดอิทธิพลของข้อมูลเป้าหมายไม่ได้หมายความว่าร่องรอยจะหายไปอย่างสมบูรณ์เสมอไป มีการชี้ให้เห็นว่าเนื้อหาที่ควรจะถูกลบไปแล้วอาจถูกกู้คืนกลับมาได้บางส่วนผ่านวิธีการตั้งคำถามที่แยบยลหรือการคาดเดาจากข้อมูลที่เกี่ยวข้อง ซึ่งเป็นผลมาจากความรู้ไม่ได้ถูกเก็บไว้ในจุดเดียว แต่กระจายตัวอยู่ภายในโมเดล ดังนั้น ในทางปฏิบัติ มุมมองเชิงความน่าจะเป็นที่ว่า "ลดความเสี่ยงลงได้มากน้อยเพียงใด" แทนที่จะเป็น "ลบออกไปได้แล้ว" จึงเป็นสิ่งที่ขาดไม่ได้ ในการตรวจสอบ ไม่เพียงแต่ต้องยืนยันว่าข้อมูลไม่ปรากฏออกมาด้วยคำถามง่ายๆ เท่านั้น แต่ยังต้องประเมินระดับของข้อมูลที่หลงเหลืออยู่โดยใช้การเรียบเรียงคำใหม่หรือข้อมูลโดยรอบประกอบด้วย หากให้ความสำคัญกับความแน่นอนเป็นอันดับแรก การตัดสินใจเลือกใช้วิธีที่เข้มงวดซึ่งรวมถึงการฝึกฝนโมเดลใหม่ (retraining) แม้จะมีต้นทุนสูงกว่า ก็อาจเป็นทางเลือกที่เหมาะสม
การแก้ไขไม่ได้จำกัดอยู่เพียงแค่ข้อเท็จจริงที่เป็นเป้าหมายเท่านั้น แต่อาจส่งผลกระทบไปถึงความรู้ที่เกี่ยวข้องด้วย ตัวอย่างเช่น เมื่อแก้ไขสังกัดของบุคคลหนึ่ง คำตอบสำหรับคำถามอื่นที่เกี่ยวข้องกับบุคคลนั้นอาจเกิดความไม่เสถียรตามไปด้วย ซึ่งเป็นผลกระทบต่อเนื่องที่เกิดขึ้นเนื่องจากความรู้ภายในโมเดลมีความเชื่อมโยงกัน ในตอนแรกเรามักจะคิดว่า "แค่แก้ไขจุดเดียวก็พอ" แต่ในความเป็นจริง ควรพิจารณาว่าการตรวจสอบว่า "สิ่งที่อยู่รอบๆ จุดที่แก้ไขนั้นยังคงถูกต้องหรือไม่" เป็นส่วนหนึ่งของงานด้วย
เพื่อลดผลกระทบต่อเนื่อง (Ripple effect) การจำกัดขอบเขตของสิ่งที่แก้ไขให้เหลือน้อยที่สุดเท่าที่จำเป็น และการตรวจสอบพฤติกรรมของโมเดลด้วยชุดทดสอบที่ครอบคลุมความรู้ที่เกี่ยวข้องหลังการแก้ไขถือเป็นวิธีที่มีประสิทธิภาพ นอกจากนี้ ในกรณีที่ต้องการใช้การแก้ไขจำนวนมากพร้อมกัน อาจเกิดการแทรกแซงกันเองระหว่างการแก้ไขจนทำให้คุณภาพลดลงได้ ดังนั้น การแบ่งจำนวนการแก้ไขออกเป็นขั้นตอนและทำการประเมินในแต่ละขั้นตอนจึงเป็นแนวทางที่ปลอดภัยกว่า ควรมีแนวคิดในการจัดการโดยกำหนดขอบเขตที่ยอมรับได้ โดยตั้งอยู่บนสมมติฐานที่ว่าผลข้างเคียงไม่สามารถทำให้เป็นศูนย์ได้
ก้าวแรกไม่ใช่การเลือกใช้วิธีการขั้นสูง แต่คือการทำให้ Use case ชัดเจนว่า "ต้องการแก้ไขความรู้ใด เพราะเหตุใด และด้วยความมั่นใจระดับใด" เมื่อกำหนดวัตถุประสงค์ได้แล้ว วิธีการที่จำเป็นและวิธีการประเมินก็จะถูกจำกัดให้แคบลงโดยอัตโนมัติ ต่อไปนี้คือแนวทางการเริ่มต้นโดยการทดสอบจากจุดเล็กๆ
สิ่งแรกที่ควรทำคือการระบุสถานการณ์ภายในองค์กรที่ต้องการ "แก้ไขหรือลบความรู้" ออก และจัดลำดับความสำคัญ ตัวอย่างเช่น การแก้ไขข้อเท็จจริงที่มีการเปลี่ยนแปลงบ่อย การตอบสนองต่อคำขอให้ลบข้อมูลส่วนบุคคล หรือการแก้ไขอาการประสาทหลอน (Hallucination) แบบคงที่ที่เกิดขึ้นซ้ำๆ ซึ่งวิธีการที่เหมาะสมจะแตกต่างกันไปตามวัตถุประสงค์ โดยมีเกณฑ์การตัดสินใจที่เรียบง่าย 3 ประการคือ "ต้องการแก้ไขให้เป็นค่าที่ถูกต้อง หรือต้องการลบผลกระทบออก", "เป็นจำนวนน้อยหรือจำนวนมาก" และ "ต้องการความแน่นอนระดับไหน" หากเป็นข้อเท็จจริงเฉพาะจุดที่ต้องการเพียงแค่ให้ผลลัพธ์ถูกต้อง ก็อาจเริ่มจากการประยุกต์ใช้ Model Editing ในระดับเล็ก แต่หากเป็นข้อมูลส่วนบุคคลที่ต้องคำนึงถึงความถูกต้องแม่นยำเพื่อรองรับกฎระเบียบ ก็ควรเริ่มจากการพิจารณาวิธีการที่เข้มงวดกว่า
การพยายามจัดการทุกอย่างพร้อมกันจะทำให้การประเมินผลล้มเหลว ดังนั้นจึงควรเลือกกรณีการใช้งาน (Use case) เพียงหนึ่งกรณีที่มีผลกระทบสูงและตรวจสอบได้ง่าย เพื่อประเมินผลดีและผลข้างเคียงก่อนที่จะขยายผลออกไปในวงกว้าง การเลือกเป้าหมายแรกเริ่มจะเป็นรากฐานสำคัญสำหรับการออกแบบการดำเนินงานในอนาคต
โดยพื้นฐานแล้ว วิธีการเหล่านี้สามารถใช้ได้กับโมเดลแบบ Open-weights ที่สามารถดาวน์โหลดน้ำหนัก (weights) มาใช้งานในเครื่องได้เท่านั้น (เช่น Llama, Mistral, Qwen, Gemma หรือโมเดลบางส่วนของ OpenAI ที่เปิดเผยน้ำหนัก) ส่วนโมเดลแบบปิด (Closed models) เช่น Claude หรือ API ของ GPT และ Gemini นั้น ไม่สามารถเข้าถึงน้ำหนักจากภายนอกได้ จึงไม่สามารถนำมาแก้ไขด้วยวิธีนี้ได้ สำหรับโมเดลแบบปิดเหล่านี้ การปรับปรุงความรู้จะทำได้ผ่านการใช้ RAG, System Prompt หรือฟังก์ชัน Fine-tuning ที่ผู้ให้บริการจัดเตรียมไว้ให้
สำหรับการเลือกเครื่องมือ เฟรมเวิร์กแบบ Open-source อย่าง EasyEdit ซึ่งรวบรวมวิธีการแก้ไขโมเดลต่างๆ ไว้ให้ทดลองใช้ ถือเป็นจุดเริ่มต้นที่ดีสำหรับการทดสอบในระดับเล็ก เนื่องจากสามารถเปรียบเทียบ ROME, MEMIT, MEND และวิธีอื่นๆ ภายใต้กรอบการทำงานเดียวกันได้
สิ่งที่สำคัญยิ่งกว่าเครื่องมือคือการออกแบบตัวชี้วัด (Evaluation metrics) โดยพื้นฐานแล้ว คุณภาพของการแก้ไขโมเดลจะวัดจาก 3 ปัจจัยหลัก ได้แก่ ความรู้ที่ต้องการถูกแก้ไขจริงหรือไม่ (Reliability), คำตอบยังคงมีความสอดคล้องแม้จะเปลี่ยนรูปแบบการถามหรือไม่ (Generalization) และความรู้หรือความสามารถในการสร้างข้อความที่ไม่เกี่ยวข้องกับการแก้ไขยังคงอยู่ครบถ้วนหรือไม่ (Locality) การเตรียมชุดข้อมูลสำหรับประเมินผลที่สอดคล้องกับโมเดลและกรณีการใช้งาน (Use case) ขององค์กร รวมถึงการวัดผลเหล่านี้ในทุกครั้ง ถือเป็นเงื่อนไขสำคัญก่อนที่จะนำไปใช้งานจริงอย่างปลอดภัย
Q. ควรเลือกใช้ Model Editing หรือ Fine-tuning ดี? หากต้องการแก้ไขข้อเท็จจริงจำนวนน้อยให้ถูกต้องแม่นยำ ควรเลือกใช้ Model Editing แต่หากต้องการปรับเปลี่ยนพฤติกรรมโดยรวมของโมเดล เช่น รูปแบบการเขียน (Style) หรือการปรับให้เข้ากับโดเมนเฉพาะ (Domain Adaptation) ควรเลือกใช้ Fine-tuning ทั้งสองวิธีนี้ไม่ได้แยกขาดจากกัน โดยหลักการแล้วควรเลือกใช้ตามวัตถุประสงค์ที่แตกต่างกัน
Q. การใช้ Machine Unlearning สามารถลบข้อมูลการเรียนรู้ได้อย่างสมบูรณ์หรือไม่? ไม่สามารถรับประกันการลบข้อมูลได้อย่างสมบูรณ์ โดยเฉพาะในวิธีแบบประมาณการ (Approximate methods) ที่อาจยังหลงเหลือร่องรอยอยู่ ดังนั้นการประเมินจึงควรเน้นที่ "สามารถลดความเสี่ยงได้มากน้อยเพียงใด" แทนที่จะมองว่า "ลบออกไปได้แล้ว" หากต้องการความแน่นอนสูงสุด จำเป็นต้องพิจารณาวิธีการที่เข้มงวดซึ่งรวมถึงการเรียนรู้ใหม่ (Retraining)
Q. เทคโนโลยีนี้พร้อมใช้งานสำหรับการรองรับ PDPA หรือสิทธิในการถูกลืม (Right to be Forgotten) แล้วหรือยัง? แม้เทคโนโลยีจะเริ่มเข้าสู่ขั้นตอนการใช้งานจริงแล้ว แต่ก็ไม่สามารถใช้เพื่อรองรับกฎระเบียบได้โดยลำพังเพียงอย่างเดียว การจะนำมาใช้เป็นหลักฐานรองรับการปฏิบัติตามกฎหมายได้นั้น จำเป็นต้องมีการจัดเตรียมกระบวนการทำงานตั้งแต่การรับคำร้องขอให้ลบข้อมูล ไปจนถึงการตรวจสอบและบันทึกผล รวมถึงระบบการประเมินเพื่อวัดผลกระทบข้างเคียงควบคู่ไปด้วย
Yusuke Ishihara
เริ่มเขียนโปรแกรมตั้งแต่อายุ 13 ปี ด้วย MSX หลังจบการศึกษาจากมหาวิทยาลัย Musashi ได้ทำงานพัฒนาระบบขนาดใหญ่ รวมถึงระบบหลักของสายการบิน และโครงสร้าง Windows Server Hosting/VPS แห่งแรกของญี่ปุ่น ร่วมก่อตั้ง Site Engine Inc. ในปี 2008 ก่อตั้ง Unimon Inc. ในปี 2010 และ Enison Inc. ในปี 2025 นำทีมพัฒนาระบบธุรกิจ การประมวลผลภาษาธรรมชาติ และแพลตฟอร์ม ปัจจุบันมุ่งเน้นการพัฒนาผลิตภัณฑ์และการส่งเสริม AI/DX โดยใช้ generative AI และ Large Language Models (LLM)