ปัญญาประดิษฐ์ (AI) ที่ทำงานโดยการเรียนรู้จากความผิดพลาด

ปัญญาประดิษฐ์ (AI) ที่ทำงานโดยการเรียนรู้จากความผิดพลาด

04 มีนาคม 2564
ภาพถ่ายโดย JESHOOTS.com จาก Pexelsz

การพัฒนาโปรแกรมคอมพิวเตอร์เพื่อแข่งขันกับมนุษย์ในการแข่งขันหมากรุกถูกพัฒนามาอย่างต่อเนื่อง จนปัจจุบันแม้กระทั่งในโทรศัพท์สมาร์ทโฟนทั่วไปก็สามารถเล่นหมากรุกได้ แต่มีโปรแกรมปัญญาประดิษฐ์หนึ่งที่กำลังพัฒนาโดยการเรียนรู้จากการเดินหมากรุกที่ผิดพลาดของมนุษย์

โปรแกรมหมากรุกปัญญาประดิษฐ์นี้เป็นที่รู้จักในนาม Maia ซึ่งมีปัญญาประดิษฐ์ล้ำยุค (cutting-edge AI) ทำงานอยู่เบื้องหลัง โดยโปรแกรมหมากรุกปัญญาประดิษฐ์นี้แทนที่จะเรียนรู้การเอาชนะคู่ต่อสู้ในกระดานการแข่งขัน Maia กลับให้ความสนใจกับการพยากรณ์รูปแบบการเดินหมากของมนุษย์ รวมถึงศึกษารูปแบบการเดินหมากที่ผิดพลาดของมนุษย์ด้วย

Jon Kleinberg ศาสตราจารย์จากมหาวิทยาลัยคอร์เนล ซึ่งเป็นผู้นำการพัฒนา Maia กล่าวว่าการพัฒนาปัญญาประดิษฐ์โดยเรียนรู้จากความผิดพลาดของมนุษย์ จะทำให้เกิดการปฏิสัมพันธ์กับมนุษย์ที่ดีขึ้น ผ่านการสอนหรือช่วยเหลือมนุษย์ หรือแม้กระทั่งการเจรจาต่อรองกับมนุษย์ โดยยกตัวอย่างระบบที่สามารถพยากรณ์ความผิดพลาด อาจถูกนำมาใช้ฝึกแพทย์ในการอ่านภาพถ่ายทางการแพทย์ โดยนำองค์ความรู้ที่แพทย์ (ที่เป็นมนุษย์) ทำการวินิจฉัยภาพถ่ายทางการแพทย์ มาศึกษาเปรียบเทียบกับที่ระบบพยากรณ์

Kleinberg กล่าวต่อว่าที่ให้ความสนใจไปที่หมากรุก เพราะว่าโปรแกรมปัญญาประดิษฐ์ในการเดินหมากรุกเป็นหนึ่งในโปรแกรมคอมพิวเตอร์ที่ความชาญฉลาดของเครื่องจักร (machine intelligence) มีชัยเหนือมนุษย์ ทั้งยังเป็นระบบที่เหมาะสมสำหรับการทดลองอัลกอริทึม และเป็นต้นแบบทางด้านความโดดเด่นของปัญญาประดิษฐ์ (AI dominance)

Maia ถูกพัฒนาโดยดัดแปลงโปรแกรมมาจาก Leelo Zero ซึ่งเป็นโอเพนซอร์สโคลน (open source clone) ของ AlphaZero โปรแกรมปัญญาประดิษฐ์ที่ปฏิวัติวงการ ซึ่งถูกพัฒนาโดย Alphabet ซึ่งเป็นบริษัทลูกของ Deepmind

https://www.chess.com/article/view/how-does-alphazero-play-chess

AlphaZero แตกต่างจากโปรแกรมหมากรุกปัญญาประดิษฐ์ทั่วไป โดยมีการศึกษารูปแบบเดินหมากอย่างอิสระจากคำสั่งของมนุษย์ ภายในโปรแกรม AlphaZero จะมีโครงข่ายประสาทจำลอง (simulated neural network) ซึ่งประกอบด้วยเซลล์ประสาทเสมือนจริงที่สามารถปรับให้ตอบสนองต่อปัจจัยนำเข้า (input)  สำหรับหมากรุกนั้น AlphaZero ได้รับการป้อนข้อมูลตำแหน่งของกระดานและรูปแบบการเดินหมากที่สร้างขึ้นในเกมการฝึกหัดแข่งขัน และปรับค่าการส่งสัญญาณประสาทเพื่อเลือกรูปแบบการเดินหมากที่จะชนะ ซึ่งกระบวนการนี้เป็นที่รู้จักในชื่อว่าการเรียนรู้แบบเสริมกำลัง (reinforcement learning)  AlphaZero สามารถใช้กระบวนการเดียวกันนี้เรียนรู้วิธีการเล่นเกมส์กระดานอื่น ๆ เช่น หมากฮอส หรือหมากล้อมแบบกระดานเล็ก

ทีมผู้พัฒนาจากมหาวิทยาลัยคอร์เนลได้ปรับแต่งโปรแกรมของ Leelo Zero เพื่อสร้างโปรแกรมที่เรียนรู้โดยสนับสนุนการคาดการณ์รูปแบบการเดินหมากของมนุษย์ที่แม่นยำ ขณะที่โปรแกรมปัญญาประดิษฐ์หมากรุกอื่น ๆ (รวมถึง DeepBlue ของบริษัทไอบีเอ็ม ที่พ่ายแพ้ให้กับแชมป์โลก Garry Kasparov ในปี 2540) พยายามวางแผนการแข่งขันด้วยการสำรวจรูปแบบการเดินหมากที่เป็นไปได้ทั้งหมด  แต่ Maia มุ่งเน้นไปที่การค้นหารูปแบบการเดินหมากที่เป็นไปได้มากที่สุดที่มนุษย์จะเลือกใช้ในการเล่น

Maia ได้รับการสอนด้วยข้อมูลจาก Lichess เว็บไซต์เล่นหมากรุกที่ได้รับความนิยม ผลลัพธ์ที่ได้คือโปรแกรมหมากรุกสามารถเล่นหมากรุกในรูปแบบที่คล้ายมนุษย์มากขึ้น Maia ได้รับการพัฒนาเป็นหลายเวอร์ชั่นตามความแข็งแกร่งในการเล่นที่ต่างกัน โดยสามารถท้าทายแข่งขันในตอนนี้ได้แล้วที่เว็บไซต์ Lichess

รูปแบบที่ซับซ้อนมากขึ้นของปัญญาประดิษฐ์อาจจะแซงหน้าความฉลาดของมนุษย์ในทุกสาขาตั้งแต่สาขาคณิตศาสตร์จนถึงสาขาวรรณกรรมและอื่น ๆ  แต่ถึงกระนั้น Kleinberg กล่าวว่า “จะมีช่วงเวลาการเปลี่ยนผ่านซึ่งมนุษย์และปัญญาประดิษฐ์จะทำงานร่วมกัน และจะมีการสื่อสารระหว่างกัน”

ปัญญาประดิษฐ์ที่สามารถคาดการณ์และเลียนแบบพฤติกรรมของมนุษย์ สามารถนำไปใช้งานได้ทันทีทั้งในเกมหมากรุกและเกมอื่น ๆ  Matthew Sadler ปรมาจารย์ด้านหมากรุกชาวอังกฤษ และผู้เขียนหนังสือ GAME CHANGER (ซึ่งเป็นหนังสือเกี่ยวกับความสามารถในการเล่นหมากรุกของ AlphaZero) กล่าวว่า “เป็นความคิดที่ดี” และ “มีความต้องการอย่างมากที่ผู้เล่นอยากจะมีเครื่องมือที่สามารถพูดภาษาของพวกเขาได้”

Sadler กล่าวว่า Maia อาจจะมีประโยชน์สำหรับการฝึกฝนและฝึกซ้อม นอกจากนี้ Maia ได้รับการฝึกฝนให้สามารถคาดการณ์รูปแบบการเดินหมากของผู้เล่นคนใดคนหนึ่งโดยเฉพาะ

“ลองจินตนาการว่าคุณกำลังเตรียมตัวสำหรับเกมส์หมากรุกชิงแชมป์โลกเพื่อแข่งกับ Magus Carlsen และคุณมีเครื่องมือที่เดินหมากได้เหมือนกับ Magus”

Matthew Sadler ปรมาจารย์ด้านหมากรุกชาวอังกฤษ และผู้เขียนหนังสือ GAME CHANGER

นอกเหนือจากเกมแล้วโปรแกรมปัญญาประดิษฐ์ที่สามารถเข้าถึงพฤติกรรมของมนุษย์อาจช่วยเป็นกลยุทธ์ในการเจรจา หรือการสร้างโปรแกรมและหุ่นยนต์ ที่สามารถคาดการณ์สิ่งที่ผู้ร่วมงานที่เป็นมนุษย์กำลังจะทำ

Julie Shah ผู้ช่วยศาสตราจารย์มหาวิทยาลัยเอ็มไอที ผู้ศึกษาทางด้านปฏิสัมพันธ์และการทำงานร่วมกันระหว่างมนุษย์และเครื่องจักร กล่าวว่า “คำถามที่พวกเขาถามว่าวิธีการนี้คาดการณ์สมรรถภาพของมนุษย์ได้ดีเพียงใดนั้นเป็นคำถามที่น่าสนใจ” Shah ตั้งข้อสังเกตว่าควรที่จะตรวจสอบ (examine) กระบวนการนี้ว่าสามารถสร้างแนวทางที่เหนือกว่าสำหรับมนุษย์และเครื่องจักรในการทำงานร่วมกัน

Matthias Sollner ศาสตร์จารย์มหาวิทยาลัยคาสเซล (Kassel) ประเทศเยอรมนี ผู้ทำการศึกษาว่าปัญญาประดิษฐ์สามารถช่วยพนักงานทำงานได้อย่างไร กล่าวว่ามีความสำคัญเป็นอย่างยิ่งที่ระบบดังกล่าวมีพฤติกรรมเหมือนมนุษย์มากขึ้น แต่อาจจะสำคัญกว่าสำหรับมนุษย์ที่จะต้องทำความเข้าใจการทำงานของระบบปัญญาประดิษฐ์ หากระบบทำงานไม่ดีและไม่ชัดเจนว่าเกิดจากสาเหตุใด เขากล่าวว่า “มันอาจส่งผลเสียต่อการยอมรับระบบปัญญาประดิษฐ์ดังกล่าว”

ที่มา: https://www.wired.com/story/new-artificial-intelligence-mistakes-purpose-chess/

แบ่งปันบทความ

กลุ่มเนื้อหา

แท็กยอดนิยม

แจ้งเรื่องที่อยากอ่าน

คุณสามารถแจ้งเรื่องที่อยากอ่านให้เราทราบได้ !
และเราจะนำไปพัฒนาบทความให้มีเนื้อหาที่น่าสนใจมากขึ้น

ไอคอน PDPA

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ “นโยบายคุ้กกี้” และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ “ตั้งค่า”

ตั้งค่าความเป็นส่วนตัว

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

ยอมรับทั้งหมด
จัดการความเป็นส่วนตัว
  • คุกกี้ที่มีความจำเป็น (Strictly Necessary Cookies)
    เปิดใช้งานตลอด

    คุกกี้ประเภทนี้มีความจำเป็นต่อการให้บริการเว็บไซต์ของ สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล เพื่อให้ท่านสามารถเข้าใช้งานในส่วนต่าง ๆ ของเว็บไซต์ได้ รวมถึงช่วยจดจำข้อมูลที่ท่านเคยให้ไว้ผ่านเว็บไซต์ การปิดการใช้งานคุกกี้ประเภทนี้จะส่งผลให้ท่านไม่สามารถใช้บริการในสาระสำคัญของ สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล ซึ่งจำเป็นต้องเรียกใช้คุกกี้ได้
    รายละเอียดคุกกี้

  • คุกกี้เพื่อการวิเคราะห์และประเมินผลการใช้งาน (Performance Cookies)

    คุกกี้ประเภทนี้ช่วยให้ BDI ทราบถึงการปฏิสัมพันธ์ของผู้ใช้งานในการใช้บริการเว็บไซต์ของ BDI รวมถึงหน้าเพจหรือพื้นที่ใดของเว็บไซต์ที่ได้รับความนิยม ตลอดจนการวิเคราะห์ข้อมูลด้านอื่น ๆ BDI ยังใช้ข้อมูลนี้เพื่อการปรับปรุงการทำงานของเว็บไซต์ และเพื่อเข้าใจพฤติกรรมของผู้ใช้งานมากขึ้น ถึงแม้ว่า ข้อมูลที่คุกกี้นี้เก็บรวบรวมจะเป็นข้อมูลที่ไม่สามารถระบุตัวตนได้ และนำมาใช้วิเคราะห์ทางสถิติเท่านั้น การปิดการใช้งานคุกกี้ประเภทนี้จะส่งผลให้ BDI ไม่สามารถทราบปริมาณผู้เข้าเยี่ยมชมเว็บไซต์ และไม่สามารถประเมินคุณภาพการให้บริการได้

  • คุกกี้เพื่อการใช้งานเว็บไซต์ (Functional Cookies)

    คุกกี้ประเภทนี้จะช่วยให้เว็บไซต์ของ BDI จดจำตัวเลือกต่าง ๆ ที่ท่านได้ตั้งค่าไว้และช่วยให้เว็บไซต์ส่งมอบคุณสมบัติและเนื้อหาเพิ่มเติมให้ตรงกับการใช้งานของท่านได้ เช่น ช่วยจดจำชื่อบัญชีผู้ใช้งานของท่าน หรือจดจำการเปลี่ยนแปลงการตั้งค่าขนาดฟอนต์หรือการตั้งค่าต่าง ๆ ของหน้าเพจซึ่งท่านสามารถปรับแต่งได้ การปิดการใช้งานคุกกี้ประเภทนี้อาจส่งผลให้เว็บไซต์ไม่สามารถทำงานได้อย่างสมบูรณ์

  • คุกกี้เพื่อการโฆษณาไปยังกลุ่มเป้าหมาย (Targeting Cookies)

    คุกกี้ประเภทนี้เป็นคุกกี้ที่เกิดจากการเชื่อมโยงเว็บไซต์ของบุคคลที่สาม ซึ่งเก็บข้อมูลการเข้าใช้งานและเว็บไซต์ที่ท่านได้เข้าเยี่ยมชม เพื่อนำเสนอสินค้าหรือบริการบนเว็บไซต์อื่นที่ไม่ใช่เว็บไซต์ของ BDI ทั้งนี้ หากท่านปิดการใช้งานคุกกี้ประเภทนี้จะไม่ส่งผลต่อการใช้งานเว็บไซต์ของ BDI แต่จะส่งผลให้การนำเสนอสินค้าหรือบริการบนเว็บไซต์อื่น ๆ ไม่สอดคล้องกับความสนใจของท่าน

บันทึกการตั้งค่า
ไซต์นี้ลงทะเบียนกับ wpml.org ในฐานะไซต์พัฒนา สลับไปยังไซต์การผลิตโดยใช้รหัส remove this banner.