ปัญญาประดิษฐ์ (AI) ที่ทำงานโดยการเรียนรู้จากความผิดพลาด

ปัญญาประดิษฐ์ (AI) ที่ทำงานโดยการเรียนรู้จากความผิดพลาด

04 March 2021
ภาพถ่ายโดย JESHOOTS.com จาก Pexelsz

การพัฒนาโปรแกรมคอมพิวเตอร์เพื่อแข่งขันกับมนุษย์ในการแข่งขันหมากรุกถูกพัฒนามาอย่างต่อเนื่อง จนปัจจุบันแม้กระทั่งในโทรศัพท์สมาร์ทโฟนทั่วไปก็สามารถเล่นหมากรุกได้ แต่มีโปรแกรมปัญญาประดิษฐ์หนึ่งที่กำลังพัฒนาโดยการเรียนรู้จากการเดินหมากรุกที่ผิดพลาดของมนุษย์

โปรแกรมหมากรุกปัญญาประดิษฐ์นี้เป็นที่รู้จักในนาม Maia ซึ่งมีปัญญาประดิษฐ์ล้ำยุค (cutting-edge AI) ทำงานอยู่เบื้องหลัง โดยโปรแกรมหมากรุกปัญญาประดิษฐ์นี้แทนที่จะเรียนรู้การเอาชนะคู่ต่อสู้ในกระดานการแข่งขัน Maia กลับให้ความสนใจกับการพยากรณ์รูปแบบการเดินหมากของมนุษย์ รวมถึงศึกษารูปแบบการเดินหมากที่ผิดพลาดของมนุษย์ด้วย

Jon Kleinberg ศาสตราจารย์จากมหาวิทยาลัยคอร์เนล ซึ่งเป็นผู้นำการพัฒนา Maia กล่าวว่าการพัฒนาปัญญาประดิษฐ์โดยเรียนรู้จากความผิดพลาดของมนุษย์ จะทำให้เกิดการปฏิสัมพันธ์กับมนุษย์ที่ดีขึ้น ผ่านการสอนหรือช่วยเหลือมนุษย์ หรือแม้กระทั่งการเจรจาต่อรองกับมนุษย์ โดยยกตัวอย่างระบบที่สามารถพยากรณ์ความผิดพลาด อาจถูกนำมาใช้ฝึกแพทย์ในการอ่านภาพถ่ายทางการแพทย์ โดยนำองค์ความรู้ที่แพทย์ (ที่เป็นมนุษย์) ทำการวินิจฉัยภาพถ่ายทางการแพทย์ มาศึกษาเปรียบเทียบกับที่ระบบพยากรณ์

Kleinberg กล่าวต่อว่าที่ให้ความสนใจไปที่หมากรุก เพราะว่าโปรแกรมปัญญาประดิษฐ์ในการเดินหมากรุกเป็นหนึ่งในโปรแกรมคอมพิวเตอร์ที่ความชาญฉลาดของเครื่องจักร (machine intelligence) มีชัยเหนือมนุษย์ ทั้งยังเป็นระบบที่เหมาะสมสำหรับการทดลองอัลกอริทึม และเป็นต้นแบบทางด้านความโดดเด่นของปัญญาประดิษฐ์ (AI dominance)

Maia ถูกพัฒนาโดยดัดแปลงโปรแกรมมาจาก Leelo Zero ซึ่งเป็นโอเพนซอร์สโคลน (open source clone) ของ AlphaZero โปรแกรมปัญญาประดิษฐ์ที่ปฏิวัติวงการ ซึ่งถูกพัฒนาโดย Alphabet ซึ่งเป็นบริษัทลูกของ Deepmind

https://www.chess.com/article/view/how-does-alphazero-play-chess

AlphaZero แตกต่างจากโปรแกรมหมากรุกปัญญาประดิษฐ์ทั่วไป โดยมีการศึกษารูปแบบเดินหมากอย่างอิสระจากคำสั่งของมนุษย์ ภายในโปรแกรม AlphaZero จะมีโครงข่ายประสาทจำลอง (simulated neural network) ซึ่งประกอบด้วยเซลล์ประสาทเสมือนจริงที่สามารถปรับให้ตอบสนองต่อปัจจัยนำเข้า (input)  สำหรับหมากรุกนั้น AlphaZero ได้รับการป้อนข้อมูลตำแหน่งของกระดานและรูปแบบการเดินหมากที่สร้างขึ้นในเกมการฝึกหัดแข่งขัน และปรับค่าการส่งสัญญาณประสาทเพื่อเลือกรูปแบบการเดินหมากที่จะชนะ ซึ่งกระบวนการนี้เป็นที่รู้จักในชื่อว่าการเรียนรู้แบบเสริมกำลัง (reinforcement learning)  AlphaZero สามารถใช้กระบวนการเดียวกันนี้เรียนรู้วิธีการเล่นเกมส์กระดานอื่น ๆ เช่น หมากฮอส หรือหมากล้อมแบบกระดานเล็ก

ทีมผู้พัฒนาจากมหาวิทยาลัยคอร์เนลได้ปรับแต่งโปรแกรมของ Leelo Zero เพื่อสร้างโปรแกรมที่เรียนรู้โดยสนับสนุนการคาดการณ์รูปแบบการเดินหมากของมนุษย์ที่แม่นยำ ขณะที่โปรแกรมปัญญาประดิษฐ์หมากรุกอื่น ๆ (รวมถึง DeepBlue ของบริษัทไอบีเอ็ม ที่พ่ายแพ้ให้กับแชมป์โลก Garry Kasparov ในปี 2540) พยายามวางแผนการแข่งขันด้วยการสำรวจรูปแบบการเดินหมากที่เป็นไปได้ทั้งหมด  แต่ Maia มุ่งเน้นไปที่การค้นหารูปแบบการเดินหมากที่เป็นไปได้มากที่สุดที่มนุษย์จะเลือกใช้ในการเล่น

Maia ได้รับการสอนด้วยข้อมูลจาก Lichess เว็บไซต์เล่นหมากรุกที่ได้รับความนิยม ผลลัพธ์ที่ได้คือโปรแกรมหมากรุกสามารถเล่นหมากรุกในรูปแบบที่คล้ายมนุษย์มากขึ้น Maia ได้รับการพัฒนาเป็นหลายเวอร์ชั่นตามความแข็งแกร่งในการเล่นที่ต่างกัน โดยสามารถท้าทายแข่งขันในตอนนี้ได้แล้วที่เว็บไซต์ Lichess

รูปแบบที่ซับซ้อนมากขึ้นของปัญญาประดิษฐ์อาจจะแซงหน้าความฉลาดของมนุษย์ในทุกสาขาตั้งแต่สาขาคณิตศาสตร์จนถึงสาขาวรรณกรรมและอื่น ๆ  แต่ถึงกระนั้น Kleinberg กล่าวว่า “จะมีช่วงเวลาการเปลี่ยนผ่านซึ่งมนุษย์และปัญญาประดิษฐ์จะทำงานร่วมกัน และจะมีการสื่อสารระหว่างกัน”

ปัญญาประดิษฐ์ที่สามารถคาดการณ์และเลียนแบบพฤติกรรมของมนุษย์ สามารถนำไปใช้งานได้ทันทีทั้งในเกมหมากรุกและเกมอื่น ๆ  Matthew Sadler ปรมาจารย์ด้านหมากรุกชาวอังกฤษ และผู้เขียนหนังสือ GAME CHANGER (ซึ่งเป็นหนังสือเกี่ยวกับความสามารถในการเล่นหมากรุกของ AlphaZero) กล่าวว่า “เป็นความคิดที่ดี” และ “มีความต้องการอย่างมากที่ผู้เล่นอยากจะมีเครื่องมือที่สามารถพูดภาษาของพวกเขาได้”

Sadler กล่าวว่า Maia อาจจะมีประโยชน์สำหรับการฝึกฝนและฝึกซ้อม นอกจากนี้ Maia ได้รับการฝึกฝนให้สามารถคาดการณ์รูปแบบการเดินหมากของผู้เล่นคนใดคนหนึ่งโดยเฉพาะ

“ลองจินตนาการว่าคุณกำลังเตรียมตัวสำหรับเกมส์หมากรุกชิงแชมป์โลกเพื่อแข่งกับ Magus Carlsen และคุณมีเครื่องมือที่เดินหมากได้เหมือนกับ Magus”

Matthew Sadler ปรมาจารย์ด้านหมากรุกชาวอังกฤษ และผู้เขียนหนังสือ GAME CHANGER

นอกเหนือจากเกมแล้วโปรแกรมปัญญาประดิษฐ์ที่สามารถเข้าถึงพฤติกรรมของมนุษย์อาจช่วยเป็นกลยุทธ์ในการเจรจา หรือการสร้างโปรแกรมและหุ่นยนต์ ที่สามารถคาดการณ์สิ่งที่ผู้ร่วมงานที่เป็นมนุษย์กำลังจะทำ

Julie Shah ผู้ช่วยศาสตราจารย์มหาวิทยาลัยเอ็มไอที ผู้ศึกษาทางด้านปฏิสัมพันธ์และการทำงานร่วมกันระหว่างมนุษย์และเครื่องจักร กล่าวว่า “คำถามที่พวกเขาถามว่าวิธีการนี้คาดการณ์สมรรถภาพของมนุษย์ได้ดีเพียงใดนั้นเป็นคำถามที่น่าสนใจ” Shah ตั้งข้อสังเกตว่าควรที่จะตรวจสอบ (examine) กระบวนการนี้ว่าสามารถสร้างแนวทางที่เหนือกว่าสำหรับมนุษย์และเครื่องจักรในการทำงานร่วมกัน

Matthias Sollner ศาสตร์จารย์มหาวิทยาลัยคาสเซล (Kassel) ประเทศเยอรมนี ผู้ทำการศึกษาว่าปัญญาประดิษฐ์สามารถช่วยพนักงานทำงานได้อย่างไร กล่าวว่ามีความสำคัญเป็นอย่างยิ่งที่ระบบดังกล่าวมีพฤติกรรมเหมือนมนุษย์มากขึ้น แต่อาจจะสำคัญกว่าสำหรับมนุษย์ที่จะต้องทำความเข้าใจการทำงานของระบบปัญญาประดิษฐ์ หากระบบทำงานไม่ดีและไม่ชัดเจนว่าเกิดจากสาเหตุใด เขากล่าวว่า “มันอาจส่งผลเสียต่อการยอมรับระบบปัญญาประดิษฐ์ดังกล่าว”

ที่มา: https://www.wired.com/story/new-artificial-intelligence-mistakes-purpose-chess/

แบ่งปันบทความ

กลุ่มเนื้อหา

แท็กยอดนิยม

แจ้งเรื่องที่อยากอ่าน

คุณสามารถแจ้งเรื่องที่อยากอ่านให้เราทราบได้ !
และเราจะนำไปพัฒนาบทความให้มีเนื้อหาที่น่าสนใจมากขึ้น

PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.