Amorn Chokchaisiripakdee

Amorn Chokchaisiripakdee

Senior Data Scientist at Big Data Institute (Public Organization), BDI

บทความทั้งหมด

All Articles

Author Category Post Filter
Gotta Train ’Em All!  พัฒนาองค์กรให้แข็งแกร่ง ด้วยระบบติดตามผลงานสไตล์โปเกเด็กซ์! 
ในบริบทขององค์กรสมัยใหม่ การนำแนวคิดจากโลกโปเกมอนมาประยุกต์ใช้ในการบริหารทรัพยากรมนุษย์สามารถเป็นนวัตกรรมที่น่าสนใจ ระบบติดตามผลการปฏิบัติงานที่ออกแบบตามแนวคิดของ Pokédex ที่ให้ข้อมูลเชิงลึก สนุก และเข้าใจง่าย จะช่วยให้องค์กรสามารถวิเคราะห์ความสามารถ พัฒนาการ และศักยภาพของบุคลากรได้อย่างเป็นระบบและมีประสิทธิภาพ โดยมีเป้าหมายในการสร้างทีมงานที่มีความแข็งแกร่งและสามารถขับเคลื่อนองค์กรไปสู่ความสำเร็จ  รูป Pokédex (https://www.pokemon.com/us/pokedex)  Pokédex (https://www.pokemon.com/us/pokedex) เป็นสมุดบันทึกข้อมูลที่ใช้ในจักรวาลของโปเกมอน ทำหน้าที่บันทึกข้อมูลของโปเกมอนแต่ละชนิด มีคุณสมบัติหลัก แสดงรายละเอียดต่างๆ ของโปเกมอน เช่น: ประเภท ขนาด น้ำหนัก ความสามารถพิเศษ ถิ่นที่อยู่อาศัย ซึ่งช่วยให้เทรนเนอร์สามารถติดตามและศึกษาข้อมูลโปเกมอนได้อย่างละเอียด  Employee Pokédex: โปรไฟล์เฉพาะตัวของพนักงาน  โปเกมอนแต่ละตัวประกอบด้วยคุณลักษณะเฉพาะ พนักงานในองค์กรก็ล้วนมีความสามารถและศักยภาพที่แตกต่างกัน ระบบ Employee Pokédex จะเป็นเครื่องมือสำคัญที่ช่วยให้ฝ่ายทรัพยากรมนุษย์สามารถวิเคราะห์ภาพรวมของบุคลากรได้อย่างเป็นระบบและครอบคลุม โดยนำเสนอข้อมูลสำคัญ อาทิ ทักษะเชิงวิชาชีพ ความสามารถเฉพาะทาง และประวัติผลการปฏิบัติงาน เพื่อสนับสนุนการพัฒนาศักยภาพบุคลากรอย่างมีประสิทธิภาพและเป็นรูปธรรม  ชื่อและตัวตน: ยอมรับความแตกต่างและศักยภาพของแต่ละบุคคล  Pokédex จะบันทึกรายละเอียดเฉพาะของโปเกมอนแต่ละตัว องค์กรสมัยใหม่ก็ควรตระหนักถึงความหลากหลายของทรัพยากรมนุษย์ พนักงานแต่ละคนล้วนมีภูมิหลัง ทักษะ และคุณลักษณะเฉพาะตน การยอมรับและเคารพในความแตกต่างเหล่านี้จะช่วยสร้างวัฒนธรรมองค์กรที่ครอบคลุม เอื้ออำนวยให้บุคลากรรู้สึกถึงคุณค่าของตนเอง และสามารถแสดงศักยภาพได้อย่างเต็มประสิทธิภาพ  ประเภทและความสามารถ: ค้นหาบทบาทที่ใช่  เช่นเดียวกับประเภทและความสามารถที่กำหนดประสิทธิภาพของโปเกมอนในการต่อสู้ พนักงานแต่ละคนในองค์กรก็มีคุณลักษณะเฉพาะที่แตกต่างกัน บางบุคคลมีความเชี่ยวชาญในการวิเคราะห์เชิงลึก บางคนโดดเด่นด้านความคิดสร้างสรรค์ และบางคนมีศักยภาพด้านภาวะผู้นำ การทำความเข้าใจ “ประเภท” และคุณลักษณะเฉพาะของพนักงานจะเป็นกลยุทธ์สำคัญที่ช่วยให้ฝ่ายทรัพยากรมนุษย์สามารถมอบหมายงานได้อย่างเหมาะสมและสอดคล้องกับความสามารถ อันจะนำไปสู่การสร้างทีมงานที่มีประสิทธิภาพและศักยภาพสูงสุด  เพศ: ส่งเสริมความเท่าเทียมและความหลากหลาย  ในโลกของโปเกมอนมีความหลากหลายทางพันธุกรรม องค์กรชั้นนำในปัจจุบันควรให้ความสำคัญอย่างยิ่งกับความหลากหลายและความเท่าเทียมในสถานที่ทำงาน เครื่องมือการบริหารทรัพยากรมนุษย์สมัยใหม่สามารถทำหน้าที่เป็นกลไกสำคัญในการส่งเสริมวัฒนธรรมองค์กรที่ครอบคลุม เพื่อสร้างโอกาสในการพัฒนาและความก้าวหน้าอย่างเป็นธรรมสำหรับบุคลากรทุกคน โดยไม่คำนึงถึงความแตกต่างทางเพศ เชื้อชาติ หรือพื้นฐานส่วนบุคคล  Type Matchups: เข้าใจไดนามิกการทำงานเป็นทีม  เช่นเดียวกับโปเกมอนที่มีคุณลักษณะเฉพาะทางพลังงานและความสามารถ พนักงานในองค์กรก็มีทักษะ จุดแข็ง และข้อจำกัดที่แตกต่างกัน การออกแบบทีมงานที่มีความหลากหลายและสามารถเสริมพลังซึ่งกันและกันจะเป็นกลยุทธ์ที่สำคัญในการเพิ่มประสิทธิภาพการทำงาน ฝ่ายทรัพยากรมนุษย์สามารถใช้ข้อมูลเชิงลึกในการจัดวางทรัพยากรบุคคล เพื่อสร้างทีมงานที่มีความสมดุลและมีศักยภาพในการขับเคลื่อนองค์กรอย่างมีประสิทธิภาพ  Base Stats: วัดผลทักษะและศักยภาพของพนักงาน  ศักยภาพของโปเกมอนจะมีค่าสถานะพื้นฐานที่เป็นตัวกำหนด พนักงานในองค์กรก็มีทักษะหลักที่สามารถพัฒนาและยกระดับได้ อาทิ ความสามารถในการวิเคราะห์และแก้ปัญหา ทักษะการปรับตัวต่อสถานการณ์ที่เปลี่ยนแปลง และประสิทธิภาพในการทำงานร่วมกับผู้อื่น ระบบติดตามผลการปฏิบัติงานแบบดิจิทัลจะเป็นเครื่องมือสำคัญที่ช่วยให้ฝ่ายทรัพยากรมนุษย์สามารถประเมินและวัดระดับความสามารถเหล่านี้ได้อย่างแม่นยำ อันจะนำไปสู่การวางแผนพัฒนาบุคลากรที่มีความเฉพาะเจาะจงและมีประสิทธิภาพสูงสุด  Search Box: ค้นหาพนักงานที่ใช่ได้อย่างรวดเร็ว  ฟังก์ชันการค้นหาที่มีประสิทธิภาพใน Pokédex ช่วยให้เทรนเนอร์สามารถเข้าถึงข้อมูลโปเกมอนได้อย่างรวดเร็ว ระบบการบริหารทรัพยากรมนุษย์สมัยใหม่ก็ควรพัฒนาเครื่องมือค้นหาที่มีความคล่องตัวและแม่นยำ ซึ่งจะช่วยให้ผู้บริหารสามารถค้นหาและคัดกรองบุคลากรตามคุณสมบัติเฉพาะ อาทิ ทักษะเชิงวิชาชีพ ประสบการณ์การทำงาน หรือผลงานที่ผ่านมา การออกแบบระบบสืบค้นดังกล่าวจะเป็นการเพิ่มประสิทธิภาพในการบริหารและพัฒนาทรัพยากรบุคคลขององค์กรอย่างเป็นระบบและมีประสิทธิผล  สรุป: ใช้ข้อมูลขับเคลื่อนองค์กรให้เติบโตเหมือนเทรนเนอร์มืออาชีพ  การประยุกต์ใช้แนวคิดจาก Pokédex ในระบบการวิเคราะห์ทรัพยากรมนุษย์จะเป็นนวัตกรรมที่ช่วยยกระดับการบริหารบุคลากร โดยสร้างระบบติดตามผลที่มีความแม่นยำ เข้าใจง่าย และมีประสิทธิภาพ ซึ่งจะช่วยให้ฝ่ายทรัพยากรมนุษย์สามารถประเมินและพัฒนาศักยภาพของพนักงานได้อย่างเป็นระบบ ท้ายที่สุดแล้ว ความสำเร็จขององค์กรเปรียบเสมือนการเดินทางในโลกโปเกมอน ที่ต้องอาศัยกลยุทธ์ การพัฒนาอย่างต่อเนื่อง และความร่วมมือของทีมงานที่เข้มแข็ง! 
25 March 2025
ทำความรู้จักแผนภูมิปฏิทินความร้อน Calendar Heatmaps
กลับมาอีกครั้งกับบทความเกี่ยวกับ Data Visualization ซึ่งในครั้งนี้จะเป็นการนำเสนอการประยุกต์ใช้งานแผนภูมิความร้อนกับข้อมูลอนุกรมเวลาให้ออกมาเป็นรูปแบบแผนภูมิความร้อนชนิดหนึ่งที่เรียกว่า แผนภูมิปฏิทินความร้อน (Calendar Heatmaps) ก่อนอื่น ๆ เลย เรามาทำความรู้จักเบื้องต้นเกี่ยวกับแผนภูมิความร้อน (Heatmaps) กัน กำเนิดแผนภูมิความร้อน ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม เช่น เชื้อชาติ ต้นกำเนิด อายุ ในปารีส ทั้งนี้ในแผนภูมิความร้อนนี้ประกอบไปด้วยเขตพื้นที่รายแถวของปารีสเทียบกับค่าสถิติทางสังคมกว่า 30 ค่า โดยใช้สีทั้งหมด 4 สี คือ สีขาว สีน้ำเงิน สีเหลือง และ สีแดง ในการบ่งบอกถึงค่าต่าง ๆ แทนตัวเลข ตัวอย่างสำคัญที่มีการใช้แผนภูมิความร้อนนี้ถูกทำขึ้นโดย Toussaint Loua[NP1] [AC2]  ในปี 1873 เพื่อติดตามค่าสถิติทางสังคม เช่น เชื้อชาติ ต้นกำเนิด อายุ ในปารีส ทั้งนี้ในแผนภูมิความร้อนนี้ประกอบไปด้วยเขตพื้นที่รายแถวของปารีสเทียบกับค่าสถิติทางสังคมกว่า 30 ค่า โดยใช้สีทั้งหมด 4 สี คือ สีขาว สีน้ำเงิน สีเหลือง และ สีแดง ในการบ่งบอกถึงค่าต่าง ๆ แทนตัวเลข ทำให้ผู้คนเริ่มนำเทคนิคของ Loua ไปใช้ในเป็นส่วนประกอบของการแสดงแผนภูมิแบบตารางมากขึ้นอย่างแพร่หลายในช่วงปีคริสต์ศักราชที่ 19 จนถึงปัจจุบัน ประเภทของแผนภูมิความร้อน เมื่อแผนภูมิความร้อน (Heatmaps) หรือแผนภูมิอุณหภูมิ ถูกใช้งานมากขึ้น จึงมีรูปแบบที่ถูกพัฒนาขึ้นอย่างต่อเนื่อง ซึ่งแบ่งออกเป็นหลัก ๆ ทั้งหมด 2 ชนิด ได้แก่ แผนภูมิความร้อนกับข้อมูลเชิงอนุกรมเวลา จากที่ผู้เขียนได้เกริ่นไว้ข้างต้นที่จะมีการประยุกต์ใช้ข้อมูลเชิงอนุกรมเวลากับแผนภูมิความร้อนเข้าด้วยกัน ซึ่งโดยส่วนใหญ่การแสดงแผนภาพข้อมูลอนุกรมเวลา (Time-Series Data) จะมาในรูปแบบของกราฟเส้น อาทิเช่น กราฟเส้นแสดงข้อมูลการขายในช่วง 30 ปี กราฟเส้นแสดงข้อมูลยอดผู้เข้าชมวีดีโอ หรือกราฟหลากเส้นแสดงยอดขายตามปีเปรียบเทียบกับเดือน ซึ่งกราฟเส้นนี้นอกจากจะแสดงข้อมูลและเปรียบเทียบข้อมูล ยังแสดงถึงแนวโน้มในอนาคตหรือความสม่ำเสมอที่เกิดขึ้นในช่วงเวลาต่าง ๆ อย่างไรก็ตามการแสดงข้อมูลในเชิงอนุกรมเวลา อาจจะมีอุปสรรคในเชิงของความละเอียดของเวลา การจัดทำกราฟเส้นอาจไม่ตอบโจทย์หรือยากในการสังเกตและวิเคราะห์แนวโน้มเมื่อลงลึกถึงข้อมูลรายวัน ดังนั้นผู้เขียนจึงอยากจะให้ทุกท่านได้รู้จักกับ “แผนภูมิปฏิทินความร้อน” แผนภูมิปฏิทินความร้อน การเลือกใช้แผนภูมิปฏิทินความร้อนเพื่อนำเสนอข้อมูลจำเป็นต้องคำนึงถึงสิ่งที่อยากจะนำเสนอ หากเราต้องการนำเสนอข้อมูลอนุกรมเชิงเวลาในลักษณะรายวัน การใช้แผนภูมิปฏิทินความร้อนมาประยุกต์จึงเป็นอีกวิธีที่สามารถนำไปใช้งาน อาทิเช่น การแสดงการมีส่วนร่วมในโปรเจคบนเว็บไซต์ GitHub (ภาพที่ 4 บน) ว่ามีการทำงานหรือสนับสนุนมากน้อยเพียงใด หรือ การแสดงจำนวนอุบัติเหตุตามช่วงเวลาในแต่ละวันของสัปดาห์ (ภาพที่ 4 ล่าง) จะเห็นได้ว่าการแสดงข้อมูลแบบประยุกต์แผนภูมิความร้อนเข้าด้วยกันกับข้อมูลอนุกรมเวลา ก็ยังสามารถสังเกตและวิเคราะห์แนวโน้มของข้อมูลที่แสดงบนกราฟได้อีกด้วย ทั้งนี้ผู้เขียนจึงขอยกตัวอย่างการประยุกต์ข้อมูลอนุกรมเวลาเข้ากับแผนภูมิความร้อน โดยจะแสดงเป็นแผนภูมิปฏิทินความร้อน ซึ่งข้อมูลที่ผู้เขียนเลือกนำมาใช้คือข้อมูล PM2.5 ในปี 2022 ทุกจุดตรวจจากเว็บไซต์ Air4Thai กรมควบคุมมลพิษ ซึ่งทางผู้เขียนได้มีการจัดการข้อมูลให้สะดวกต่อการจัดทำแผนภูมิข้อมูลในรูปแบบปฏิทิน จากข้อมูลที่ผู้เขียนนำมาใช้แสดงในแผนภูมิปฏิทินนี้ สามารถสังเกตได้ว่าในช่วงเดือนพฤษภาคมจนถึงกลางเดือนตุลาคมมีปริมาณค่าฝุ่น PM2.5 ที่ค่อนข้างน้อยเมื่อเทียบกับเดือนอื่นๆ ซึ่งในช่วงต้นปีที่มีการเปลี่ยนฤดูเป็นฤดูหนาว เช่น เดือนมกราคมและเดือนกุมภาพันธ์จะมีค่า PM2.5 ที่ค่อนข้างสูง และในส่วนท้ายปีเดือนพฤศจิกายนและเดือนธันวาคมเริ่มมีแนวโน้มการเพิ่มขึ้นของปริมาณฝุ่น PM2.5 ซึ่งมีความน่าจะเป็นที่จะลามไปถึงเดือนมกราคมและเดือนกุมภาพันธ์ในปี 2023 ข้อควรระวังในการใช้งานแผนภูมิปฏิทินความร้อน อย่างไรก็ตามการจัดทำแผนภูมิความร้อนก็ยังมีข้อเสียในบางครั้ง การใช้แผนภูมิความร้อนที่ค่าของข้อมูลเป็นการไล่ระดับสีแทนค่าของช่วงข้อมูลอาจทำให้บางจุดยากต่อการเปรียบเทียบ สำหรับข้อมูลที่มีค่าใกล้เคียงกันการมองด้วยสายตาอาจไม่สามารถพบเจอความแตกต่างได้ ดังนั้นการจัดทำช่วงค่าข้อมูลจึงเป็นทางเลือกอีกทางหนึ่งสำหรับการใช้แผนภูมิความร้อน หรือการเลือกเฉดสีที่ต่างกันมาก ๆ เช่น น้ำเงินกับแดง เหลืองกับม่วง เป็นต้น โดยผู้เขียนก็อยากจะแนะนำเครื่องมือหนึ่งในการเลือกใช้สีแบบต่าง ๆ เครื่องมือนั้นก็คือ Colorbrewer ในบทความนี้ เราได้ทำการสำรวจโลกของ ‘แผนภูมิปฏิทินความร้อน’ หรือ ‘Calendar Heatmaps’ อย่างละเอียด ตั้งแต่ประวัติของมัน การประยุกต์ใช้ จะเห็นได้ว่าแผนภูมิความร้อนไม่เพียงแต่เป็นเครื่องมือที่มีประสิทธิภาพในการสื่อสารข้อมูล แต่ยังสามารถเปิดเผยแนวโน้มและรูปแบบที่ไม่คาดคิดได้อีกด้วย ความสามารถในการวิเคราะห์และนำเสนอข้อมูลเชิงลึกอย่างที่เราได้พูดถึงในบทความนี้ จะช่วยให้คุณเข้าใจว่าข้อมูลสามารถถูกเปลี่ยนเป็นข้อมูลที่มีคุณค่าและมีอิทธิพลได้อย่างไร เราหวังว่าคุณจะได้แรงบันดาลใจและความรู้ใหม่ๆ จากบทความนี้ และนำไปประยุกต์ใช้ในงานของคุณเอง อย่าลืมติดตามเราสำหรับบทความต่อไป ที่จะพาคุณไปสำรวจเทคนิคการวิเคราะห์ข้อมูลและการนำเสนอข้อมูลอื่น ๆ ที่น่าตื่นเต้นไม่แพ้กัน ที่นี่ เราจะช่วยให้คุณเข้าถึงเครื่องมือและทักษะใหม่ ๆ ในการเปลี่ยนข้อมูลเป็นมูลค่าและเรื่องราวที่น่าจดจำ เนื้อหาโดย อมร โชคชัยสิริภักดีตรวจทานและปรับปรุงโดย นววิทย์ พงศ์อนันต์ สำหรับผู้ที่สนใจขึ้นตอนการจัดทำแผนภูมิสามารถศึกษาได้จากบทความดังนี้ เอกสารอ้างอิง
25 December 2023
ประวัติศาสตร์การพัฒนาการโมเดลทางภาษา: จากเวคเตอร์สู่ Transformers
จากกระแสการมาของ AI ตัวเก่งที่ทำให้หลายๆสายงานใช้ชีวิตได้ง่ายขึ้นและยากขึ้นตามๆกันไปคือการมาของ ChatGPT จากทีม OpenAI ที่นักเรียนสามารถสั่ง ChatGPT ให้เขียนเรียงความไปส่งอาจารย์ได้โดยไม่ได้ลอกใครมา หรือจะเป็นการเขียนโค้ดส่งการบ้านของเด็กมหาลัยฯ หรือจะเป็นการสอบถามสูตรอาหารพร้อมขั้นตอนการปรุงอาหาร ที่เป็นแรงกระเพื่อมไปหลายๆวงการ ทางผู้เขียนเองก็ตะลึงในความสามารถของ ChatGPT เช่นกัน แต่ทางผู้เขียนจะขอพูดถึงการทำงานของ ChatGPT ในโอกาสหน้า ในครั้งนี้เราจะมาพูดถึงพัฒนาการของโมเดลทางภาษา (Language Models : LM) ในด้าน Natural Language Processing : NLP ที่ทำให้เกิด ChatBOT ในรูปแบบต่างๆมากมาย เช่น Alexa, Siri, Sparrow, รวมถึง ChatGPT ซึ่งมีทั้งความเก่ง ความฉลาด และความแม่นยำ ในปี 2013 (10 ปีก่อนปัจจุบัน) เป็นปีของ Word2Vec เหล่านักวิจัยด้าน NLP ให้ Convolutional Neural Network Model: CNN เรียนรู้เพื่อหาความคล้ายคลึงหรือความเหมือนของคำแต่ละคำตามการกระจายตัวของแต่ละคำในคลังข้อมูลภาษา โดยการเปลี่ยนคำให้กลายเป็นเวกเตอร์ ซึ่งคำแต่ละคำที่อยู่ใกล้กัน คือคำที่มีความหมายใกล้เคียงกัน มีบริบทเดียวกัน หรือมีความคล้ายคลึงกัน ดังตัวอย่างที่ปรากฏในรูป 1 ถ้าสมมติว่าเราเปลี่ยนคำว่า “Apple” ให้กลายเป็นเวกเตอร์แล้ววาดลงบนพื้นที่ 2 มิติ Word2Vec จะบอกว่าคำที่คล้ายคลึง หรือพบเจอได้บ่อยเมื่อมีคำว่า “Apple” คือ “iPhone” และ “Android” จะเห็นได้ว่าทั้งสองคำอยู่ในบริบทของมือถือ และคำว่า “Apple” กลายเป็นชื่อแบรนด์สินค้า ในขณะเดียวกันตัว Word2Vec เองก็แสดงคำที่ลักษณะใกล้เคียงกันเช่น “Banana” “Orange” และ “Papaya” ให้อยู่ใกล้กับ “Apple” เช่นเดียวกันแต่เป็นบริบทของผลไม้ จะเห็นได้ว่า Word2Vec นั้นยังแบ่งคำว่า “Apple” ในบางเนื้อหาให้ชัดเจนไม่ได้ดีนัก หากนำไปใช้ใน Classification Model อาจทำให้เกิดความคลาดเคลื่อนได้ค่อนข้างสูง จึงทำให้ไปสู่การพัฒนาขั้นต่อไปของการใช้ Neural Network ในปี 2014-2015 เป็นปีที่มีการนำมาใช้ของ Recurrent Neural Network : RNN เนื่องจากตัวโมเดลนั้นสามารถแก้ปัญหา Classification ได้ดี แล้วยังสามารถแก้ปัญหา Sequence-2-Sequence (Seq2Seq) ได้ดีอีกด้วย ซึ่งโจทย์ปัญหาที่พบเจอได้บ่อยๆในด้าน NLP ของ Seq2Seq คือ การแปลภาษา ยกตัวอย่างการแปลภาษาจากภาษาอังกฤษมาเป็นภาษาไทย ดังประโยคในตัวอย่าง “He is a student.” ตัว Encoder นั้นจะทำการเข้ารหัสตามลำดับของคำในประโยคโดยเริ่มจาก “He” ไปจนถึง “student” หลังจากนั้นก็จะสร้าง vector สำหรับประโยคนี้เพื่อนำไปถอดรหัสผ่านตัว Decoder ให้แปลงเป็นภาษาไทยว่า “เขาเป็นนักเรียน” จะเห็นได้จากตัวอย่างว่า RNN โมเดลที่ทำการแปลภาษานั้นสามารถทำได้ดี แต่ทว่าการแปลภาษาของ RNN โมเดลนั้นก็ยังไม่เป็นผลที่มีประสิทธิภาพดีเท่าไหร่นักถ้าประโยคที่เรานำไม่ได้มีแค่ 4 คำ ตัวโมเดลแปลภาษาจะมีปัญหาเกิดขึ้นสำหรับประโยคที่มีความยาวมากๆ, การแปลขนาดย่อหน้า, หรือขนาดหนังสือเป็นเล่ม ที่จะต้องไล่เข้ารหัสที่ละคำและถอดรหัสที่ละคำ ทำให้ในช่วงปี 2015-2016 มีการเริ่มใช้กลไกการสนใจ (Attention Mechanism) คือการบอกว่าในประโยคนี้ คำนี้มีความสำคัญในการใช้แก้โจทย์ปัญหาจึงต้องสนใจคำนี้เป็นพิเศษ แทนที่จะสนใจทั้งโครงสร้างของประโยค ทางผู้เขียนขอยกตัวอย่างการใช้กลไกการสนใจเป็นรูปภาพและตัวหนังสือ เช่น “A woman is walking on the rocks” กลไกการสนใจนี้เปรียบเสมือนการโฟกัสในรูปภาพที่เรามอง คือถ้าเราให้ความสนใจกับผู้หญิงในรูปเป็นหลัก พื้นที่รอบๆก็จะหม่นลง เช่นเดียวกับตัว Attention ในประโยคข้างต้นคือ “He is a student” ตัว Self-Attention เห็นว่าความน่าสนใจของประโยคนี้คือคำว่า “student” จึงมีการนำกลไกการสนใจไปใช้ควบคู่กับ RNN ในการพัฒนาโมเดลขึ้น จนในที่สุดปี 2017 มีการตีพิมพ์งานวิจัยที่ชื่อว่า “Attention is All You Need” ออกมาบอกว่า เราไม่ต้องใช้ RNN block หรอก สิ่งที่เราจำเป็นจริงๆคือแค่ตัว Attention ทำให้นำไปสู่การสร้าง Neural Network ตัวใหม่ที่ชื่อว่า Transformers ที่เป็นโมเดลที่ใช้กันอย่างแพร่หลายในปัจจุบัน โดยตัวโครงสร้างของ Transformers นั้นประกอบด้วย 2 ส่วนหลักๆเช่นเดียวกับตัว RNN คือ Encoder และ Decoder แต่แตกต่างกันตรงที่ Transformers นั้นสามารถทำแบบคู่ขนานได้ (Parallelization) แทนที่จะอ่านที่ละคำตามแบบ RNN ตัว Transformers สามารถอ่านทั้งประโยคหรือทั้งย่อหน้าได้ ในส่วนของ Encoder นั้นจะเป็นการฝึกให้เข้าใจโครงสร้างทางภาษาซึ่งอาจจะประกอบไปด้วย Part of Speech (POS tagging), Semantic Roles, Coreference เป็นต้น และส่วนของ Decoder นั้นจะเป็นการสร้างคำจากประโยคที่ถูกใส่เข้ามาเพื่อตอบโจทย์ของโมเดล ตัว Transformers นั้นนอกจากจะใช้การเข้ารหัสตำแหน่ง (Positional Encoding) และกลไกการสนใจ (Attention Mechanism) แล้ว สิ่งที่เป็นจุดเปลี่ยนคือกลไกการสนใจตนเอง (Self-Attention Mechanism) จุดนี้ทางผู้เขียนขอย้อนกลับไปถึงตัวอย่างของคำว่า “Apple” ในตอนต้น ในรูปที่ 5 ตัว Self-Attention นั้นจะอ้างอิงความหมายของ “Apple” จากคำรอบๆตัวเอง ประโยคแรกให้ความสนใจไปที่ “fruit” และในประโยคที่สองให้ความสนใจไปที่ “cellphone” ในส่วนนี้จะช่วยให้ตัว transformers นั้นเรียนรู้โครงสร้างทางภาษาและความหมายของคำ ๆ นั้นได้มากขึ้น ทั้งหมดนี้เป็นเพียงแค่ที่มาของตัว Transformers ซึ่งปัจจุบันถูกพัฒนาและนำไปใช้เป็นต้นแบบและพื้นฐานในโมเดลทางด้านภาษาอย่างหลากหลาย ในโอกาสหน้าทางผู้เขียนจะมาเจาะลึกถึงตัว Transformers ว่าลำดับขั้นตอนในการดำเนินการของ Transformers เป็นอย่างไร และมีการคำนวณเบื้องหลังอย่างไร บทความโดย อมร โชคชัยสิริภักดีตรวจทานและปรับปรุงโดย อนันต์วัฒน์ ทิพย์ภาวัต ที่มา :
17 July 2023
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.