Patipan Prasertsom

Patipan Prasertsom

Data Scientist Expert at Big Data Institute (BDI)

บทความทั้งหมด

All Articles

Author Category Post Filter
ตีความโมเดล Machine Learning: ตัวอย่างและการตีความ Shapley value
การคำนวณ Shapley Value เป็นเทคนิคที่สามารถใช้เพื่อตีความโมเดล Machine Learning ได้ทุกประเภท โดยอาศัยการคำนวณผลกระทบของฟีเจอร์ที่สนใจต่อค่าทำนายเฉลี่ยของเดล เพื่อดูระดับและทิศทางที่ปัจจัยต่าง ๆ ส่งผลต่อการทำงานของโมเดล ในบทความนี้เราจะมาดูตัวอย่างการใช้และตีความ Shapley Value พร้อมข้อดี ข้อจำกัด และข้อเสนอแนะในการใช้งานเทคนิคดังกล่าว
22 November 2023
ตีความโมเดล Machine Learning: หลักการของ Shapley value
การวิเคราะห์ผลกระทบและความสำคัญ (Importance) ของ feature ที่ใช้ในโมเดล Machine Learning นั้นเป็นเครื่องมือสำคัญที่ทำให้นักวิเคราะห์สามารถนำโมเดลไปใช้ได้อย่างมีประสิทธิภาพ การคำนวณ Shapley value เป็นเทคนิคในการตีความโมเดลโดยพิจาณาจากผลกระทบของฟีเจอร์ที่สนใจต่อการผลการทำนายเฉลี่ย โดยสามารถใช้ตามโมเดลได้ทุกประเภทแม้จะเป็นโมเดลที่อธิบายได้ยาก
15 November 2023
ตีความโมเดล Machine Learning: การใช้งาน LIME กับข้อมูลตาราง
LIME เป็น Model-Agnostic Interpretation Methods สำหรับตีความโมเดล Machine Learning ณ จุดข้อมูลที่สนใจ โดยอาศัยหลักการสร้างโมเดลตัวแทน (Local Surrogate) เพื่ออธิบายว่า ปัจจัยอะไรส่งผลให้โมเดลมีพฤติกรรมการทำนายอย่างที่เห็น ในบทความนี้เราจะมาพูดถึงการใช้งาน LIME กันว่า เทคนิคนี้สามารถนำมาประยุกต์ใช้กับข้อมูลประเภทตาราง (Tabular Data) ได้อย่างไร
5 September 2022
ตีความโมเดล Machine Learning: หลักการของ LIME
จุดประสงต์หลักของการพัฒนา Machine Learning model นอกเหนือจากการตอบโจทย์การทำนายที่ต้องการแล้วนั้น คือการวิเคราะห์ผลกระทบและความสำคัญ (Importance) ของ feature ของข้อมูลที่มีต่อผลการทำนาย อย่างไรก็ดีโมเดลที่เป็นที่นิยมหลายชนิดนั้นยากที่จะอธิบายได้โดยตรง Model-Agnostic Interpretation Methods เช่น LIME จึงถูกพัฒนาขึ้นเพื่อช่วยผู้ใช้ในการตีความโมเดลทุกประเภท
2 September 2022
การค้นหาตัวแทนเชิงความหมายของข้อความ: Word2Vec Word Embedding, Part II
หลังจากที่เราได้พูดถึงหลักการทำงานของโมเดลเบื้องต้นในการทำ word embedding ได้แก่โมเดล CBOW และ Skip-gram ไปแล้ว ในบทความนี้ เราจะมาพูดถึงวิธีการนำผลลัพธ์ที่ได้จากการฝึกฝนของโมเดลในตระกูล Word2Vec สองโมเดลนี้มาทำการสร้างตัวแทนเชิงความหมายของคำและเอกสาร พร้อมทั้งลองเขียนโค้ดง่ายๆ เพื่อลองประยุกต์ใช้งานกันครับ
26 July 2021
การค้นหาตัวแทนเชิงความหมายของข้อความ: Word2Vec Word Embedding, Part I
ในปัจจุบันข้อมูลที่มีลักษณะเป็นข้อความ (text) นั้นมีอยู่เป็นปริมาณมากแต่การประมวลผลข้อมูลเหล่านี้ไม่สามารถทำได้อย่างตรงไปตรงมาและจำเป็นต้องมีการจัดเตรียม (preprocess) ให้อยู่ในลักษณะที่เหมาะสมแก่การนำไปคำนวณได้เสียก่อน ซึ่งการจัดเตรียมข้อมูลเหล่านี้สามารถทำได้จากหลากหลายเทคนิคไม่ว่าจะเป็นการทำการประมวลผลพื้นฐานในการใช้เทคนิคพวก Bag of Words หรือ TF-IDF จนไปถึง การทำ word embedding เพื่อพยายามหาตัวแทนความหมายของข้อมูล ในบทความนี้ เราจะมาพูดถึงเทคนิคเบื้องต้น (ซึ่งยังมีการใช้งานอยู่ในปัจจุบัน) ของการทำ word embedding ได้แก่เทคนิคตระกูล Word2Vec ที่มีความซับซ้อนไม่สูงและสามารถทำได้อย่างรวดเร็ว กันครับ
15 July 2021
สกัดใจความสำคัญของข้อความด้วยเทคนิคการประมวลผลทางภาษาเบื้องต้น: TF-IDF, Part 2
ก่อนที่เราจะสามารถนำเอาเทคนิคการประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) มาใช้กับภาษาไทยได้นั้น อุปสรรคหลักอย่างหนึ่ง คือ ภาษาไทยไม่ได้มีการเว้นวรรคระหว่างคำเหมือนหลายภาษาอื่น (เช่น ภาษาอังกฤษ) ดังนั้น การ “ตัดคำ” หรือการแยกข้อความภาษาไทยออกเป็นคำเดี่ยวๆ จึงเป็นสิ่งที่จำเป็นแรกที่ต้องทำ
11 November 2020
สกัดใจความสำคัญของข้อความด้วยเทคนิคการประมวลผลทางภาษาเบื้องต้น: TF-IDF, Part 1
ข้อมูลในรูปแบบข้อความมีรูปแบบและความยาวที่หลากหลาย ส่งผลให้ข้อมูลชนิดข้อความถูกนำมาวิเคราะห์ได้ยากกว่ามาก ดังนั้นความสามารถในการสกัดเอาข้อมูลที่สำคัญออกมาจากจากข้อความ (Text Mining) ได้จึงเป็นสิ่งที่สำคัญและเป็นประโยชน์อย่างมาก
1 October 2020
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.