Pinphong Sukkaew

Pinphong Sukkaew

Data Scientist at Big Data institute (BDI)

บทความทั้งหมด

All Articles

Author Category Post Filter
ความท้าทาย และโอกาสในการใช้ Machine Learning ในโลกของการลงทุน (Challenges and Opportunities for Using Machine Learning in Trading)
ในบทความก่อนหน้า เราได้พูดถึงหลักการ และกลยุทธ์การลงทุน ที่ Quant Fund ต่าง ๆ ประยุกต์ใช้อย่างประสบความสำเร็จ โดยมีรากฐาน และกระบวนการ ที่สอดคล้องกันกับวิธีการในโลกของวิทยาศาสตร์ข้อมูล เพียงแต่นำมาประยุกต์ใช้กับข้อมูลในโลกของการเงิน เพื่อค้นหาโอกาสในการทำกำไร บนความเสี่ยงที่ต่ำพอจนอยู่ในระดับที่พึงพอใจ โดยตัวอย่างของความสำเร็จที่โดดเด่นที่สุดในแนวการลงทุนแบบนี้ คงจะหนีไม่พ้น The Medallion Fund ซึ่งก่อตั้งโดย นักคณิตศาสตร์ชื่อ Jim Simons ที่สามารถสร้างผลตอบแทนเฉลี่ยต่อปี สูงถึง 66.1% (ก่อนหักค่าบริหารกองทุน) บนระยะเวลา กว่า 30 ปี ระหว่างปี 1988 ถึงปี 2018 ความสำเร็จของ Machine Learning ตั้งแต่ต้นปี 2023 ที่ผ่านมา คงจะปฏิเสธไม่ได้เลยว่า กระแสความนิยมของ Generative AI นั้นมาแรงมาก ตั้งแต่การเปิดตัวของ ChatGPT ช่วงสิ้นปี 2022 ผู้คนทั่วโลกล้วนตื่นเต้น และประหลาดใจกับความสามารถ และความเข้าใจอันลึกซึ้งในภาษา ของเจ้าแชทบอทตัวนี้ สะท้อนให้เห็นถึงความสำเร็จของการประยุกต์ใช้ Machine Learning ในโลกของภาษา ยังไม่นับความสำเร็จในโลกของ Computer Vision เช่นการทำ Image Classification ในวงการแพทย์เพื่อคัดแยกก้อนเนื้อที่เป็นมะเร็งจากภาพ X-ray รวมถึงการทำ Object Detection ในเทคโนโลยียานยนต์ไร้คนขับ และ อื่น ๆ อีกมากมาย ความท้าทายของข้อมูลในโลกการเงิน แม้ว่าการประยุกต์ใช้เทคนิคใน Machine Learning จะประสบความสำเร็จในหลากหลายสาขาวิชา มากมายเพียงใด แต่ปฏิเสธไม่ได้เลยว่า เทคนิคใน Machine Learning เหล่านั้น เมื่อนำมาประยุกต์ใช้กับโลกของการเงิน และการลงทุน เพื่อค้นหาโอกาสในการลงทุนนั้น กลับพบกับอุปสรรค และความท้าทายมากมาย โดยปัจจัยที่ทำให้การประยุกต์ใช้เทคนิคใน Machine Learning เหล่านั้น ในโลกของการลงทุนเป็นไปได้ยาก ประกอบไปด้วย ขนาดของข้อมูล ถึงแม้ว่าปัจจุบันจะมีข้อมูลมากมาย ไม่ว่าจะเป็นข้อมูลราคาซื้อขาย ปริมาณการซื้อขาย ข้อมูลปัจจัยพื้นฐาน ซึ่งสามารถเก็บได้โดยละเอียด เป็นระยะเวลาหลายปี ที่สามารถนำมาใช้วิเคราะห์ และตีความ เพื่อหาโอกาสในการลงทุนได้ รวมไปถึงข้อมูลทางเลือกต่าง ๆ เช่น ข้อมูลจากแหล่งข่าวต่าง ๆ หรือข้อความจาก สื่อสังคม (ออนไลน์) เช่น Twitter และ Facebook ซึ่งสามารถนำมาใช้ประกอบการประเมินค่าอารมณ์ของตลาดได้นั้น หรือแม้แต่ภาพถ่ายจากดาวเทียม ที่สามารถใช้ติดตามกิจกรรมทางเศรษฐกิจ เช่น ยอดขายอสังหาริมทรัพย์ หรือ อุปทานของสินค้าโภคภัณฑ์ ต่าง ๆ แต่ด้วยข้อจำกัดของระยะเวลาที่มีข้อมูลเหล่านี้ ซึ่งอาจจะเป็นระยะเวลาไม่กี่ทศวรรษ สำหรับข้อมูลทางการเงินส่วนใหญ่ ส่งผลให้กลยุทธ์ที่มีระยะเวลาการซื้อขายเฉลี่ยไม่ถี่พอ เช่น หลักเดือน เป็นต้นไป จะถูกจำกัดด้วยจำนวนจุดข้อมูลที่ไม่เยอะพอเมื่อนำไปใช้สอนโมเดล ทำให้การประยุกต์ใช้เทคนิคทาง Machine Learning นั้นเป็นไปได้ยาก และอาจไม่ได้ประสิทธิภาพ รวมไปถึงการมีอยู่ของ Correlation ระหว่างข้อมูลต่าง ๆ ที่ใช้สอนโมเดล ซึ่งยิ่งจำกัดปริมาณข้อมูลที่เป็นประโยชน์ต่อการเรียนรู้ของโมเดล ทำให้เป็นอุปสรรคต่อการดึงศักยภาพ และความสามารถอันโดดเด่นของ Machine Learning ออกมาใช้ Signal-to-noise ratio หนึ่งในอุปสรรคสำคัญต่อการประยุกต์ใช้ Machine Learning เพื่อหาโอกาส ในโลกของการเงิน การลงทุน คือ การที่ค่าสัดส่วนของ ปริมาณ signal (กลยุทธ์ที่สามารถยืนยันด้วยวิธีการทางสถิติได้ว่าสามารถสร้างผลตอบแทน) ต่อ noise (การเปลี่ยนแปลงของราคาที่ไม่สามารถคาดการณ์ล่วงหน้าได้) นั้นมีค่าที่ต่ำ สิ่งนี้แตกต่างอย่างชัดเจนจากโลกของ Natural Language Processing ซึ่งในแต่ละภาษา ค่อนข้างมีกฎเกณฑ์ที่ชัดเจน หรือโลกของ Computer Vision ที่ค่อนข้างมี signal ที่ชัดเจนเมื่อเทียบกับ noise เช่น ในการทำ Image Classification เพื่อคัดแยกประเภทภาชนะของเบียร์ว่าเป็น กระป๋อง หรือ ขวด ซึ่งเป็นโจทย์ที่ค่อนข้างมี signal (รูปร่าง รูปทรงของภาชนะ) ที่ชัดเจน เมื่อเทียบกับ noise (ภาพพื้นหลัง ความเบลอ หรือ อื่น ๆ) ทำให้มี สัดส่วน signal ต่อ noise ที่สูง ทำให้มีโอกาสที่จะพัฒนาโมเดลที่มีประสิทธิภาพสูงได้ การเปลี่ยนแปลงของภาวะเศรษฐกิจ ซึ่งนำไปสู่การเปลี่ยนแปลงของพฤติกรรมของตลาดการเงิน เป็นหนึ่งในสิ่งที่ทำให้การคาดการณ์ตลาดเป็นเรื่องยาก รวมไปถึงความจริงที่ว่า การพยายามทำกำไรจากตลาดด้วยข้อมูลต่าง ๆ และการแข่งขันจากทุก ๆ ผู้เล่นในตลาด เป็นปัจจัยหลักที่ทำให้ signal ในตลาดมีปริมาณน้อยลง และตลาดมีประสิทธิภาพมากขึ้น เนื่องจากเมื่อผู้เล่นในตลาด มีข้อมูลซึ่งเชื่อถือได้ว่าการเปลี่ยนแปลงของราคาในอนาคตจะเป็นอย่างไร การซื้อขายของผู้เล่นเหล่านี้ จะทำให้ราคามีการเปลี่ยนแปลงเข้าหามูลค่าที่ควรจะเป็น และนั่นทำให้สิ่งที่คาดการณ์ได้เหลืออยู่ในตลาดน้อยลง และสิ่งที่เหลือที่จะทำให้เกิดการเปลี่ยนของราคา จะเป็นข่าวใหม่ ๆ หรือ อารมณ์ตลาดระยะสั้นนั่นเอง ความสามารถในการตีความโมเดล สำหรับโมเดลประสิทธิภาพสูงหลาย ๆ โมเดลใน Machine Learning นั้น มีคุณสมบัติความเป็น black box model กล่าวคือ การตีความการทำงานของโมเดลนั้นทำได้ยาก และมีความคลุมเครือ แต่ในทางกลับกัน ในโลกของการเงิน การลงทุนนั้น การที่โมเดลที่ใช้มีความสามารถในการตีความ และทำความเข้าใจได้ยากนั้น ทำให้มีโอกาสที่จะนำมาสู่ความเสี่ยงที่ไม่คาดคิด ทำให้ผู้จัดการกองทุน หลาย ๆ คน เลือกที่จะยอมรับ และหันเข้าหาโมเดลที่สามารถตีความได้ง่าย และสามารถสื่อสารถึงความเสี่ยงต่าง ๆ กับทางลูกค้าได้ดีกว่า โอกาสในการประยุกต์ใช้ Machine Learning ในการลงทุน ถึงแม้ว่าการประยุกต์ใช้ Machine Learning ในโลกของการเงิน การลงทุน จะเต็มไปด้วยอุปสรรคมากมายเหล่านี้ แต่แน่นอนว่า โอกาสก็มีอยู่มากเช่นเดียวกัน โดยหนึ่งในสิ่งที่ Machine Learning สามารถเข้ามาช่วยได้ดี คือ การคาดการณ์ และลดความเสี่ยงของ Portfolio โดยรวม โดยการนำมาใช้เรียนรู้ และคาดการณ์ correlation ระหว่างแต่ละกลยุทธ์ที่ใช้ ซึ่งเมื่อหลาย ๆ กลยุทธ์ที่ดี และไม่มี correlation ระหว่างกัน ได้ถูกนำมาใช้พร้อมกัน ก็จะทำให้ระดับความเสี่ยงของ portfolio โดยรวมจะต่ำพอ และทำให้สามารถมีการใช้ leverage ร่วมด้วย ซึ่งจะช่วยให้ผลตอบแทนโดยรวมออกมาสูง...
24 January 2024
Quantitative Hedge Fund สร้างผลตอบแทนเหนือตลาด จากข้อมูลมหาศาลได้อย่างไร?
หลาย ๆ ท่านที่สนใจด้านการลงทุน คงจะรู้จักหลักการลงทุนอย่าง Value Investing (VI) ซึ่งเป็นหลักการลงทุนที่นักลงทุนที่ประสบความสำเร็จระดับโลก อย่าง Warren Buffet, Peter Lynch, Charlie Munger และอื่น ๆ อีกหลายท่าน ยึดถือ ปฏิบัติ และ เผยแพร่ต่อสาธารณะชน  มาเป็นระยะเวลายาวนานหลายสิบปี หลักการลงทุนที่ดูแสนเรียบง่ายนี้ มักจะเน้นไปที่การศึกษา ทำความเข้าใจ และประเมินมูลค่าธุรกิจ (หุ้น) ผ่านการประเมินปัจจัยเชิงคุณภาพต่าง ๆ เช่น ความได้เปรียบในการแข่งขัน การเข้ามาของคู่แข่งรายใหม่ อำนาจต่อรองของบริษัท พฤติกรรมของผู้บริโภค ประกอบกับการประเมินปัจจัยเชิงปริมาณ เช่น รายได้ และกำไรในอนาคตของกิจการ ซึ่งจะสะท้อนการเติบโตของกำไรในอนาคต เพื่อนำมาใช้ประกอบการตัดสินใจในการลงทุน ซึ่งล้วนต้องอาศัยการศึกษาวิจัย วิเคราะห์ข้อมูลปริมาณมาก เพื่อทำความเข้าใจสินทรัพย์นั้น ๆ รายตัวอย่างละเอียด Quant Fund ใช้กลยุทธ์อะไร วิธีการดังกล่าวนี้ แตกต่างอย่างสิ้นเชิงกับกับที่ Quant Fund (Quantitative Hedge Fund) อย่าง Renaissance Technologies, Citadel, Two Sigma และอื่น ๆ เลือกใช้ ซึ่งจะเน้นไปที่การสร้าง และใช้อัลกอริทึม เพื่อทำการตัดสินใจ ซื้อขาย หลักทรัพย์ต่าง ๆ โดยอัตโนมัติ ตามกลยุทธ์ต่าง ๆ ยกตัวอย่างเช่น จากตัวอย่างทั้งสามวิธีข้างต้น จะเห็นได้ว่า หลักการในการลงทุน และตัดสินใจซื้อขายหลักทรัพย์ ของ Quant Fund นั้นล้วนต้องเริ่มต้นจากข้อมูลปริมาณมหาศาล ไม่ว่าจะเป็นข้อมูลทั่ว ๆ ไปเกี่ยวกับ ราคาหลักทรัพย์ และปริมาณการซื้อ ขาย ย้อนหลังหลายสิบปี, ข้อมูลปัจจัยพื้นฐานของบริษัท และกลุ่มธุรกิจ อุตสาหกรรมต่าง ๆ , ข้อมูลตัวเลขดัชนีชี้วัดเศรษฐกิจมหภาค เช่น GDP, อัตราเงินเฟ้อ, อัตราดอกเบี้ย เป็นต้น รวมทั้งยังใช้ ข้อมูลอื่น ๆ ที่กองทุนทั่วไป มักไม่ได้ให้ความสำคัญ เช่น ข้อมูลภาพถ่ายจากดาวเทียม/ภาพถ่ายทางอากาศ ซึ่งจะถูกนำมาประมวลผล เพื่อตรวจเช็ค และติดตามการเคลื่อนไหวของกิจกรรมทางเศรษฐกิจ เช่น การดำเนินงานของบริษัท ห้างร้าน หรือการเพาะปลูก เก็บเกี่ยว สินค้าโภคภัณฑ์ ต่าง ๆ หรือ ข้อมูลการสัญจรทางถนน เพื่อวัดระดับกิจกรรมทางเศรษฐกิจ และการขนส่ง เป็นต้น Quantitative Trading มีวิธีการอย่างไร ข้อมูลมหาศาลเหล่านี้ จำเป็นต้องถูกจัดการด้วยเทคนิคทางวิทยาศาสตร์ข้อมูล เช่น การทำความสะอาด หรือ การจัดการข้อมูลที่ผิดปกติ ซึ่งหากไม่ได้รับการจัดการ อาจส่งผลต่อประสิทธิภาพของโมเดล จากนั้นจึงทำการเตรียมความพร้อมข้อมูลก่อนที่จะนำข้อมูลเหล่านี้ ไปใช้ประกอบกลยุทธ์ต่าง ๆ เพื่อสร้างโมเดลหาสัญญาณซื้อ ขาย จากชุดข้อมูลที่มี และสร้างระบบอัลกอริทึมซื้อขายหลักทรัพย์ ซึ่งจะต้องผ่านการ Backtesting หรือการทดสอบระบบซื้อขาย ด้วยชุดข้อมูลในอดีตย้อนหลังหลายปี เพื่อตรวจสอบประสิทธิภาพของกลยุทธ์ที่ใช้ ด้วยตัวชี้วัดต่าง ๆ เช่น Quant Fund ประยุกต์ใช้วิทยาศาสตร์ข้อมูลอย่างไร เช่นเดียวกับหลักการในวิทยาศาสตร์ข้อมูล เราจำเป็นต้องแบ่งชุดข้อมูลที่ใช้สร้างโมเดลการซื้อขาย ออกเป็น training set, validation set, และ test set โดยจะทำการสอนโมเดลด้วย training set หลังจากนั้นจึงทำ hyper-parameter tuning และทำการคัดเลือกโมเดลโดยใช้ validation set สุดท้ายจึงทำการทดสอบโมเดลด้วย test set ซึ่งเป็นข้อมูลที่โมเดลไม่เคยเจอมาก่อน หลังจากได้โมเดลที่ยอดเยี่ยมแล้ว จะเป็นการนำโมเดลที่ได้มาสร้างโปรแกรมซื้อขายหลักทรัพย์ โดยขั้นตอนนี้ เรื่องของความเร็วของการประมวลผลโปรแกรม และความเร็วในการเชื่อมต่อ และดำเนินการซื้อขาย จะมีผลอย่างมาก หลังจากนั้นจะเป็นเรื่องของการติดตามการทำงานของโมเดล และเพิ่มประสิทธิภาพการทำงานของโมเดล ให้มีผลตอบแทนที่สูงขึ้น และลดความเสี่ยงจากปัจจัยต่าง ๆ ไม่ว่าจะมาจากตัวกลยุทธ์ที่ใช้ จากวิกฤตในตลาด หรือจากตัวโปรแกรมซื้อขายที่สร้างขึ้นมา บทส่งท้าย จะเห็นได้ว่าหลักการในวิทยาศาสตร์ข้อมูล นอกจากจะสามารถนำมาประยุกต์ใช้ในธุรกิจต่าง ๆ เพื่อสร้างความเข้าใจเชิงลึก หรือสร้างโมเดลที่ตอบโจทย์มากมายได้แล้ว เมื่อนำมาประยุกต์ใช้ในโลกของการลงทุน สามารถสร้างผลตอบแทนเหนือตลาด ได้เป็นระยะเวลายาวนาน โดยตัวอย่างที่โด่งดังที่สุด คงหนีไม่พ้น The Medallion Fund ซึ่งบริหารโดย Renaissance Technologies ที่สามารถสร้างผลตอบแทนทบต้นต่อปี สูงถึง 71.8% (ก่อนหักค่าบริหารกองทุน) ระหว่างปี 1994 ถึงปี 2014 โดยความน่าสนใจของ Renaissance Technologies คือเป็น Hedge Fund ที่ประกอบไปด้วย นักคณิตศาสตร์ และนักวิทยาศาสตร์จำนวนมาก โดยที่พนักงานส่วนใหญ่ ไม่ได้มีพื้นฐานมาจากสายการเงิน เหมือนกองทุนทั่ว ๆ ไป บทความโดย ปิ่นพงศ์ สุขแก้วตรวจทานและปรับปรุงโดย ดวงใจ จิตคงชื่น
6 February 2023
PDPA Icon

We use cookies to optimize your browsing experience and improve our website’s performance. Learn more at our Privacy Policy and adjust your cookie settings at Settings

Privacy Preferences

You can choose your cookie settings by turning on/off each type of cookie as needed, except for necessary cookies.

Accept all
Manage Consent Preferences
  • Strictly Necessary Cookies
    Always Active

    This type of cookie is essential for providing services on the website of the Personal Data Protection Committee Office, allowing you to access various parts of the site. It also helps remember information you have previously provided through the website. Disabling this type of cookie will result in your inability to use key services of the Personal Data Protection Committee Office that require cookies to function.
    Cookies Details

  • Performance Cookies

    This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

  • Functional Cookies

    This type of cookie enables the Big Data Institute (Public Organization)’s website to remember the choices you have made and deliver enhanced features and content tailored to your usage. For example, it can remember your username or changes you have made to font sizes or other customizable settings on the page. Disabling these cookies may result in the website not functioning properly.

  • Targeting Cookies

    "This type of cookie helps the Big Data Institute (Public Organization) understand user interactions with its website services, including which pages or areas of the site are most popular, as well as analyze other related data. The Big Data Institute (Public Organization) also uses this information to improve website performance and gain a better understanding of user behavior. Although the data collected by these cookies is non-identifiable and used solely for statistical analysis, disabling them will prevent the Big Data Institute (Public Organization) from knowing the number of website visitors and from evaluating the quality of its services.

Save settings
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.