เลือกแผนภาพอย่างไรสำหรับการทำ Data Visualization

เลือกแผนภาพอย่างไรสำหรับการทำ Data Visualization

19 มีนาคม 2564

หากเรามีข้อมูลมากมายไปหมด ก็คงจะเป็นเรื่องที่ยากลำบากในการหา Insight จากข้อมูล รวมถึงการใช้ข้อมูลเพื่ออธิบายให้ผู้อื่นเข้าใจสิ่งที่เราต้องการจะสื่อสาร วิธีการที่ง่ายที่สุดก็คือการทำ Data Visualization – สร้างกราฟหรือแผนภาพจากข้อมูล แต่หลาย ๆ คน อาจจะสงสัยว่าจะเลือกกราฟหรือแผนภาพอย่างไร ให้เหมาะสมกับข้อมูลที่มีและตอบโจทย์ที่เราต้องการ

เลือกอย่างไร?

            แผนภาพแต่ละประเภทนั้นมีวิธีการใช้ที่แตกต่างกัน เราจึงต้องตอบคำถามเหล่านี้ก่อน

1. Visualization นี้ตอบคำถามอะไร

          การทำ Data Visualization ก็เปรียบเสมือนการเล่าเรื่อง (Story Telling) จากข้อมูลที่มีอยู่เพื่อตอบคำถามที่ผู้ชมอาจจะมี แน่นอนว่าถ้าเรื่องราว (Story) หรือ คำถามที่จะตอบแตกต่างกัน ก็จะต้องใช้แผนภาพคนละแบบในการอธิบาย ยกตัวอย่างเช่น หากเราต้องการตอบคำถามว่าผลิตภัณฑ์ประเภทใดที่ขายดีที่สุด ก็ควรจะใช้กราฟที่แสดงยอดขายที่แตกต่างกันของแต่ละประเภทให้เห็นชัดเจน แต่หากเราต้องการทราบว่าเวลาที่ใช้ในการจัดส่งสินค้าเป็นอย่างไร อาจจะต้องแสดงให้เห็นถึงการกระจายตัวของข้อมูลเวลาที่ใช้ในการจัดส่ง

2. ผู้ชม (Audience) เป็นคนประเภทไหน

การทำ Data Visualization ให้ผู้ชมที่เป็นกลุ่มผู้บริหารควรมีรูปแบบที่ต่างออกไปจาก Visualization ที่ทำสำหรับผู้ชมกลุ่มผู้ปฏิบัติการ เนื่องด้วยความสนใจที่แตกต่างกันระหว่างคนสองกลุ่ม นอกจากนี้ระดับความเข้าใจของผู้ชมเป้าหมายก็ส่งถึงตัวเลือกรูปแบบในการนำเสนอข้อมูล ตัวอย่างเช่น กราฟที่ดูง่าย ๆ และกระชับ เช่น แผนภูมิวงกลม (Pie Chart) อาจจะเหมาะสมกว่าการทำแผนที่ต้นไม้ (Treemap) ที่ต้องใช้เวลาดูและคิดมากกว่า ข้อมูลอาจจะละเอียดมากเกินไปเหมาะสำหรับผู้บริหาร เป็นต้น

3. ข้อมูลมีจำนวนมากขนาดไหน

          จำนวนของข้อมูลก็ส่งผลต่อแผนภาพที่เราจะสร้าง ตัวอย่างเช่น ถ้าทำแผนภาพการกระจาย (Scatter plot) ที่บอกถึงความสัมพันธ์ระหว่างยอดขายและราคา หากสินค้าซึ่งแทนด้วยจุดแต่ละจุดบนแผนภาพมีจำนวนมากก็จะทำให้แผนภาพนั้นดูเข้าใจได้ยาก (ซ้าย) ตัวอย่างเช่นนี้อาจจะต้องอาศัยการรวบแถวข้อมูล (Aggregate) ก่อนเพื่อจัดกลุ่มเป็นหมวดหมู่ (ขวา) เป็นต้น

4. ข้อมูลเป็นประเภทอะไร

          โดยทั่วไปแล้วข้อมูลอาจแบ่งออกเป็นสองประเภท คือ ข้อมูลประเภทหมวดหมู่ (Categorical) และข้อมูลประเภทตัวเลข (Numerical) การสร้างแผนภาพสำหรับข้อมูลต่างประเภทก็จะมีความแตกต่างกัน ตัวอย่างเช่น หากต้องการเปรียบเทียบจำนวนสินค้าในประเภทผลิตภัณฑ์แตกต่างกันก็จะใช้กราฟแท่ง แต่ถ้าเปรียบเทียบจำนวนสินค้ากับผลิตภัณฑ์ราคาต่าง ๆ กัน ก็อาจจะใช้ ฮิสโตแกรม (Histogram) เพราะว่า ประเภทผลิตภัณฑ์กับราคาสินค้าเป็นข้อมูลคนละประเภทกัน

5 องค์ประกอบของแผนภาพที่ใช้สื่อถึงอะไร

          หลักการของการทำแผนภาพ คือให้องค์ประกอบ (Element) แทนที่ตัวเลขหรือข้อมูลของเรา ตัวอย่างเช่น ในกราฟวงกลมเราให้ สีแสดงถึงหมวดหมู่ และมุมหรือพื้นที่ของพาย แสดงถึงจำนวนในหมวดหมู่นั้น ๆ แต่ละองค์ประกอบควรจะสื่อถึงปริมาณเพียงอย่างเดียว เพื่อให้สื่อสารได้อย่างแม่นยำ

การใช้สีในแผนภาพ ด้านซ้ายใช้สีในการสื่อถึงหมวดหมู่สินค้า แต่ในด้านขวาสีไม่ได้บอกถึงอะไรจึงไม่มีความจำเป็นเพราะอาจทำให้สับสน

ทีนี้มาดูตัวอย่างแผนภาพต่าง ๆ ที่ใช้ตอบคำถามหลากหลายรูปแบบ

1. ต้องการแสดงถึงขนาดที่ต่างกัน หรือ จัดลำดับ

  • แผนภูมิแท่ง (Bar Chart) เป็น แผนภาพที่ง่ายสุด ที่สามารถใช้เปรียบเทียบข้อมูลในแต่ละหมวดหมู่ สามารถแสดงถึงลำดับและขนาดได้ชัดเจน โดยแกนควรจะเริ่มต้นที่เลขศูนย์เพื่อให้ความสูงของแท่งแสดงถึงปริมาณที่ต้องการจะนำเสนอ ไม่ควรย่นกราฟ
  • แผนภูมิรูปภาพ (Pictogram) ในบางกรณี แผนภูมิรูปภาพอาจจะเป็นทางเลือกที่สวยและเข้าใจง่าย ควรใช้สำหรับกรณีที่นำเสนอเป็นจำนวนเต็มที่ไม่เยอะมากเท่านั้น (อย่าไปตัดแขนคนเพื่อแสดงเลขทศนิยม!)

โดยทั้งสองแบบอาจจะใช้สีในกรณีที่ต้องการแบ่งหมวดหมู่ ขนาดที่แตกต่างกันจะทำให้เห็นได้ชัดเจนว่าปริมาณในข้อมูลกลุ่มไหนมีขนาดใหญ่ที่สุด

2. ต้องการเห็นความสัมพันธ์

หากต้องการหาความสัมพันธ์ระหว่างสองตัวแปร เช่น ราคา กับ กำไร สัมพันธ์กันอย่างไร

  • แผนภาพการกระจาย (Scatter Plot) เป็นวิธีที่ดีที่สุดในการแสดงความสัมพันธ์ระหว่างตัวแปรประเภทตัวเลขสองตัวแปร สามารถใส่เส้นประกอบเพื่อแสดงให้เห็นถึงแนวโน้มได้
  • แผนภูมิฟอง (Bubble chart) หากมีตัวแปรที่สามที่ต้องการแสดงเป็นมิติเพิ่มเติมจากแผนภาพการกระจายทั่วไป อาจนำตัวแปรนั้นมาแสดงโดยใช้ขนาดหรือพื้นที่ของวงกลมได้
  • ตารางแผนภาพความร้อน (Heatmap) หากเป็นข้อมูลหมวดหมู่ แต่มีลำดับขั้น (Ordinal) และอยากแสดงถึงความสัมพันธ์ของตัวแปรเหล่านี้กับปริมาณที่สนใจ อาจจะใช้ตารางแผนภาพความร้อนหรือ หลายคนรู้จักกันในชื่อ Heatmap โดยใช้สีแสดงถึงปริมาณที่สนใจ

3. ต้องการเห็นการกระจายตัว

  • ฮิสโตแกรม (Histogram) ใช้แสดงการกระจายตัวได้ดีและละเอียด หากต้องการแสดงจำนวนของตัวแปรประเภทตัวเลข
  • Boxplot ใช้แสดงการกระจายตัวของข้อมูลเช่นเดียวกับฮิสโตแกรมแต่จะมีความกระชับกว่า และสามารถใช้ในการเปรียบเทียบของแต่ละหมวดหมู่ได้

4. ต้องการเห็นการเปลี่ยนแปลงตามช่วงเวลา

  • แผนภูมิเส้น/แผนภูมิแท่ง จะแสดงให้เห็นถึงการเชื่อมโยงของแต่ละช่วงเวลาได้ดีกว่ากราฟแท่ง แต่โดยทั่วไปสามารถใช้ได้ทั้งสองอย่าง หรือ อาจจะผสมกันถ้าต้องการแสดงสองปริมาณพร้อมกันและต้องการให้เห็นความแตกต่าง
  • แผนภูมิพื้นที่ (Area Chart) หากต้องการแสดงให้เห็นถึงองค์ประกอบในแต่ละช่วงเวลาประกอบกับการเปลี่ยนแปลงตามช่วงเวลาอาจเลือกใช้แผนภูมิพื้นที่นำเสนอข้อมูลชุดนั้น

5. ต้องการเห็นข้อมูลที่เบี่ยงเบนจากปกติ

หากต้องการเน้นว่าตัวเลขนั้นเบี่ยงเบนจากค่าอ้างอิง เช่น เป้าหมายหรือค่าเฉลี่ยมากน้อยแต่ไหน มีค่าบวกหรือลบมากน้อยเพียงใด เราสามารถใช้สีในการช่วยสื่อถึงว่าตัวเลขมีค่าสูงหรือต่ำกว่าเป้าหมายที่ต้องการแสดงเพียงใด

  • แผนภูมิแท่งสี อาจจะใช้สีในแท่งมาช่วยสื่อให้เห็นว่าเป็นตัวเลขเชิงบวก เช่น กำไร หรือ เชิงลบ เช่นขาดทุนได้
  • แผนภูมิเส้นสี ลักษณะเดียวกันแต่ใช้เส้นสำหรับข้อมูลตามเวลา

6. ต้องการแสดงถึงองค์ประกอบ

  • แผนภูมิวงกลม (Pie Chart) จะใช้กับตัวแปรประเภทหมวดหมู่ว่าเพื่อแสดงให้เห็นว่าแต่ละหมวดหมู่มีจำนวนหรือปริมาณที่เกี่ยวข้องเท่าใด โดยใช้ขนาดมุมหรือพื้นที่เป็นตัวบ่งชี้ ทั้งนี้ไม่ควรใช้ในกรณีที่มีหมวดหมู่มากเกินไป (บางคนบอกว่าไม่ควรเกิน 5 หมวดหมู่) ปริมาณที่ใช้ควรรวมเป็น 100% ไม่ควรใช้ในกรณีที่ปริมาณนั้นไม่สามารถนำมาบวกกันได้ เช่น ค่าเฉลี่ยของยอดขายในแต่ละประเภทผลิตภัณฑ์
  • แผนภูมิโดนัท (Donut Chart) เหมือน Pie Chart แต่มีพื้นที่ตรงกลางไว้ที่สามารถใช้แสดงข้อความ หรือ ปริมาณรวมได้
  • แผนที่ต้นไม้ (Treemap) คล้าย Pie Chart แต่สามารถใช้แบ่งหมวดหมู่เป็นลำดับชั้นได้ และหากมีหลายหมวดหมู่ก็จะดูรู้เรื่องกว่า โดยจะใช้พื้นที่สี่เหลี่ยมในการแสดงถึงปริมาณ และสีอาจจะใช้ในการแบ่งหมวดหมู่หรือจัดลำดับได้
ภาพประกอบจาก Workpoint News
  • แผนภูมิแท่งแบบต่อกัน (Stacked Bar Chart) หากต้องการเปรียบเทียบองค์ประกอบภายในแต่ละหมวดหมู่ ก็ใช้ประเภทนี้ได้ โดยอาจแสดงเป็นเปอร์เซ็นต์หากต้องการเน้นถึงองค์ประกอบ (ซ้าย) หรือจำนวนดิบหากต้องการเน้นถึงปริมาณมากน้อยด้วย (ขวา)

  • แผนภูมิน้ำตก (Waterfall Chart) แสดงให้เห็นว่ายอดรวมทั้งหมดแตกได้เป็นอะไรบ้าง มักใช้กับข้อมูลจำนวนเงิน เช่น งบบัญชี
จาก FusionCharts Blog

7. ต้องการแสดงถึงข้อมูลเชิงพื้นที่

  • แผนที่โคโรเพลท (Choropleth Map) คือการใช้สีในการแสดงปริมาณต่าง ๆ บนพื้นที่นั้น มีข้อควรระวังคือหากพื้นที่มีขนาดใหญ่ บริเวณที่มีสีก็จะใหญ่ตามไปด้วยซึ่งอาจจะทำให้ผู้อ่านเข้าใจผิด ดังนั้นปริมาณที่นำมาใช้แสดงโดยสีใน Choropleth map ควรจะเป็นปริมาณที่ไม่ขึ้นกับขนาดพื้นที่ เช่น ความหนาแน่นประชากรต่อพื้นที่ มากกว่าปริมาณที่อาจจะขึ้นกับพื้นที่ เช่น จำนวนประชากรรวม (สามารถอ่านเพิ่มเติมได้ที่ สร้างแผนที่การระบาดโควิด-19 อย่างถูกหลักการ)
  • แผนที่แสดงด้วยสัญลักษณ์สัดส่วน (Proportional Symbol Map) ใช้ขนาดของสัญลักษณ์ เช่น วงกลม แสดงถึงปริมาณ การใช้แผนภาพลักษณะนี้จะทำให้แสดงข้อมูลได้โดยไม่ต้องกังวลถึงขนาดของพื้นที่ ตัวอย่าง เช่น จำนวนผู้ติดเชื้อในแต่ละประเทศมักจะใช้แผนภาพแบบนี้ แทนที่จะเป็น Choropleth Map

ตัวอย่างการใช้ Proportional Symbol Map เพื่อแสดงจำนวนประชากร จะแสดงให้เห็นถึงการกระจุกตัวได้ชัดเจนกว่าการใช้สีแสดงจำนวนประชากร
  • แผนที่แสดงข้อมูลด้วยจุด (Dot Map) / แผนที่ความร้อน (Heatmap) หากข้อมูลมีความละเอียดถึงขั้นละติจูด ลองจิจูด อาจแสดงข้อมูลเป็นจุดตามแผนที่ แต่หากข้อมูลมีจำนวนมากสามารถใช้ Heatmap ในการแสดงถึงความหนาแน่นของข้อมูลบนพื้นที่แทน
(ซ้าย) Dot map (ขวา) Heat map

แหล่งที่มา

https://www.tableau.com/solutions/gallery/visual-vocabulary

Data Scientist
Government Big Data Institute (GBDi)

แบ่งปันบทความ

กลุ่มเนื้อหา

แท็กยอดนิยม

แจ้งเรื่องที่อยากอ่าน

คุณสามารถแจ้งเรื่องที่อยากอ่านให้เราทราบได้ !
และเราจะนำไปพัฒนาบทความให้มีเนื้อหาที่น่าสนใจมากขึ้น

ไอคอน PDPA

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ “นโยบายคุ้กกี้” และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ “ตั้งค่า”

ตั้งค่าความเป็นส่วนตัว

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

ยอมรับทั้งหมด
จัดการความเป็นส่วนตัว
  • คุกกี้ที่มีความจำเป็น (Strictly Necessary Cookies)
    เปิดใช้งานตลอด

    คุกกี้ประเภทนี้มีความจำเป็นต่อการให้บริการเว็บไซต์ของ สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล เพื่อให้ท่านสามารถเข้าใช้งานในส่วนต่าง ๆ ของเว็บไซต์ได้ รวมถึงช่วยจดจำข้อมูลที่ท่านเคยให้ไว้ผ่านเว็บไซต์ การปิดการใช้งานคุกกี้ประเภทนี้จะส่งผลให้ท่านไม่สามารถใช้บริการในสาระสำคัญของ สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล ซึ่งจำเป็นต้องเรียกใช้คุกกี้ได้
    รายละเอียดคุกกี้

  • คุกกี้เพื่อการวิเคราะห์และประเมินผลการใช้งาน (Performance Cookies)

    คุกกี้ประเภทนี้ช่วยให้ BDI ทราบถึงการปฏิสัมพันธ์ของผู้ใช้งานในการใช้บริการเว็บไซต์ของ BDI รวมถึงหน้าเพจหรือพื้นที่ใดของเว็บไซต์ที่ได้รับความนิยม ตลอดจนการวิเคราะห์ข้อมูลด้านอื่น ๆ BDI ยังใช้ข้อมูลนี้เพื่อการปรับปรุงการทำงานของเว็บไซต์ และเพื่อเข้าใจพฤติกรรมของผู้ใช้งานมากขึ้น ถึงแม้ว่า ข้อมูลที่คุกกี้นี้เก็บรวบรวมจะเป็นข้อมูลที่ไม่สามารถระบุตัวตนได้ และนำมาใช้วิเคราะห์ทางสถิติเท่านั้น การปิดการใช้งานคุกกี้ประเภทนี้จะส่งผลให้ BDI ไม่สามารถทราบปริมาณผู้เข้าเยี่ยมชมเว็บไซต์ และไม่สามารถประเมินคุณภาพการให้บริการได้

  • คุกกี้เพื่อการใช้งานเว็บไซต์ (Functional Cookies)

    คุกกี้ประเภทนี้จะช่วยให้เว็บไซต์ของ BDI จดจำตัวเลือกต่าง ๆ ที่ท่านได้ตั้งค่าไว้และช่วยให้เว็บไซต์ส่งมอบคุณสมบัติและเนื้อหาเพิ่มเติมให้ตรงกับการใช้งานของท่านได้ เช่น ช่วยจดจำชื่อบัญชีผู้ใช้งานของท่าน หรือจดจำการเปลี่ยนแปลงการตั้งค่าขนาดฟอนต์หรือการตั้งค่าต่าง ๆ ของหน้าเพจซึ่งท่านสามารถปรับแต่งได้ การปิดการใช้งานคุกกี้ประเภทนี้อาจส่งผลให้เว็บไซต์ไม่สามารถทำงานได้อย่างสมบูรณ์

  • คุกกี้เพื่อการโฆษณาไปยังกลุ่มเป้าหมาย (Targeting Cookies)

    คุกกี้ประเภทนี้เป็นคุกกี้ที่เกิดจากการเชื่อมโยงเว็บไซต์ของบุคคลที่สาม ซึ่งเก็บข้อมูลการเข้าใช้งานและเว็บไซต์ที่ท่านได้เข้าเยี่ยมชม เพื่อนำเสนอสินค้าหรือบริการบนเว็บไซต์อื่นที่ไม่ใช่เว็บไซต์ของ BDI ทั้งนี้ หากท่านปิดการใช้งานคุกกี้ประเภทนี้จะไม่ส่งผลต่อการใช้งานเว็บไซต์ของ BDI แต่จะส่งผลให้การนำเสนอสินค้าหรือบริการบนเว็บไซต์อื่น ๆ ไม่สอดคล้องกับความสนใจของท่าน

บันทึกการตั้งค่า
ไซต์นี้ลงทะเบียนกับ wpml.org ในฐานะไซต์พัฒนา สลับไปยังไซต์การผลิตโดยใช้รหัส remove this banner.