Power Query คืออะไร
ในยุคที่ของ Big Data นั้น Data เปรียบได้กับ New oil ที่ทุกบริษัทต้องเรียนรู้ที่จะนำทรัพยากรข้อมูลเหล่านี้มาใช้ให้เกิดประโยชน์และสร้างกำไรให้กับบริษัท คุณภาพของ Data หรือ ข้อมูล ถือเป็นหนึ่งในเรื่องสำคัญที่สุดที่คนทำ Data ต้องคำนึงถึง การมีข้อมูลที่เป็นระบบและอยู่ในรูปแบบที่เหมาะสมและเป็นสากลก็จะทำให้เราสามารถนำข้อมูลเหล่านั้นไปใช้ทำงานต่อไม่ว่าจะเป็นในส่วนของการทำ Visualization หรือ การนำไปข้อมูลไปต่อยอดในการเทรน Machine Learning Model เพื่อใช้ในการ Predict ความเป็นไปได้ต่างๆ แต่ถ้าหากข้อมูลที่ได้มาไม่เป็นระบบระเบียบไม่มีการ Cleaning ที่เหมาะสมก็อาจจะทำให้ผลลัพธ์ที่ได้ออกมาจากข้อมูลเหล่านี้เกิดการ Bias หรือไม่สามารถที่จะนำเสนอข้อมูลตามความเป็นจริงได้ หรือเรียกง่ายๆ ว่า “ Garbage in, garbage out” นั้นเอง โดยข้อมูลจาก Dataleum ได้บอกไว้ว่า 60% ของเวลาที่ถูกใช้ในการทำงานทั้งหมดของ Data Analyst นั้นถูกใช้ไปกับการ Cleaning data

https://x.com/dataleum/status/1637826495182716929
Power Query
Power Query จึงเป็นเครื่องมือที่จะเข้ามาช่วยให้งานในการ Cleaning data นั้นทำได้ง่ายสะดวกและเป็นระบบระเบียบมากยิ่งขึ้น โดย Power Query นั้นจะเป็นเครื่องมือที่อยู่ใน Microsoft Excel 2013 ขึ้นไป Microsoft Excel 365 และ Microsoft Power BI โดยหน้าที่หลักของ Power Query คือ การทำให้ข้อมูลที่มีอยู่ออกมาเป็นระบบระเบียบเหมาะสมกับการนำไปใช้งานต่อ หรือที่เรียกว่ากระบวนการ ETL (Extract Transform Load) นั้นเอง โดยการทำงานของ Power Query บนพื้นฐานภาษา M ซึ่งทำให้การทำ Data Cleansing นั้นเป็นระบบมากยิ่งขึ้น โดยในทุกๆ กระบวนการจะมีการบัทึกไว้ใน Applied Steps เพื่อให้ผู้ใช้สามารถติดตามกระบวนการทำงานและแก้ไขได้เป็นลำดับขั้น

https://learn.microsoft.com/en-us/power-query/applied-steps
Top 10 Functions of Power Query
- Merge Queries: ใช้สำหรับรวมข้อมูลจากหลายตารางเข้าด้วยกัน คล้ายกับการ JOIN ในฐานข้อมูล ตัวอย่างการใช้งานเช่นหากคุณมีตาราง “ลูกค้า” และ “คำสั่งซื้อ” คุณสามารถใช้ Merge Queries เพื่อรวมข้อมูลลูกค้าเข้ากับคำสั่งซื้อ โดยใช้ “รหัสลูกค้า” เป็นคีย์ในการเชื่อมโยง

https://learn.microsoft.com/en-us/power-query/merge-queries-overview
- Append Queries: ใช้สำหรับต่อข้อมูลจากหลายตารางในแนวตั้ง เหมาะสำหรับการรวมข้อมูลที่มีโครงสร้างเหมือนกัน โดยหากคุณมีรายงานยอดขายแยกตามเดือน (12 ไฟล์) คุณสามารถที่จะใช้ Append Queries เพื่อนำข้อมูลทั้ง 12 เดือนมารวมเข้าด้วยกันเป็นตารางเดียว

https://learn.microsoft.com/en-us/power-query/append-queries
- Pivot Column: ใช้สำหรับแปลงข้อมูลจากแนวยาวเป็นแนวกว้าง ตัวอย่างเช่น หากคุณมีข้อมูลยอดขายที่มีคอลัมน์ “เดือน” และ “ยอดขาย” คุณสามารถใช้ Pivot Column เพื่อแปลงให้แต่ละเดือนเป็นคอลัมน์แยก โดยมียอดขายเป็นค่าในแต่ละคอลัมน์

https://learn.microsoft.com/en-us/power-query/pivot-columns
- Unpivot Columns: ใช้สำหรับแปลงข้อมูลจากแนวกว้างเป็นแนวยาว ตรงข้ามกับ Pivot Column ตัวอย่างเช่น คุณมีตารางยอดขายที่มีคอลัมน์แยกตามเดือน คุณสามารถใช้ Unpivot Columns เพื่อรวมทุกเดือนเป็นคอลัมน์เดียว โดยสร้างคอลัมน์ “เดือน” และ “ยอดขาย” แทน

https://learn.microsoft.com/en-us/power-query/unpivot-column
- Group By: ใช้สำหรับจัดกลุ่มและสรุปข้อมูล คุณมีข้อมูลการขายรายวัน คุณสามารถใช้ Group By เพื่อสรุปยอดขายรวมตามเดือนหรือตามประเภทสินค้า

https://learn.microsoft.com/en-us/power-query/group-by
- Split Column: ใช้สำหรับแยกข้อมูลในคอลัมน์เดียวออกเป็นหลายคอลัมน์ หากคุณมีคอลัมน์ “ชื่อ-นามสกุล” คุณสามารถใช้ Split Column เพื่อแยกเป็นคอลัมน์ “ชื่อ” และ “นามสกุล” โดยใช้ช่องว่างเป็นตัวกำหนดในการแบ่งคอลัมน์

https://learn.microsoft.com/th-th/power-query/split-columns-delimiter
- Replace Values: ใช้สำหรับแทนที่ค่าในข้อมูล ตัวอย่าง: คุณมีข้อมูลเพศที่ใช้ “M” และ “F” คุณสามารถใช้ Replace Values เพื่อแทนที่ “M” ด้วย “ชาย” และ “F” ด้วย “หญิง”

https://learn.microsoft.com/th-th/power-query/replace-values
- Remove Duplicates: ใช้สำหรับลบข้อมูลที่ซ้ำกัน ถ้าคุณมีรายการลูกค้าที่อาจมีการบันทึกซ้ำ คุณสามารถใช้ Remove Duplicates เพื่อลบข้อมูลที่ซ้ำกันออกไปได้

https://learn.microsoft.com/en-us/power-query/working-with-duplicates
- Fill Down: ใช้สำหรับเติมค่าที่หายไปโดยใช้ค่าจากแถวด้านบน เช่น หากคุณมีข้อมูลยอดขายที่แสดงชื่อสินค้าเฉพาะแถวแรกของแต่ละกลุ่ม คุณสามารถใช้ Fill Down เพื่อคัดลอกชื่อสินค้าลงไปในแถวที่ว่างด้านล่าง

https://learn.microsoft.com/en-us/power-query/fill-values-column
- Conditional Column: ใช้สำหรับสร้างคอลัมน์ใหม่โดยใช้เงื่อนไข อย่างเช่นหากคุณมีข้อมูลยอดขาย คุณสามารถใช้ Conditional Column เพื่อสร้างคอลัมน์ “ประเภทลูกค้า” โดยกำหนดเงื่อนไขว่า ถ้ายอดขายมากกว่า 100,000 บาทให้เป็น “VIP” น้อยกว่านั้นให้เป็น “ทั่วไป”

https://learn.microsoft.com/en-us/power-query/add-conditional-column
โดยสรุปแล้วนั้น Power Query ก็เป็นเครื่องมือที่เข้ามาช่วยให้การทำงานของคนที่ทำงานด้าน Data ทำงานได้ง่ายขึ้น ลดการทำงานที่ซ้ำซ้อนและทำให้มีการจัดการกับข้อมูลที่เป็นระบบมากยิ่งขึ้น
หากใครสนใจที่จะเรียนรู้การใช้งาน Power Query ให้ลงลึกเข้าไปอีกทาง Davoy.tech ของเราก็มีคอร์ส In-house training สำหรับองค์กรที่มีความต้องการที่จะพัฒนาศักยภาพ ในการทำงานด้าน Data ก็สามารถติดต่อเรามาได้ที่ Line ที่ @davoy











