Data Architecture คืออะไร?

ในยุคสมัยที่จำนวนของข้อมูลมีเพิ่มมากขึ้นเรื่อยๆ การจัดเจ็บข้อมูลให้เป็นระบบเพื่อนำมาใช้ จึงกลายเป็นเรื่องสำคัญสำหรับองค์กรที่ต้องจัดการกับข้อมูลจำนวนมาก
Data Architecture จึงเป็นหนึ่งในแนวทางที่องค์กรควรศึกษาเพื่อให้เกิดประสิทธิภาพในการจัดเก็บข้อมูล

Data Architecture คือ การวางแผนและกำหนดโครงสร้างของข้อมูลที่ถูกออกแบบโดยองค์กรเพื่อใช้ในการจัดเก็บข้อมูล ซึ่งทำหน้าที่คล้ายพิมพ์เขียวที่แสดงการไหลของข้อมูลที่จัดเก็บไว้ผ่านองค์ประกอบต่างๆ ในบางกรณีโครงสร้างของ Data Architecture อาจจะมีความซับซ้อนที่แตกต่างกันไปตามเป้าหมายและหน้าที่ของแต่ละองค์กร

โดย Data Architecture นั้นมีองค์ประกอบสำคัญอยู่ 3 อย่างได้แก่

  • Data Warehouse
  • Data Mart
  • Data Lake

Data Warehouse

Data Warehouse คือจุดที่รวบรวมข้อมูลที่มีความเชื่อมโยงจากหลายๆแหล่งที่แตกต่างกันไปภายในองค์กร โดยจะทำหน้าที่เป็นจุดศูนย์กลางเดียว ซึ่งหลังจากการรวบรวม ข้อมูลจะไหลผ่านกระบวนการที่มีชื่อว่า ETL (Extract-Transform-Load) ภายในขั้นตอนนี้จะมีการแปลงข้อมูลหลายครั้งเพื่อให้ตรงตามต้นแบบที่กำหนดเอาไว้

Data Mart

Data Mart คือจะมีความคล้ายกับ Data Warehouse แต่จะแตกต่างกันที่ Data Mart จะประกอบด้วยข้อมูลย่อย ซึ่งเป็นเหมือนซับเซ็ตเล็กๆของข้อมูลที่ผ่านการจัดเรียง เพื่อให้ผู้ใช้บางกลุ่มในองค์กรเข้าถึงและนำไปใช้ในงานนั้นๆที่มีหน้าที่ต่างกันออกไป โดยจะมีประโยชน์สำหรับองค์กร, ธุรกิจ หรือแผนกต่างๆในการเข้าถึงข้อมูลได้อย่างรวดเร็วเมื่อต้องเจอชุดข้อมูลที่มีความกว้างค่อนข้างมาก

Data Lake

Data Lake คือ แหล่งรวมข้อมูลข้อมูลดิบเอาไว้โดยจะยังไม่มีการเปลี่ยนแปลงจากต้นทางหรือจำแนกหมวดหมู่ ซึ่งมีความต่างจาก Data Warehouse ที่กักเก็บข้อมูลที่ถูกประมวลไว้แล้ว ภายใน Data Lake จะมีความยืดหยุ่นในการเก็บข้อมูลมากกว่า ซึ่งส่วนใหญ่แล้วถ้าเป็น Architecture ของ Azure เราก็จะเก็บใน Blob Storage เพราะมันจะเก็บไฟล์ได้หลากหลายนามสกุลและไม่จำเป็นต้องจัดโครงสร้าง Data โดยสิ่งนี้จะมีประโยชน์กับ นักวิทยาศาสตร์ข้อมูล (Data Scientist), วิศวกรข้อมูล (Data Engineer) และ นักพัฒนา (Developers) เพื่อเข้าไปสำรวจข้อมูลและนำไปใช้ในงาน Machine Learning

ประโยชน์และความสำคัญของ Data Architecture

  • สามารถช่วยให้องค์กรและผู้ใช้งานภายในเข้าถึงข้อมูลได้อย่างรวดเร็วและตรงตามที่ต้องการ
  • สามารถช่วยให้ข้อมูลถูกจัดเก็บเป็นระบบมากขึ้น
  • สามารถช่วยให้การจัดการวงจรชีวิตของข้อมูล (Data Life Cycle) ในอนาคตมีความสะดวกมากขึ้น
  • สามารถช่วยเพิ่มความปลอดภัยและความเป็นส่วนตัวของข้อมูลมากขึ้น

สิ่งที่ควรให้ความสำคัญในการทำ Data Architecture

  • ความยากง่ายในการใช้ข้อมูลสำหรับผู้ใช้งานทั่วไปที่ไม่ใช่ Developers เนื่องจากข้อมูลที่ถูกจัดเก็บมีความแตกต่างกันไปตามจุดประสงค์จึงทำให้มีผู้ใช้งานที่หลากหลายซึ่งไม่ใช่แค่ฝ่ายไอที (IT) เท่านั้น
  • การจัดเก็บข้อมูลแบบ Cloud-native / Cloud-Enabled ซึ่งจะทำให้เข้าถึงข้อมูลมีความสะดวกมากขึ้น และลดข้อจำกัดลง
  • การออกแบบให้ตรงกับเป้าหมายการใช้งาน ซึ่งในบางครั้งข้อมูลจะถูกเข้าถึงโดยผู้ใช้งานที่ต่างกัน ทำให้ข้อมูลที่ถูกจัดเรียงมาควรจะมีความเหมาะสมกับงานของผู้ใช้งานนั้นๆ เพื่อลดความซับซ้อนและปัญหาในการนำไปใช้

Facebook
Twitter
Pinterest
LinkedIn
Latest Post

E-Tax Invoice

ใบกำกับภาษีอิเล็กทรอนิกส์

Read More »

Power BI

รู้จักรกับ Power BI คืออะ

Read More »