ในยุคสมัยที่จำนวนของข้อมูลมีเพิ่มมากขึ้นเรื่อยๆ การจัดเจ็บข้อมูลให้เป็นระบบเพื่อนำมาใช้ จึงกลายเป็นเรื่องสำคัญสำหรับองค์กรที่ต้องจัดการกับข้อมูลจำนวนมาก
Data Architecture จึงเป็นหนึ่งในแนวทางที่องค์กรควรศึกษาเพื่อให้เกิดประสิทธิภาพในการจัดเก็บข้อมูล
Data Architecture คือ การวางแผนและกำหนดโครงสร้างของข้อมูลที่ถูกออกแบบโดยองค์กรเพื่อใช้ในการจัดเก็บข้อมูล ซึ่งทำหน้าที่คล้ายพิมพ์เขียวที่แสดงการไหลของข้อมูลที่จัดเก็บไว้ผ่านองค์ประกอบต่างๆ ในบางกรณีโครงสร้างของ Data Architecture อาจจะมีความซับซ้อนที่แตกต่างกันไปตามเป้าหมายและหน้าที่ของแต่ละองค์กร

โดย Data Architecture นั้นมีองค์ประกอบสำคัญอยู่ 3 อย่างได้แก่
- Data Warehouse
- Data Mart
- Data Lake

Data Warehouse
Data Warehouse คือจุดที่รวบรวมข้อมูลที่มีความเชื่อมโยงจากหลายๆแหล่งที่แตกต่างกันไปภายในองค์กร โดยจะทำหน้าที่เป็นจุดศูนย์กลางเดียว ซึ่งหลังจากการรวบรวม ข้อมูลจะไหลผ่านกระบวนการที่มีชื่อว่า ETL (Extract-Transform-Load) ภายในขั้นตอนนี้จะมีการแปลงข้อมูลหลายครั้งเพื่อให้ตรงตามต้นแบบที่กำหนดเอาไว้
Data Mart
Data Mart คือจะมีความคล้ายกับ Data Warehouse แต่จะแตกต่างกันที่ Data Mart จะประกอบด้วยข้อมูลย่อย ซึ่งเป็นเหมือนซับเซ็ตเล็กๆของข้อมูลที่ผ่านการจัดเรียง เพื่อให้ผู้ใช้บางกลุ่มในองค์กรเข้าถึงและนำไปใช้ในงานนั้นๆที่มีหน้าที่ต่างกันออกไป โดยจะมีประโยชน์สำหรับองค์กร, ธุรกิจ หรือแผนกต่างๆในการเข้าถึงข้อมูลได้อย่างรวดเร็วเมื่อต้องเจอชุดข้อมูลที่มีความกว้างค่อนข้างมาก
Data Lake
Data Lake คือ แหล่งรวมข้อมูลข้อมูลดิบเอาไว้โดยจะยังไม่มีการเปลี่ยนแปลงจากต้นทางหรือจำแนกหมวดหมู่ ซึ่งมีความต่างจาก Data Warehouse ที่กักเก็บข้อมูลที่ถูกประมวลไว้แล้ว ภายใน Data Lake จะมีความยืดหยุ่นในการเก็บข้อมูลมากกว่า โดยจะมีประโยชน์กับ นักวิทยาศาสตร์ข้อมูล (Data Scientist), วิศวกรข้อมูล (Data Engineer) และ นักพัฒนา (Developers) เพื่อเข้าไปสำรวจข้อมูลและนำไปใช้ในงาน Machine Learning
ประโยชน์และความสำคัญของ Data Architecture
- สามารถช่วยให้องค์กรและผู้ใช้งานภายในเข้าถึงข้อมูลได้อย่างรวดเร็วและตรงตามที่ต้องการ
- สามารถช่วยให้ข้อมูลถูกจัดเก็บเป็นระบบมากขึ้น
- สามารถช่วยให้การจัดการวงจรชีวิตของข้อมูล (Data Life Cycle) ในอนาคตมีความสะดวกมากขึ้น
- สามารถช่วยเพิ่มความปลอดภัยและความเป็นส่วนตัวของข้อมูลมากขึ้น
สิ่งที่ควรให้ความสำคัญในการทำ Data Architecture
- ความยากง่ายในการใช้ข้อมูลสำหรับผู้ใช้งานทั่วไปที่ไม่ใช่ Developers เนื่องจากข้อมูลที่ถูกจัดเก็บมีความแตกต่างกันไปตามจุดประสงค์จึงทำให้มีผู้ใช้งานที่หลากหลายซึ่งไม่ใช่แค่ฝ่ายไอที (IT) เท่านั้น
- การจัดเก็บข้อมูลแบบ Cloud-native / Cloud-Enabled ซึ่งจะทำให้เข้าถึงข้อมูลมีความสะดวกมากขึ้น และลดข้อจำกัดลง
- การออกแบบให้ตรงกับเป้าหมายการใช้งาน ซึ่งในบางครั้งข้อมูลจะถูกเข้าถึงโดยผู้ใช้งานที่ต่างกัน ทำให้ข้อมูลที่ถูกจัดเรียงมาควรจะมีความเหมาะสมกับงานของผู้ใช้งานนั้นๆ เพื่อลดความซับซ้อนและปัญหาในการนำไปใช้