Google BigQuery

พลิกธุรกิจให้กลายเป็น Data-Driven ด้วย Google BigQuery

การขับเคลื่อนธุรกิจให้เดินไปข้างหน้าในยุค Disruption นี้ Data ถือเป็นสิ่งล้ำค่าที่สุดที่ควรมีไว้ในมือ แต่สิ่งที่สำคัญกว่าการมี Data นั้น คือการมี Data Warehouse หรือคลังเก็บข้อมูลที่ดี ที่ทันสมัย สามารถนำข้อมูลที่มีอยู่ไปวิเคราะห์และต่อยอดสร้างกำไรให้กับธุรกิจแบบเรียลไทม์ ทำให้ธุรกิจเติบโตได้อย่างรวดเร็ว

ปัญหาของ Data Warehouse แบบเดิมๆ (Traditional) คือ การที่องค์กรต้องลงทุนกับ License ในการเก็บข้อมูลเหล่านี้อย่างมหาศาล และยังต้องมีการติดตั้งที่ซับซ้อน ใช้ระยะเวลานานในการโหลดข้อมูลขนาดใหญ่เข้ามาใน Cloud อีกทั้งยังมีความยากต่อการทำงานร่วมกันหลายๆคนในเวลาเดียวกัน เนื่องจากระบบสามารถเกิดการล่มหรือค้างได้เรื่อยๆ ไม่มีระบบความปลอดภัยที่หนาแน่นพอ ข้อมูลอาจเกิดการรั่วไหลหรือหายได้ทุกเมื่อ ที่สำคัญยังขาดฟังก์ชันในส่วนของ Predictive Analytics (การวิเคราะห์เชิงคาดการณ์) และ ระบบการประมวลเพื่อนำไปสร้างโมเดล Machine Learning เพื่อวางกลยุทธ์การตลาดให้ตอบโจทย์กลุ่มลูกค้าแบบ Personalized ต่อไป 

ในบทความนี้ เราจะมาพูดถึง Google BigQuery ซึ่งเป็น Cloud Data Warehouse สมัยใหม่ (Modernized) ที่มีระบบการจัดการอย่างเต็มรูปแบบโดย Google ว่า BigQuery เข้ามาจัดการกับปัญหาและข้อจำกัดที่กล่าวมาข้างต้นที่เกิดจาก Data Warehouse แบบ Traditional ด้วยวิธีไหน และการมี Data Warehouse ที่ดีจะช่วยทำให้องค์กรกลายเป็น Data-Driven ได้อย่างไร ถ้าพร้อมแล้วเลื่อนลงไปอ่านกันต่อได้เลยครับ

ประโยชน์หลักของ Google BigQuery

1) ไม่ต้องติดตั้ง ใช้งานได้ทันที (Serverless)

Google BigQuery

Data Warehouse แบบเดิมๆใช้ความสามารถในการทำ Analytics ได้เพียงแค่ 15 เปอร์เซ็นต์เท่านั้น ในขณะที่อีก 85 เปอร์เซ็นต์ที่เหลือหมดไปกับการติดตั้ง, การโหลดข้อมูลเข้าคลัง, การปรับจูนระบบการทำงาน, การ Back-up ข้อมูล หรือการ Monitoring ทั้งหลาย แต่พอเป็น Serverless Data Warehouse อย่าง BigQuery ทีมไม่ต้องไปยุ่งกับเรื่องของ Operation เลย กล่าวคือทีมสามารถโฟกัสไปที่การ Query วิเคราะห์หาข้อมูลเชิงลึกเพียงอย่างเดียวได้เต็ม 100 เปอร์เซ็นต์

Google BigQuery

นอกจากนี้ BigQuery ยังมี Architecture (สถาปัตยกรรมการจัดเก็บข้อมูล) ที่แข็งแกร่ง ซึ่งจะแยกส่วนระหว่างตัว Storage (เก็บข้อมูล) กับตัว Processing (ประมวลผล) ออกจากกัน แต่ทั้งสองส่วนยังสื่อสารกันผ่านระบบเครือข่ายความเร็วสูงระดับ Petabit ทำให้รองรับข้อมูลโหลดขนาดใหญ่เข้ามาได้แบบสบายๆ ไม่มีสะดุด อีกทั้งยังมีความยืดหยุ่นในการใช้งาน โดยที่ทีมสามารถนำข้อมูลเข้ามาเก็บไว้ส่วนหนึ่ง และนำไปประมวลผลอีกส่วนหนึ่งได้ทันที ด้วยภาษา SQL และยังมี Library รองรับภาษาเขียนโค้ดอื่นๆ ไม่ว่าจะเป็น Java, Node.js, Python หรือ Ruby เพื่อให้การทำงานเป็นไปได้อย่างราบรื่น

2) ใช้เท่าไหร่ จ่ายเท่านั้น (Pay-per-use)

Google BigQuery

ในการใช้ Data Warehouse แบบเดิมๆ หรือ On-Premise องค์กรอาจต้องลงทุนมหาศาลกับทรัพยากรต่างๆ โดยไม่จำเป็น แต่สำหรับ BigQuery องค์กรสามารถจ่ายได้ตามปริมาณการใช้งานจริงในแต่ละเดือนได้เลย โดยที่ไม่ต้องมานั่งกังวลกับการต้องให้ทีมมานั่งเฝ้าระบบ เนื่องจาก Google คอยดูแลทางด้าน Operation ทั้งหมดอยู่แล้วตลอด 24 ชั่วโมง หากเราเปรียบเทียบค่าใช้จ่ายภายในระยะเวลา 3 ปี สำหรับ Data Warehouse แบบเดิม และ BigQuery องค์กรจะสามารถประหยัดค่าใช้จ่ายลงไปได้ถึง 52 เปอร์เซ็นต์เลยทีเดียว 

3) ทีมเข้าถึงข้อมูลได้ง่าย (Accessible)

Google BigQuery

ใน Google BigQuery ทีมสามารถโหลดข้อมูลเข้าได้อย่างง่ายดาย ยิ่งถ้าเป็นแพลตฟอร์มยอดนิยมส่วนใหญ่ในตลาด ทีมไม่ต้องทำการโค้ดใดๆเลย เนื่องจากทาง BigQuery รองรับอยู่แล้ว เช่น Google Ads, Firebase, Google Analytics, Youtube Analytics, Amazon Redshift, Salesforce, Shopify และแพลตฟอร์มอื่นๆ อีกมากกว่า 100 แพลตฟอร์ม 

อีกรูปแบบหนึ่งก็คือ ข้อมูลถูกเก็บไว้ที่อื่น อาจจะเป็น Data Lake, Google Drive, Cloud Storage, Google Sheets หรือ SQL Server ต่างๆ ทีมก็สามารถ Integrate (เชื่อมต่อ) ข้อมูล เข้า BigQuery แล้วทำการ Query ข้อมูลผ่านตัว BigQuery ได้เช่นกัน

Google BigQuery

นอกจากนี้ BigQuery ยังทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่ายสำหรับทีมงานทุกคน เนื่องจากปัญหาที่ว่าทุกคนไม่สามารถที่จะเขียนโค้ดได้ จึงยังต้องอาศัย Data Analyst หรือทีมอื่นๆที่เขียนโค้ด SQL ได้ แต่สำหรับทีมอื่นๆ อย่างทีมจัดซื้อ, ทีมขาย หรือ การตลาดที่ใช้ Workspace อย่าง Google Sheets ก็สามารถเชื่อมข้อมูลจาก Sheets เข้าตัว BigQuery ผ่านเครื่องมือ Connected Sheets ได้โดยไม่ต้องเขียนโค้ดใดๆ และในกรณีที่ข้อมูลมีการอัพเดท BigQuery ก็จะทำการอัพเดทข้อมูลเหล่านั้นให้โดยอัตโนมัติ ทำให้ทีมได้ข้อมูลเชิงลึกแบบเรียลไทม์จริงๆโดยไม่ต้องรอข้ามวัน

ในเรื่องของความเร็วในการใช้งานระดับ Petabyte สามารถรองรับข้อมูลใน Scale ใหญ่ได้ทันที จึงทำให้ทีมสามารถทำการ Query วิเคราะห์ข้อมูลพร้อมกันหลายๆคนได้ ซึ่งอาจเป็นหลัก 10 หรือ 100 คนโดยไม่สะดุด ซึ่งระบบจะทำการ Back-up และ Save ข้อมูลให้อัตโนมัติ 

4) สร้างโมเดล ML ได้ในตัว (ML & AI Foundation)

Google BigQuery

ในบรรดา Cloud Data Warehouse ทั้งหมด ในปี 2021 Forrester Wave จัดอันดับให้ Google BigQuery อยู่ในกลุ่ม Leader ไม่ว่าจะเป็นเรื่องของการ Integrate (เชื่อมต่อ) กับ ข้อมูลจาก Data Lake, การ Ingest (นำเข้า) Data เข้าไปได้ง่ายและเร็ว รวมไปถึงการที่ BigQuery รองรับงานด้าน Data Science อีกด้วย 

Google BigQuery ตัดปัญหาในส่วนของ AI และ ML ที่มีข้อจำกัดว่าต้องใช้ทีม Data Science เข้ามาช่วยสร้าง Model เท่านั้น เพียงแค่มี Data Analyst ที่สามารถเขียน SQL ก็สามารถทำโมเดล ML (Out-of-the- Box Machine Learning Model) จบได้ในตัว BigQuery ได้เลยโดยไม่ต้อง Export ข้อมูลออกมาทำข้างนอก 

ด้วย BigQuery ML ทำให้เราสามารถสร้างโมเดล ML จบได้ภายใน 2 ขั้นตอน ด้วยภาษา SQL โดยการสร้างโมเดลที่เราจะใช้ขึ้นมาก่อน เช่น Regression Model (โมเดลวิเคราะห์การถดถอย), Time-series Model (โมเดลวิเคราะห์อนุกรมเวลา) หรือสามารถสร้างโมเดลแบบ Custom อย่าง XGBoost ก็ได้เช่นกัน หลังจากที่ได้โมเดลก้อนนึงออกมา ทีมก็สามารถนำโมเดลนั้นมา Predict หรือทำนายต่อ โดยนำข้อมูลที่จะ Test ไปวิ่งผ่านโมเดลของ BigQuery ML และจะได้คำตอบออกมาเป็นตาราง พอประมวลคำตอบเสร็จเรียบร้อย ทีม Business ก็สามารถนำข้อมูลตรงนี้ไปใช้ประโยชน์ต่อได้ทันที

5) วิเคราะห์ข้อมูลได้ฉับไว นำไปใช้ต่อได้ทันที (Real-time Insights)

Google BigQuery

Data Warehouse โดยส่วนใหญ่จะรองรับการประมวลผลข้อมูลเป็นชุดๆไป (Batch) ไม่ได้รองรับการนำเข้าข้อมูลแบบเรียลไทม์ ซึ่ง Pain Point ของธุรกิจบางอุตสาหกรรมที่ต้องใช้ข้อมูลแบบเรียลไทม์ ยิ่งเร็วยิ่งดีอย่างธุรกิจค้าปลีก (Retail) ทีมต้องมีการตอบสนองกลับลูกค้าโดยทันที ซึ่งการเก็บข้อมูลแบบเก่ากว่าทีมจะได้ข้อมูลก็ต้องรออย่างน้อยหนึ่งวัน ซี่งหากอยากได้ข้อมูลของวันนี้ก็ต้องรอถึงพรุ่งนี้ถึงจะได้ข้อมูล แต่กับ BigQuery ข้อมูลสามารถถูกประมวลผลได้แบบเรียลไทม์ ไม่ว่าข้อมูลจะมีขนาดใหญ่แค่ไหนก็ตาม โดยรองรับข้อมูลการ Query ที่เป็นระดับ Gigabyte ไปจนถึง Petabyte (1 Petabyte = 1,000,000 Gigabyte) 

การที่องค์กรจะสามารถจัดการกับโอกาสทางธุรกิจ (Window of Opportunity) ที่หายไปตามกาลเวลา คือ ทีมต้องเพิ่มความเร็วทั้งด้านการวิเคราะห์ข้อมูล และการออก Action ในการตอบสนองกลับในสิ่งที่ลูกค้าต้องการ เช่น ถ้าเป็นการ Cross-sell ลูกค้าซื้อคีย์บอร์ดไป แล้วอยากให้ลูกค้าซื้อสินค้าอีกชิ้นไปด้วย ทีมอาจจะดึงเอาข้อมูลขานึงไปเก็บไว้ที่ Storage ก่อน ส่วนอีกขานึงไปนำรันโมเดล BigQuery ML เพื่อจะได้รู้ว่าลูกค้าคนนี้น่าจะซื้ออะไรต่อ เพื่อจะได้นำเสนอสิ่งที่ลูกค้ากำลังมองหาอยู่ ทีนี้ก็จะทำให้ทีมสร้างยอดขายได้เพิ่มขึ้นอย่างรวดเร็ว

นอกจากนี้สำหรับองค์กรที่มีการใช้เครื่องมือทำแดชบอร์ด หรือ Visualization ต่างๆ เช่น Looker, Tableau หรือ Power BI ใน Google BigQuery ก็จะมีตัว BI Engine ที่ทำหน้าที่เสมือน Memory Database ในตัวด้วย ทำให้เราสามารถโหลดรีพอร์ตหรือแดชบอร์ดได้เร็วขึ้น

6) มีระบบความปลอดภัยครบวงจร (Reliable and Secure)

Google BigQuery

Google BigQuery มีระบบความปลอดภัยที่มีความน่าเชื่อถือมากถึง 99.9 เปอร์เซ็นต์ ซึ่งสอดคล้องไปกับ PDPA ดังนั้นองค์กรสามารถมั่นใจได้ทั้งในเรื่องของ Security (การป้องกันข้อมูลหายหรือรั่วไหล) และ Data Governance (การกำหนดสิทธิ หน้าที่ และความรับผิดชอบในการบริหารจัดการข้อมูล) โดยที่จะมีการ Encryption ในทุกขั้นตอน ตั้งแต่การเก็บข้อมูลไปจนถึงการรับส่งข้อมูล ซึ่งคนที่มีสิทธิ์เท่านั้นที่จะสามารถเข้าถึงหรือถอดรหัสได้ ส่วนคนอื่นที่ไม่มีความเกี่ยวข้องจะไม่สามารถเข้าถึงหรืออ่านข้อมูลได้

นอกจากนี้ระบบ Security ใน BigQuery ยังสามารถจำกัดการเข้าถึงของแต่ละบุคคลในระดับ Column และ Row ได้ เช่น หากในคลังมี Column ที่เป็นบัตรประชาชน หรือ เบอร์โทรศัพท์ ทีม Admin ก็สามารถล็อคไม่ให้คนที่ไม่มีความเกี่ยวข้องกับข้อมูลพวกนี้ Query หรือนำข้อมูลส่วนนี้ออกไปได้

บทสรุป

พออ่านกันมาถึงตรงนี้แล้ว ทุกคนจะเห็นได้ว่าการมี Data Warehouse ที่ทันสมัย และสามารถตอบโจทย์ทั้งเรื่องของค่าใช้จ่ายตามการใช้งานจริง, ระบบที่รองรับโหลดข้อมูลขนาดใหญ่ระดับ Petabyte, การมีโมเดล Machine Learning ในตัวเพื่อวิเคราะห์ข้อมูลแบบเรียลไทม์, ทุกทีมในองค์กรสามารถเข้าถึงข้อมูลและนำมาวิเคราะห์หรือสร้างแดชบอร์ดได้ทันที รวมไปถึงการมีระบบความปลอดภัยที่เชื่อถือได้ 99.9 เปอร์เซ็นต์อย่าง Google BigQuery สามารถช่วยขับเคลื่อนให้องค์กรกลายเป็น Data-Driven ได้ง่ายๆในยุค Disruption นี้ 

หากองค์กรไหนที่มีฐานข้อมูลในมืออยู่แล้วแต่อยากนำมาต่อยอดให้เกิดประโยชน์สูงสุดด้วย Google BigQuery ทางเรามีคอร์สเทรนนิ่งการใช้ BigQuery โดยทีมผู้เชี่ยวชาญ หรือสำหรับใครที่สนใจอยากหาทีมที่สามารถสร้างโมเดล ML แบบ Custom เพื่อธุรกิจคุณโดยเฉพาะ สามารถคลิก “ติดต่อ Predictive” ด้านล่างนี้ได้เลย ทางเรายินดีให้คำปรึกษาเบื้องต้นโดยไม่มีค่าใช้จ่ายใดๆครับ