รับมือกับ Data Retention ใน Google Analytics

Data Retention หรือ ระยะเวลาการเก็บรักษาข้อมูล ใน Google Analytics เป็นกลไกที่ช่วยให้เรากำหนดระยะเวลาก่อนที่ข้อมูล User-level และ Event-level ที่ถูกเก็บไว้ใน Google Analytics จะถูกลบออกจากระบบโดยอัตโนมัติได้

Universal Analytics

สําหรับ Universal Analytics การตั้งค่าจะมีผลกับข้อมูล User-level และ Event-level ซึ่งมีตัวเลือกดังต่อไปนี้

  • 14 เดือน
  • 26 เดือน
  • 38 เดือน
  • 50 เดือน
  • ไม่ให้หมดอายุโดยอัตโนมัติ

อย่างไรก็ตาม การเพิ่มระยะเวลาเก็บข้อมูลหรือเปลี่ยนเป็นไม่ให้ข้อมูลหมดอายุโดยอัตโนมัติจะไม่มีผลกับข้อมูลที่รวบรวมไว้แล้ว ตัวอย่างเช่น “ข้อมูลที่รวบรวมไว้ขณะที่การตั้งค่า 14 เดือนมีผลจะยังคงถูกลบหลังจากที่มีการรวบรวมไปแล้ว 14 เดือน แม้ว่าเราจะเปลี่ยนระยะเวลาเก็บรักษาเป็น 26 เดือนก็ตาม”

และรายงานสรุปรวมแบบมาตรฐานของ Google Analytics จะไม่ได้รับผลกระทบ เราจำเป็นต้องใช้ข้อมูลผู้ใช้และเหตุการณ์ที่จัดการโดยการตั้งค่านี้ เฉพาะเวลาที่ใช้ฟีเจอร์ขั้นสูงบางรายการ เช่น การใช้กลุ่มที่กำหนดเองกับรายงาน หรือการสร้างรายงานที่กำหนดเองแบบพิเศษ

Google Analytics 4

สําหรับ Google Analytics 4 (ที่ไม่ใช่เวอร์ชัน Analytics 360) จะเก็บข้อมูล User-Level รวมถึง Conversion ได้สูงสุดที่ 14 เดือน ส่วนข้อมูลเหตุการณ์อื่นๆ ทั้งหมด เราสามารถเลือกระยะเวลาการเก็บได้ดังนี้

  • 2 เดือน
  • 14 เดือน

ข้อมูลอายุ เพศ และความสนใจจะมีอายุการเก็บรักษา 2 เดือนเสมอ ไม่ว่าเราจะตั้งไว้เท่าไหร่ก็ตาม เมื่อเพิ่มระยะเวลาเก็บรักษา ระยะเวลาดังกล่าวจะมีผลกับข้อมูลที่ถูกรวบรวมไว้แล้ว และอย่าลืมว่าการตั้งค่าการเก็บรักษาข้อมูลจะไม่มีผลกับรายงานสรุปรวมแบบมาตรฐาน (รวมถึงมิติข้อมูลหลักและรอง) ใน Google Analytics 4 แม้ว่าเราจะสร้างการเปรียบเทียบในรายงานก็ตาม การตั้งค่าการเก็บรักษาข้อมูลจะมีผลกับรายงานการสำรวจเท่านั้น  

ลดหรือเพิ่มระยะเวลาเก็บรักษา

เมื่อถึงช่วงสิ้นสุดของระยะเวลาเก็บรักษา ข้อมูลจะถูกลบโดยอัตโนมัติเป็นประจำทุกเดือน

ถ้าเราลดระยะเวลาเก็บรักษา ระบบจะลบข้อมูลที่ได้รับผลกระทบออกในกระบวนการของเดือนถัดไป ตัวอย่างเช่น “หากเปลี่ยนจาก 26 เดือน เป็น 14 เดือน ระบบก็จะลบข้อมูลที่เก่ากว่า 14 เดือนออกในกระบวนการของเดือนถัดไป”

ถ้าเราเพิ่มระยะเวลาเก็บรักษาหรือเปลี่ยนเป็น “ไม่ให้หมดอายุโดยอัตโนมัติ” สําหรับ Universal Analytics การดำเนินการนี้จะไม่ส่งผลต่อข้อมูลที่รวบรวมไว้แล้ว ตัวอย่างเช่น หากเคยรวบรวมข้อมูลไว้ขณะที่ตั้งระยะเวลาเก็บรักษาไว้ที่ 14 เดือน ระบบก็ยังจะลบข้อมูลนั้นหลังจากผ่านไปแล้ว 14 เดือน แม้ว่าตอนนี้เราจะเปลี่ยนเป็น 26 เดือนแล้วก็ตาม หากเราเพิ่มระยะเวลาเก็บรักษา Google Analytics 4 การเปลี่ยนแปลงจะมีผลกับข้อมูลที่เราได้รวบรวมแล้ว

เมื่อใดก็ตามที่เราแก้ไขระยะเวลาเก็บรักษา การเปลี่ยนแปลงนั้นจะใช้เวลา 24 ชั่วโมงจึงจะมีผลใน Analytics ในช่วงเวลา 24 ชั่วโมงนี้ เรายังสามารถแก้ไขการเปลี่ยนแปลงกลับเป็นเหมือนเดิมได้โดยที่ข้อมูลจะไม่ได้รับผลกระทบ

หากใช้ช่วงวันที่สำหรับรายงานแบบไม่สรุปรวม (เช่น รายงานการสำรวจใน Google Analytics 4) ซึ่งนานกว่าระยะเวลาเก็บรักษา ข้อมูลสําหรับเวลาที่เพิ่มมาจะไม่ปรากฏในรายงาน เช่น หากตั้งการเก็บรักษาเป็นเวลา 14 เดือนและใช้ช่วงวันที่ 14 เดือน + 1 วัน ข้อมูลของอีก 1 วันที่เพิ่มมาจะไม่แสดงในรายงาน

รีเซ็ต Event ใหม่

เปิดตัวเลือกนี้เพื่อรีเซ็ตระยะเวลาเก็บรักษาของ User ID ที่มีเหตุการณ์ใหม่จากผู้ใช้รายนั้น (ซึ่งก็คือตั้งวันหมดอายุให้เป็นเวลาปัจจุบันบวกระยะเวลาเก็บรักษา) เช่น หากตั้งการเก็บรักษาข้อมูลไว้ที่ 14 เดือน แต่ผู้ใช้เริ่ม Session ใหม่ทุกเดือน ระบบจะรีเฟรช User ID ทุกเดือนและจะไม่มีวันครบกำหนดหมดอายุ 14 เดือน แต่หากผู้ใช้ไม่ได้เริ่ม Sessionใหม่ก่อนที่ระยะเวลาเก็บรักษาจะหมดอายุ User ID นั้นจะถูกลบออก

และถ้าเราไม่ต้องการรีเซ็ตระยะเวลาเก็บรักษา User ID เมื่อผู้ใช้รายนั้นมีเหตุการณ์ใหม่ ให้ปิดตัวเลือกนี้ ข้อมูลที่เชื่อมโยงกับ User ID จะถูกลบโดยอัตโนมัติหลังจากพ้นระยะเวลาเก็บรักษา ซึ่งฟีเจอร์รีเซ็ต Event นี้จะมีผลกับข้อมูล User-level เท่านั้น

หากครบระยะเวลาที่ Google Analytics เก็บข้อมูลให้เรา จะเกิดอะไรขึ้น

หากเปรียบถังข้อมูล GA เป็น 1 ถัง เราต้องทำการเคลียร์ข้อมูลตามรอบระยะเวลาที่กำหนด เพื่อไม่ให้ขัดต่อกฏหมาย PDPA ทั้งนี้ข้อมูลอื่นๆที่ไม่เกี่ยวกับ Cookie จะยังถูกเก็บไว้ใน Report ย้อนหลังใน GA แต่ข้อมูลเหล่านั้นจะเป็นแบบ Read-only และไม่สามารถนำไปใช้งานต่อได้อีก

ปัญหานี้สามารถถูกแก้ไขได้โดยเราจะฝากข้อมูลที่อยู่ใน GA ไว้ในถังที่มีชื่อว่า BigQuery เพราะข้อมูลที่เราเก็บมาได้นั้นล้วนเป็นสินทรัพย์ที่จะมีประโยชน์ในการขับเคลื่อนธุรกิจในอนาคตทั้งนั้น โดยหลังจากข้อมูลได้เข้าไปอยู่ใน BigQuery แล้วจะสามารถนำไปต่อยอดทำสิ่งอื่นๆต่อไปได้ เช่น การ Export data ไปยัง Cloud อื่นๆ การ Extract data เพื่อนำมาสร้างโมเดลธุรกิจต่อไป หรือ อาจเป็นการ Import data บางส่วนที่ปรับแต่งแล้วใน BigQuery นำกลับเข้าไปใน GA เพื่อสร้างผลลัพธ์ให้ข้อมูลในมิติใหม่ๆ

นอกจากนี้ ในกรณีที่เราต้องการจะเปรียบเทียบข้อมูลใน GA4 แบบปีต่อปี เราควรเปลี่ยนมาใช้ GA4 360 แทน เพื่อเพิ่มระยะเวลาการจัดเก็บได้นานขึ้นสูงสุด 50 เดือน ซึ่งหมายความว่าข้อมูลที่เราเก็บมาจะสามารถนำมาใช้ได้อย่างเต็มประสิทธิภาพ 

และหากธุรกิจไหนกำลังกังวลว่าข้อมูลที่ตั้งใจจะเก็บมาจะหมดอายุ หรือยังอยากเทียบข้อมูลใน GA แบบปีต่อปีได้ สามารถติดต่อ Predictive เพื่อเข้าไปช่วยทั้งสองส่วนนี้ได้เลยค่ะ