Các nguyên nhân dẫn đến việc mất dữ liệu trong Analytics

dữ liệu analytics bị mất

Nếu bạn đã từng so sánh 2 cài đặt Analytics trên cùng một trang web, hoặc đã từng so sánh Analytics của mình với báo cáo của các công ty khác trong việc bán hàng, bạn có thể nhận thấy rằng mọi thứ không phải lúc nào cũng tương thích. Trong bài viết này, Vietads sẽ giải thích lý do tại sao dữ liệu analytics bị mất trong platform Analytics của trang web của bạn và sự ảnh hưởng rộng lớn của nó. Một số vấn đề mà tôi đề cập đến thực sự khá dễ giải quyết và có tác động khá lớn đến lưu lượng truy cập – không có cách nào dễ dàng hơn để bạn đạt được mục tiêu theo quý.

dữ liệu analytics bị mất

Tôi sẽ tập trung vào GA (Google Analytics) bởi vì nó là công cụ được sử dụng phổ biến nhất, nhưng phần lớn các platform Analytics trên trang đều có chung một số vấn đề. Những platform dựa trên nhật ký máy chủ sẽ tránh được một số vấn đề nhưng nó khá là hiếm, vì thế tôi sẽ không đề cập sâu đến chúng.

Lời chú giải bên lề: Cài đặt thử nghiệm (nhiều trình theo dõi và GA tùy chỉnh)

Trên Distilled. net, chúng tôi đang tiến hành chạy Google Analytics tiêu chuẩn từ thẻ HTML trong GTM (Google Tag Manager). Ngoài ra, trong hai năm qua, tôi đã cho triển khai đồng thời thêm ba cài đặt Google Analytics, chúng được thiết kế để đo lường sự khác biệt giữa các cấu hình khác nhau.

(Nếu bạn chỉ quan tâm đến những phát hiện của tôi, bạn có thể bỏ qua phần này, nhưng nếu bạn muốn biết thêm về hệ phương pháp hãy đọc tiếp. Tương tự như vậy, đừng lo lắng nếu bạn không hiểu một số chi tiết ở đây – khá dễ để theo dõi các kết quả).

Hai trong số cài đặt thêm này – một là trong Google Tag Manager và một là trên trang – chạy lưu trữ nội bộ, đổi tên các bản sao của tệp JavaScript của Google Analytics (ví dụ: www.distilled.net/static/js/au3.js, thay cho www.google-analytics.com/analytics.js) để các trình chặn quảng cáo khó phát hiện ra chúng hơn. Tôi cũng đã sử dụng các hàm JavaScript đã được đổi tên (“tcap” và “Buffoon,” thay cho hàm tiêu chuẩn “ga”) và các trình theo dõi đã được đổi tên (“FredTheUnblockable” và “AlbertTheImmutable”) để tránh trùng lặp các trình theo dõi (điều này thường gây ra các vấn đề).

Việc này ban đầu được lấy cảm hứng từ thực tế tốt nhất trong năm 2016 về cách cài đặt Google Analytics cho các trình chặn quảng cáo. Giờ tôi không thể tìm thấy bài viết gốc nào, nhưng bạn có thể đọc một bài tương tự được viết năm 2017 tại đây.

Cuối cùng, chúng ta có (“DianaTheIndefatigable”), nó chỉ có một trình theo dõi đã được đổi tên, nhưng nó sử dụng mã tiêu chuẩn và được cài đặt trên trang. Việc này là để hoàn thiện việc kết hợp tất cả các GTM đã được sửa đổi và chưa được sửa đổi và các trình theo dõi trên trang.

mất thông tin trong analytics

Hai trong số các trình theo dõi trên trang đã được sửa đổi của Distilled, như trên https://www.distilled.net/

Nhìn chung, dưới đây là bảng tóm tắt các thiết lập của chúng tôi:

thiết lập analytics

Tôi đã thử nghiệm chức năng của chúng trong nhiều trình duyệt/ môi trường chặn quảng cáo khác nhau bằng cách quan sát số lượt truy cập trang xuất hiện trong các công cụ phát triển trình duyệt:

số liệu trong analytics

Lý do thứ 1: Trình chặn quảng cáo

Trình chặn quảng cáo, là tiện ích mở rộng của trình duyệt, đã trở nên phổ biến trong một thời gian. Về cơ bản tiện ích này dành cho những người dùng đang tìm kiếm hiệu suất và UX tốt hơn trên các trang web chứa đầy quảng cáo, nhưng trong những năm gần đây, tầm quan trọng của quyền riêng tư cũng đã tăng lên, do đó nó không được Google hiển thị khi tiến hành Analytics.

  • Ảnh hưởng của trình chặn quảng cáo

Một số trình chặn quảng cáo chặn platform Analytics của trang web theo mặc định, những trình khác cũng được định cấu hình làm như vậy. Tôi đã thử nghiệm trang web của Distilled bằng Adblock Plus và uBlock Origin – hai trong số các addons cho trình duyệt trên máy tính bàn phổ biến nhất để chặn quảng cáo, nhưng điều đáng chú ý là các trình chặn quảng cáo cũng đang ngày càng phát triển trên điện thoại thông minh.

Dưới đây là cách Distilled thiết lập: (Tất cả số liệu hiển thị từ tháng 4/2018)

trinh chan quang cao
Dường như những thiết lập thay đổi này đã không có hiệu quả nhiều!

  • Mất dữ liệu do trình chặn quảng cáo: ~10%

Có thể sử dụng trình chặn quảng cáo trong phạm vi 15-25% tùy thuộc vào khu vực, nhưng nhiều cài đặt trong số này là cài đặt mặc định của AdBlock Plus, và như chúng ta đã thấy ở trên, nó không chặn tracking. Ước tính thị phần của AdBlock Plus trong số các trình chặn quảng cáo thay đổi từ 50-70%, với các báo cáo gần đây cho thấy nó có xu hướng gần giống với các quảng cáo trước đây. Vì vậy, nếu chúng ta giả định rằng tối đa 50% trình chặn quảng cáo được cài đặt chặn các phân tích, thì nó sẽ làm mất khoảng 10% số liệu phân tích của bạn.

Lý do thứ 2: Trình duyệt “không theo dõi” ẩn danh

Đây là một tính năng cải thiện sự riêng tư khác, của chính các trình duyệt. Bạn có thể bật tính năng này trong cài đặt của hầu hết các trình duyệt ngày nay. Các trang web hay các platform không bắt buộc phải thực hiện theo yêu cầu “không theo dõi”, nhưng Firefox cung cấp một tính năng mạnh hơn trong cùng một tập hợp các tùy chọn mà tôi cũng đã quyết định thử nghiệm.

  • Ảnh hưởng của “không theo dõi”

Hầu hết các trình duyệt ngày nay đều cung cấp tùy chọn gửi thông báo ẩn danh “không theo dõi”. Tôi đã thử nghiệm bản cập nhật mới nhất của Firefox và Chrome dành cho Window 10.

trinh duyet an danh

Một lần nữa, dường như các cài đặt thay đổi không giúp ích nhiều cho chúng ta.

  • Mất dữ liệu do “không theo dõi”: <1%

Chỉ có “Tracking Protection” của Firefox Quantum – được ra mắt vào tháng 2, đã có tác động đến các trình theo dõi của chúng tôi. Firefox có 5% thị phần, nhưng “Tracking Protection” mặc định không được bật. Sự ra mắt tính năng này không ảnh hưởng đến xu hướng của lưu lượng truy cập của Firefox trên Distilled.net.

Lý do thứ 3: Bộ lọc

Điều này là khá rõ ràng, nhưng bộ lọc mà bạn cài đặt trong Analytics của mình có thể cố ý hoặc sơ ý làm giảm mức lưu lượng truy cập của bạn.

Ví dụ, một bộ lọc loại bỏ độ phân giải màn hình của các trang web nhất định mà bạn tin rằng phần lớn là các bots, hoặc lưu lượng truy cập nội bộ, hiển nhiên sẽ khiến cài đặt của bạn không được báo cáo.

  • Mất dữ liệu do bộ lọc:???

Thật khó để ước tính mức độ ảnh hưởng, bởi vì cài đặt sẽ thay đổi trên cùng nhau. Tôi khuyên bạn nên cài đặt chế độ xem trùng lặp và không được lọc đề phòng trường hợp bạn nhận ra quá muộn rằng bạn đã bị mất thứ mà bạn không muốn mất.

Lý do thứ 4: GTM vs. on page vs. on page sai vị trí

Google Tag Manager đã trở nên ngày càng phổ biến đối với Analytics trong nhiều năm nay, bởi tính linh hoạt và dễ dàng thay đổi. Tuy nhiên tôi đã nhận thấy rằng nó có xu hướng không được báo cáo so với việc cài đặt trên trang.

Tôi cũng tò mò về việc chuyện gì sẽ xảy ra nếu bạn không tuân thủ các nguyên tắc của Google trong việc cài đặt mã trên trang.

Bằng cách kết hợp số liệu của tôi với số liệu của trang web Dom Woodman của đồng nghiệp tôi (mời bạn truy cập liên kết, Dom), điều xảy ra khi sử dụng add-on Drupal Analytics cũng như GTM, tôi có thể thấy sự khác biệt giữa Google Tag Manager và mã đặt sai trên trang (ngay ở cuối thẻ <body>). Sau đó tôi so sánh nó với dữ liệu của Google Tag Manager của tôi để có cái nhìn tổng thể về tất cả 5 cài đặt.

  • Ảnh hưởng của GTM và mã đặt sai trên trang

Lưu lượng truy cập được thể hiện dưới dạng phần trăm đường cơ sở (cài đặt Google Tag Manager tiêu chuẩn):

cài đặt sai gtm

Có một số điểm chính như sau:

  • Mã trên trang thường báo cáo lưu lượng truy cập nhiều hơn GTM
  • Mã đã được chỉnh sửa thường là lỗi, khác với mã GTM đã được sửa đổi trên Internet Explorer (xem lưu ý bên dưới)
  • Mã phân tích đặt sai chỗ sẽ làm mất của bạn đến 1/3 lưu lượng truy cập so với mã được cài đặt đúng trên trang, tùy thuộc vào trình duyệt (!)
  • Các cài đặt tùy chỉnh được thiết kế để tăng lưu lượng truy cập bằng cách tránh các trình chặn quảng cáo không có tác dụng gì.

Điều đáng chú ý là các cài đặt tùy chỉnh thực tế nhận được lưu lượng truy cập ít hơn các cài đặt tiêu chuẩn. Đối với mã trên trang, đây là lỗi, nhưng đối với Google Tag Manager, thì có một lý do khác – bởi vì tôi đã sử dụng các hồ sơ chưa được lọc để so sánh, cho nên có rất nhiều bot spam trong hồ sơ chính, chúng chủ yếu là giả mạo giống như Internet Explorer. Hồ sơ chính của chúng tôi bị spam nhiều nhất, và nó cũng hoạt động như đường cơ sở ở đây, vì thế sự khác biệt giữa mã trên trang và Google Tag Manager có thể là một cái gì đó lớn hơn những gì tôi đang báo cáo.

Tôi cũng chia dữ liệu bằng thiết bị di động, không có sự tò mò: Lưu lượng truy cập được hiển thị dưới dạng phần trăm đường cơ sở (cài đặt Google Tag Manager  tiêu chuẩn):

loai tru chan quang cao

Điểm chính ở đây là dường như các trình duyệt trên thiết bị di động như Internet Explorer có thể gặp khó khăn với Google Tag Manager.

  • Mất dữ liệu do GTM: 1-5%

Google Tag Manager dường như tiêu tốn của bạn một số khoản tiền tùy thuộc vào thiết kế của trình duyệt và các thiết bị được dùng cho trang web của bạn. Trên Distilled. net, sự khác biệt là khoảng 1.7%, tuy nhiên chúng tôi có một số lượng khách hàng đặc biệt hiểu biết về máy tính để bàn và công nghệ (không nhiều Internet Explorer). Tùy thuộc vào vertical, sự ảnh hưởng có thể tăng lên 5%.

  • Mất dữ liệu do mã đặt sai chỗ trên trang: ~10%

Trên Teflsearch. com, ảnh hưởng của mã đặt sai chỗ trên trang là khoảng 7.5% so với Google Tag Manager. Hãy luôn nhớ rằng Google Tag Manager tự nó không được báo cáo, tổng số thiệt hại có thể lên đến 10%.

Mất dữ liệu từ các kênh

Ở trên tôi đã tập trung vào những nơi mà bạn có thể bị mất dữ liệu. Tuy nhiên, cũng có nhiều cách làm cho dữ liệu bị trình bày sai, hoặc chi tiết bị mất. Tôi sẽ đề cập đến những vấn đề này ngắn gọn hơn, nhưng vấn đề chính là dark traffic (những traffic vào website mà không thể theo dõi) và thuộc tính Attribution (Phân bổ).

  • Dark traffic

Dark traffic là lưu lượng truy cập trực tiếp mà không thực sự đến từ lưu lượng truy cập trực tiếp – nhìn chung nó ngày càng trở nên phổ biến. Nguyên nhân chính là:

  • Các chiến dịch không được gắn thẻ trong email
  • Các chiến dịch không được gắn thẻ trên các ứng dụng (đặc biệt là Facebook, Twitter,…)
  • Hiển thị sai tự nhiên
  • Dữ liệu được gửi từ cài đặt tracking bị hỏng (cũng có thể xuất hiện dưới dạng self-referrals)

Điều đáng chú ý là xu hướng hướng tới lưu lượng truy cập trực tiếp thực sự trước đây là những lưu lượng truy cập tự nhiên. Ví dụ, do chức năng Autocomplete của trình duyệt, lịch sử truy cập chéo thiết bị và nhiều thứ khác nữa ngày càng phức tạp, nên mọi người thường nhập tên một URL mà họ đã tìm kiếm trước đây.

  • Atttribution

Tôi sẽ nói về vấn đề này rõ hơn, nhưng nhìn chung, một phiên trong Google Analytics (và trong bất kỳ platform nào khác) là một cấu trúc tùy ý – bạn có thể nghĩ nó là một tập hợp số lần truy cập sẽ được tính là 1 phiên hoặc nhiều phiên, nhưng thực tế quá trình này dựa trên số lượng những giả thuyết vẫn còn nhiều nghi vấn. Đặc biệt, đáng lưu ý rằng Google Analytics thường chỉ định lưu lượng truy cập trực tiếp (bao gồm dark trafic) vào nguồn không trực tiếp trước đó, nếu nguồn này đã tồn tại.

Kết luận:

Tôi đã khá ngạc nhiên với một số phát hiện của mình khi nghiên cứu bài đăng này, nhưng tôi chắc chắn rằng tôi vẫn chưa biết hết được mọi thứ. Bạn có thể nghĩ ra bất kỳ cách nào khác mà dữ liệu có thể bị mất khỏi Analytics không? hãy chia sẻ dứoi phần comment nhá. Nếu thấy bài viết hữu ích hãy chia sẻ nó ngay và nhớ ghi nguồn https://vietadsonline.com/ nhá.

Chuỗi bài viết liên quan:

Nếu thấy kết quả SEO của mình bị tụt top nhiều quá hãy đăng ký ngay Khoá học SEO tại Hà Nội thuộc chương trình Đào tạo SEO thực chiến của Vietads để cùng nhau tìm cách giải quyết vấn đề. Còn nếu các bạn không có thời gian làm thì có thể tham khảo và sử dụng Dịch vụ SEO tổng thể của chúng tôi.

Nguồn từ: https://moz.com/blog/ Author: Tom.Capper – Edit by: Việt Anh Trần

0/5 (0 Reviews)

2 thoughts on “Các nguyên nhân dẫn đến việc mất dữ liệu trong Analytics

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *