Если у вас низкотрафиковый сайт (меньше 1000 посетителей в день), ваш трекинг в GA4 будет полностью сломан.
Ваш трекинг будет сломан из-за постепенного увеличения количества данных без согласия пользователей в вашем GA4 проперти.
В контексте моделирования данных в GA4 есть две категории данных: наблюдаемые данные и смоделированные данные.
Наблюдаемые данные – это фактические данные, которые поступают напрямую от пользователей, давших согласие GA4 на отслеживание их поведения с помощью идентификаторов, таких как куки или ID приложений.
Наблюдаемые данные предоставляют точную и надежную информацию о поведении пользователей, включая такие метрики, как количество пользователей, сессии, просмотры страниц, события и конверсии.
Смоделированные данные – это оценочные данные для пользователей, которые не дали согласие (пользователи, отказавшиеся от отслеживания).
Смоделированные данные также поступают напрямую от пользователей, давших согласие GA4 на отслеживание их поведения с помощью идентификаторов, таких как куки или ID приложений.
Другими словами, само моделирование использует наблюдаемые данные.
Алгоритмы машинного обучения анализируют паттерны и поведение пользователей, давших согласие, и используют эти инсайты для оценки поведения похожих пользователей, отказавшихся от отслеживания.
Таким образом, смоделированные данные не собираются напрямую от пользователей, отказавшихся от отслеживания, а выводятся из наблюдаемых данных с похожими характеристиками.
Это различие крайне важно для интерпретации отчетов в GA4.
Хотя смоделированные данные помогают заполнить пробелы в данных и дают инсайты о поведении пользователей, отказавшихся от отслеживания, важно помнить, что это оценка и она может быть не такой точной, как наблюдаемые данные.
А теперь плохие новости.
Чтобы моделирование данных заработало, вашему GA4 проперти нужно 1000+ ежедневных пользователей с analytics_storage='granted'
в течение 7 из предыдущих 28 дней.
Так что в реальной жизни вам понадобится гораздо больше, чем 1000 посетителей в день, потому что большинство из них, скорее всего, откажутся дать согласие.
И количество пользователей, отказывающихся от согласия, будет только расти в будущем.
Использование BigQuery тоже вас не спасет, так как смоделированные данные недоступны в экспорте BigQuery.
Нет наблюдаемых данных = нет смоделированных данных.
Без достаточного количества наблюдаемых данных от пользователей, давших согласие, методы моделирования данных GA4 не будут иметь достаточно информации для генерации надежных оценок поведения пользователей, отказавшихся от отслеживания.
Так что же вы можете сделать?
Найдите способы максимизировать сбор наблюдаемых данных.
1) Пересмотрите ваши сообщения о согласии и дизайн, чтобы улучшить показатели принятия пользователями.
Предлагайте стимулы или награды для пользователей, которые дают согласие, например, эксклюзивный контент, скидки или ранний доступ к фичам.
2) Сфокусируйтесь на сборе first-party данных (данных, предоставленных пользователями), например, сборе почтовых адресов.
3) Используйте server-side tagging.
Server-side tagging (серверная маркировка) может уменьшить зависимость от согласия пользователя несколькими способами, например, преобразовать данные от третьих лиц в данные от первых лиц.
4) Собирайте пользовательские данные (качественные и количественные) из нескольких онлайн и оффлайн точек.
Данные GA4 могут быть легко расширены в любом хранилище данных или CDP.
5) Увеличьте общий трафик вашего сайта.