Сайрус Шепард задал вопрос SEO-сообществу:
Как, по вашему мнению, работает система полезного контента Google и как Google определяет “полезный контент”?
Ниже приведены ответы, предоставленные сеошниками:
Машинное обучение и данные оценщиков качества:
Предполагается, что RankBrain от Google – это система машинного обучения, которая обучается на огромном количестве маркированных примеров и настраивается с использованием данных о удовлетворенности информацией от оценщиков качества.
Эта система может предсказывать, какой контент скорее всего будет полезным, и сайты с преимущественно неполезным контентом могут быть классифицированы негативно.
Руководства для оценщиков качества как сигналы:
Все, что инструктируется оценщика качества оценивать, может быть тем, на что Google смотрит для идентификации полезного контента.
Руководства QRG, рассматриваются как сигналы или факторы для ранжирования.
Корреляция с факторами ранжирования:
Существует сильная корреляция между характеристиками, перечисленными в QRG, и фактическими факторами ранжирования.
Это не прямое влияние характеристик QRG на изменения в ранжировании, а их корреляция с факторами ранжирования.
Оценка контента и поведенческие сигналы:
Google сопоставляет собственную оценку контента с поведенческими сигналами пользователя, в частности, анализируя вложения контента и сопоставляя их с поведенческими сигналами для измерения прироста информации.
Контент, который не приводит к последующим поискам или уточнениям, вознаграждается.
Система штрафов за неполезный контент:
HCU начался как фильтр для неполезного контента, по сути, система штрафов.
“Скрытые жемчужины” рассматриваются как последующее добавление с использованием обратного скоринга.
Многослойная математика вероятностей:
Идентификация неполезного контента включает многослойную математику вероятностей, с множеством мелких индикаторов неполезного или сомнительного контента, каждый из которых является возможным индикатором, и в совокупности очень эффективных.
Моделирование на основе доверенных образцовых сайтов:
Система может моделироваться на основе характеристик образцовых сайтов, отмеченных как доверенные тестировщиками.
Данные о кликах учитываются, но не полностью объясняют проблемы с размером выборки у доменов, получающих мало кликов.
Глубина просмотра страницы:
Одним из факторов, который учитывается, является глубина просмотра страницы.
Если пользователь быстро возвращается в Google, это указывает на то, что страница не помогла, и он пытается найти другой источник.
Контент, созданный только для поискового трафика:
Система пытается идентифицировать веб-сайты, созданные исключительно для получения поискового трафика от Google.
Новостные сайты редко попадают под удар, потому что у них также много контента, который, как считается, интересен их пользователям, а не только нацелен на ключевики.
Нишевые сайты, сосредоточенные на ключевиках и SEO-оптимизации:
Контент, считающийся неполезным, включает нишевые сайты, которые слишком агрессивно преследовали ключевики и оптимизацию.
Агрегированные данные о кликах и векторы веб-сайтов:
Машинное обучение на основе агрегированных данных о кликах и сравнение векторов веб-сайтов с эталонными группами для идентификации полезного против неполезного контента.