Сайрус Шепард поставив питання SEO-спільноті:
Як, на вашу думку, працює система корисного контенту Google і як Google визначає “корисний контент”?
Нижче наведено відповіді, надані сеошниками:
Машинне навчання та дані оцінювачів якості:
Передбачається, що від Google це система машинного навчання, яка навчається на величезній кількості маркованих прикладів та налаштовується з використанням даних щодо задоволеності інформацією від оцінювачів якості.
Ця система може передбачати, який контент, швидше за все, буде корисним, і сайти з корисним контентом можуть бути негативно класифіковані.
Посібники для оцінювачів якості як сигнали:
Все, що оцінюється оцінювачем якості, може бути тим, що Google дивиться для ідентифікації корисного контенту.
Посібники QRG розглядаються як сигнали чи чинники ранжування.
Кореляція з факторами ранжування:
Існує сильна кореляція між характеристиками, переліченими QRG, і фактичними чинниками ранжирування.
Це не прямий вплив характеристик QRG на зміни в ранжируванні, а їхня кореляція з факторами ранжування.
Оцінка контенту та поведінкові сигнали:
Google зіставляє власну оцінку контенту з поведінковими сигналами користувача, зокрема, аналізуючи вкладення контенту та зіставляючи їх поведінковими сигналами для вимірювання приросту інформації.
Контент, який не призводить до подальших пошуків чи уточнень, винагороджується.
Система штрафів за корисний контент:
HCU почався як фільтр для корисного контенту, по суті, система штрафів.
“Приховані перлини” розглядаються як подальше додавання з використанням зворотного скорингу.
Багатошарова математика ймовірностей:
Ідентифікація корисного контенту включає багатошарову математику ймовірностей з безліччю дрібних індикаторів корисного або сумнівного контенту, кожен з яких є можливим індикатором, і в сукупності дуже ефективних.
Моделювання на основі довірених зразкових сайтів:
Система може моделюватись на основі характеристик зразкових сайтів, відзначених як довірені тестувальниками.
Дані про кліки враховуються, але не повністю пояснюють проблеми розміру вибірки доменів, які отримують мало кліків.
Глибина перегляду сторінки:
Одним із факторів, що враховуються, є глибина перегляду сторінки.
Якщо користувач швидко повертається до Google, це вказує на те, що сторінка не допомогла, і він намагається знайти інше джерело.
Контент, створений лише для пошукового трафіку:
Система намагається визначити веб-сайти, створені лише для отримання пошукового трафіку від Google.
Новинки рідко підпадають під удар, тому що у них також багато контенту, який, як вважається, цікавий їхнім користувачам, а не лише націлений на ключові слова.
Нішеві сайти, зосереджені на ключовиках та SEO-оптимізації:
Контент, що вважається не корисним, включає нішеві сайти, які занадто агресивно переслідували ключовики і оптимізацію.
Агреговані дані про кліки та вектори веб-сайтів:
Машинне навчання на основі агрегованих даних про кліки та порівняння векторів веб-сайтів з еталонними групами для ідентифікації корисного проти непотрібного контенту.