Раскрытие секретов работы поисковой системы Google: обзор на основе утечек документов
- Дата:27.11.2023
- Автор: Команда TurboSEO

Впервые в интернете появилась внутренняя информация о работе поисковой системы, представленная сотрудниками компании. Вследствие значительного антимонопольного иска против Google были раскрыты документы, которые проливают свет на функционирование алгоритмов системы. Хотя множество сведений доступно разработчикам в официальной справке, некоторые детали впервые стали общедоступными. Natzir Turrado представил детальный анализ всех утечек информации.

Navboost
Navboost - ключевой аспект ранжирования в Google. Этот фактор отслеживает и анализирует поведение пользователей в поисковой системе, учитывая их взаимодействие с запросами и клики по результатам. Результаты с высокой релевантностью для конкретного запроса получают более высокий рейтинг по Navboost.
RankBrain
RankBrain – это часть искусственного интеллекта Google, использующая систему машинного обучения. Она активно принимает участие в обработке результатов поиска, непрерывно улучшая свое понимание языка, запросов пользователей и способность толковать сложные или двусмысленные запросы. Став третьим по важности фактором ранжирования, RankBrain играет значительную роль в определении релевантности поисковых результатов. Начало формы
QBST
QBST – это метод, который сосредотачивается на ключевых словах в запросах и связанных с ними терминах. Он анализирует эту информацию, чтобы влиять на порядок отображения результатов поиска. Этот подход выделяет основные аспекты запроса, обеспечивая более точные и релевантные результаты.
Term Weighting
Оценка веса терминов - это процесс определения значимости конкретных слов или выражений в поисковом запросе, основываясь на способе взаимодействия пользователей с результатами поиска. Согласно автору статьи, этот процесс вместе с QBST оказывает влияние на функционирование RankBrain.
DeepRank
DeepRank - это внутреннее название BERT, языковой модели с открытым исходным кодом, спроектированной для обработки естественного языка. Эта модель помогает алгоритмам лучше понимать человеческую речь, улавливать тонкости языка и улучшать понимание смысла текста.
IS
IS - ключевой показатель, используемый для оценки качества поисковой выдачи. Он представляет собой числовую метрику от 0 до 100, отражающую уровень удовлетворенности информацией, полученной в ответ на конкретный запрос.
PQ
PQ представляет собой оценку качества страницы, однако в доступных документах пока не хватает достаточно точной информации для полного понимания влияния этой метрики. Существует только упоминание о PQ в контексте рекомендаций для оценки качества страниц, что указывает на возможное использование этой метрики асессорами. Впоследствии эти данные также учитываются в алгоритмах для разработки моделей. Согласно утечкам данных, асессоры фокусируются на оценке качества страниц исключительно на мобильных устройствах.

Из утечек данных стало известно, что Google использует браузер Chrome для улучшения своей поисковой системы. Это достигается за счет интеграции браузера с Поиском, его предустановки на мобильных устройствах и сложности перехода на другую поисковую систему: согласно исследованию, для этого в среднем требуется 12 кликов. Внутренний анализ Google показал, что пользователи с предустановленной домашней страницей Google делают на 50% больше поисковых запросов, чем те, у кого это не настроено.