На конференции YaC 2020 Яндекс представил свой новый алгоритм – YATI. Аббревиатура расшифровывается, как Yet Another Transformer with Improvements, что в переводе на русский означает «Ещё один трансформер с улучшениями».
Яндекс презентует данное нововведение, как «самое значимое изменение поиска за последние 10 лет». В нашей статье мы разберём, что из себя представляет новый алгоритм, какова его задача в поиске и как он повлияет на ранжирование сайтов в Яндекс.
Алгоритм Yati : что нового и для чего трансформер?
YATI призван анализировать тексты поисковых запросов и сайтов, которые по этим запросам показываются, причём должен делать это эффективнее своих предшественников – Палеха и Королёва. Подробнее окунуться в историю алгоритмов Яндекса вы можете в нашей статье .
В данной статье мы лишь кратко пройдёмся по ним, чтобы понимать, что изменилось с появлением трансформера.
Сначала был Палех
Палех был создан для сравнения текстов поисковых запросов пользователей и заголовков страниц, обучение происходило на положительных и отрицательных примерах, которые брались из ранее накопленной статистики.
Так как алгоритмы поисковых систем не умеют читать тексты, то определение соответствия запросов и заголовков происходило путём сравнения чисел.
Как происходило определение соответствия? Если объяснять простыми словами: каждой странице соответствовала группа из 2-х чисел, где каждое число означало определённую координату на одной из 2-х осей, а каждая страница соответствовала точке на координатной плоскости.
Точно так же происходил перевод поискового запроса – он размещался в том же пространстве координат вместе со страницей и чем ближе они были расположены друг к другу, тем больше страница соответствовала запросу.
Именно такой способ обработки запросов и страниц назвали семантическим вектором. Плюсом данного способа являлось то, что он мог установить соответствие запроса странице, даже если у них не было ни одного общего слова.
Данный алгоритм был относительно тяжёлым, поэтому применялся только на самых поздних стадиях ранжирования, примерно к 150 лучшим страницам из отфильтрованного множества.
А затем пришёл Королёв
Он работал по той же архитектуре, что и Палех, однако с его появлением семантический вектор страниц начал вычисляться заранее, в офлайне, что позволило применять алгоритм к большему количеству страниц.
Работает это так:
-
алгоритм в офлайн-режиме вычисляет вектор страниц и сохраняет в индексную базу,
-
пользователь вводит запрос в поиске,
-
алгоритм переводит запрос в вектор,
-
перемножает с уже готовыми векторами страниц, вычисляя релевантность.
Если бы вектора страниц не вычислялись заранее, то не было бы возможности применять нейронные сети к большему количеству страниц без ущерба времени выдачи результатов по запросу пользователя.
Помимо сравнения векторов запроса и страниц, Королёв начал сравнивать вектора только что введенных запросов с другими запросами, для которых заранее был известен лучший ответ. Если вектора оказывались достаточно близкими, то и результаты выдачи должны были быть похожими.
Зачем тогда понадобились трансформеры?
Предыдущие алгоритмы несмотря на то, что улучшили процесс ранжирования, всё же справлялись с этим неидеально. К основным недочётам можно отнести:
-
отсутствие полного учёта порядка слов,
-
весь смысл страницы описывался одним вектором с ограниченным размером.
В трансформере же каждый элемент текста переводится в отдельный вектор с сохранением положения в тексте.
Обучается данный трансформер по принципу transfer learning, то есть сначала решается одна задача, в рамках которой накапливается информация, позволяющая алгоритму решить эту конкретную задачу, после чего эта же информация используется повторно, но уже для решения других задач. Первоначально трансформеру «скармливают» множество простой и не всегда достоверной информации, полученной от пользователей Яндекс.Толоки, на этой информации он предобучается. После этого этапа трансформер получает уже более экспертную информацию, но в меньших объёмах – от специально обученных асессоров Яндекса.
Одним из дополнительных отличий трансформера стало предсказывание клика пользователя – это дополнительная метрика, которая будет учитываться при ранжировании.
YATI и его влияние на поисковое продвижение
Исходя из того, что данный алгоритм направлен на более глубокий анализ текста, понимание его сути, можно сделать резонный вывод, что смысловая нагрузка текстового контента будет иметь более весомую роль в ранжировании. А значит, экспертные тексты, дающие полный и качественный ответ на запрос пользователя, будут всё больше и чаще показываться в топах выдачи.
Кстати, именно такие тексты мы уже давно начали внедрять на проектах наших клиентов и не раз писали о том, как улучшить контент на своём сайте. Про полезный контент рекомендую прочитать эту статью .
YATI и BERT: в чём разница?
Ещё в прошлом году Google анонсировал подключение к алгоритмам ранжирования своего трансформера – BERT. Данная нейронная сеть решает задачу анализа поисковых запросов и их контекста, а не отдельный анализ ключевых запросов. То есть BERT анализирует предложение целиком. Подробнее об этом с наглядными примерами уже рассказывали здесь .
Исходя из описаний YATI и BERT становится очевидно, что и тот, и другой – трансформеры, и направлены на лучшее понимание смысла запроса пользователей. Однако YATI в данном случае смотрится выигрышнее, так как помимо анализа текста запросов пользователей, он анализирует ещё и тексты документов, учится предсказывать клики. Поэтому можно сделать вывод, что YATI более весомое обновление, нежели BERT.
Как подготовить сайт к ранжированию по YATI?
Означает ли появление Яндекс YATI, что старые методы оптимизации больше не будут работать?
Нет, ни в коем случае появление данного алгоритма не означает, что, например, та же оптимизация заголовков H и тегов title и description не играет роли. Необходимо понимать, что новый алгоритм Яндекс не отменяет факторы ранжирования, которые были выведены ранее, YATI лишь дополняет их более качественным анализом текстов.
А это означает, что техническую оптимизацию, привлечение естественных ссылок и улучшение поведенческих факторов (на поиске и на сайте) забрасывать нельзя. Как и раньше, эффективные результаты принесёт лишь работа над сайтом в комплексе.
Общие рекомендации по улучшению текстов:
-
Структурировать текст заголовками с использованием ключей.
-
Проработать title и description для улучшения CTR сниппета.
-
Использовать LSI-фразы. Подробнее про LSI-копирайтинг»
-
Собирать максимально полную семантику для страниц.
Заключение
Подводя итоги разбора, новый алгоритм YATI однозначно приведёт к изменениям в поисковой выдаче Яндекса, однако так как система обучающаяся, то на это всё равно уйдёт время, поэтому даже если на вашем сайте используются SEO-тексты, ещё есть время доработать их под современные стандарты поисковых систем. Чтобы проверить насколько актуальны ваши тексты, оставляйте запрос на этой странице .