Новый алгоритм Яндекс "YATI": новое или хорошо забытое старое

16.12.2020

Есть вопросы?
Перезвоним
за 27 секунд

25 ноября в рамках YaC 2020 Яндекс рассказал про свой новый алгоритм поиска YATI, основанный на нейросетях-трансформерах. Я посмотрел фильм на Ютубе «Как мы делаем Яндекс» (явно рекламный), 2 раза прочитал исходник на Хабре, глянул комментарии на Сёрче, и вот что могу сказать…

Что такое Яндекс YATI?

Yati (Yet Another Transformer with Improvements) – поисковый алгоритм, который определяет связь между запросом пользователя к Яндексу и веб-документами из топа выдачи. По сути, это тот же BERT, но только отечественного розлива.

Как и поисковый алгоритм «Палех» 2016 года, Яти использует нейронные сети, для сопоставления запросов сайтам, не только по ключевым словам, но и по смыслу. Как и поисковый алгоритм «Королёв» 2017 года, Яти основывается на анализе поисковой статистики, собранной Яндексом. Как и в предыдущих алгоритмах, например, в "ВЕГА", в Yati большое значение придаётся асессорам и контенту.

Представители компании называют новый алгоритм «самым значимым изменением в поиске Яндекса за последние 10 лет». Но, по сути, это всё то же самое, что было раньше, только в новой упаковке. Единственное существенное изменение – в инженерной части поисковой машины. Я не инженер, так что рассказывать вам про распределение вычислительной нагрузки на разные модели не буду.

Просто взгляните вот на эту картинку от Яндекса:

Yati от Яндекса

 

Это наглядное сравнение качества разных нейросетевых алгоритмов в задаче поискового ранжирования. Насколько YATI революционен – решайте сами. Технология уже работает в поиске с осени 2020 года для всех запросов.

Особенности нового-старого алгоритма

Интересно, что в комментариях (даже на прояндексовском Хабре) у обычных пользователей возникли резонные вопросы к алгоритму. Например, Яндекс заявляет, что на первом этапе новая модель использует «клик на основе заголовка», для того чтобы отбросить очень большое число результатов, явно не относящихся к теме.

Поэтому, если вы вебмастер или сеошник, уделяйте повышенное внимание оптимизации заголовков страниц сайтов. Иначе ваше творение может быть отброшено ещё в самом начале работы алгоритма поиска.

Помимо title-ов, каждая страница, особенно содержащая много текста (что поисковики сейчас очень любят), должна быть разбита на явные разделы с информативными подзаголовками. Это, по словам представителя компании, упростит задачу для алгоритмов.

Третий важный момент, который подчёркивает тот же разработчик machine learning из Яндекса, Александр Готманов, заключается в том, что модель дообучают на основе экспертных оценок асессоров, которые попадают к ним после Яндекс Толоки.

Так что, если не хотите застрять в жерновах обученного людьми робота, опирайтесь при создании, оптимизации и продвижении сайтов на рекомендации для асессоров. В теории, сначала вы должны понравиться специально обученным оценщикам Яндекса, чтобы иметь право побороться за топ поисковой выдачи.

Ещё один интересный момент из комментариев: в теории поисковая модель Яндекса вполне может выучивать свойства хоста, как целого, и использовать это, как первое приближение к ответу. То есть, если у вас на сайте много «неинтересных» для поиска страниц, это может «замылить» для робота Яши действительно важные страницы и тексты на них.

Ну и в заключение части особенностей – утверждение Готманова о том, что по коммерческим запросам вполне может быть релевантным результатом информационный контент. То есть, для запроса «купить слона» Яндекс, помимо прочего, в топе покажет обзор этого слона, обсуждение его людьми и отзывы покупателей.

 


 

Это преарсная обзорная статья очень уважаемого мной Виктора Прядильщикова в его блоге SEO-аспиранта

От себя хочу заметить что несмотря на внедрение алгоритма еще в начале очени какого-либо серьезного изменения позиций анализируемых мной сайтов в SERP я не заметил. Падения не произошло, небо не рухнуло на голову (как было в случае апдейта Google в прошлом ноябре). Однако, наблюдаетсмя некая невидимая "стена", преодолеть которую на первый взгляд кажется не так просто. Почти все продвигаемые сайты "уперлись в потолок" и сотановились на занятых позициях, несмотря на предыдущий качественный рост. 

Принято решение пересмотреть работу с заголовками, сделав их более точными относительно поисковых вхождений. Остальное - без изменений. Как говорится, будем посмотреть как эта тактика себя покажет.

8 (8452)991-791