Приехали. Теперь Арзамас, а не Анадырь

Опубликовано:

На www.yandex.ru обновлена поисковая программа — теперь там работает «Арзамас» (ранее известный как Анадырь ). В серии постингов мы расскажем, что сделано за это время.

Снятие омонимии

Яндекс научился еще лучше понимать русский язык, разрешая неоднозначности слов в запросах.

Как известно, знание русской морфологии позволяет поиску Яндекса находить больше полезных ответов. Если вы спросили [реконструкция Маяковской], мы покажем также страницу со словами [станция Маяковская открылась после реконструкции]. Но русский язык — тонкий, сложный и неоднозначный. Тем, кто ищет [фото львов], могут быть нужны как фотографии животных, так и фотографии города Львова. Человек может уточнить свое высказывание, добавив к нему одно или несколько слов: [фото африканских львов]  или [фото город львов]. Теперь эти уточнения наш поиск научился понимать.

Мы реализовали алгоритм снятия омонимии, позволяющий во многих случаях определить, какое слово имеется в виду, и предлагаем в ответ только документы с формами нужного слова. По запросу [фото африканских львов] пользователь получит в ответ документы со словами  «лев», «льва», «льву», но не получит документы, где встречаются лишь слова «Львова» или «Львову».

Как мы научили машину отличать, когда речь идет о животных, а когда — о городах? Алгоритм снятия омонимии основан на анализе данных запросов наших пользователей, учитывает частоту слов в Интернете и их сочетаемость, а также опирается на лексическую статистику слов из Национального корпуса русского языка — академического проекта, разрабатываемого при поддержке Яндекса. При анализе неоднозначного запроса мы выбираем наиболее частотную модель. Выбор в  пользу наиболее вероятной  конструкции помогает понять, что «день рыбака» — это не призыв, а праздник, а «платья придворных дам» — не обещание поделиться одеждой.

А любимый наш вопрос — тот, на который мы знаем целых два правильных ответа. Звучит он так: «Сколько голов у Павлюченко?»

Александр Садовский и команда поиска

http://webmaster.ya.ru/replies.xml?parent_id=3256&item_no=3255&ncrnd=3616

Оставьте свой комментарий к статье: "Приехали. Теперь Арзамас, а не Анадырь"

  1. Интернет-оптимист:

    Пока что меня новый алгоритм Яндекса не впечатлил. Не могу сказать, что всё очень плохо. Но и положительных тенденций не наблюдаю. Думаю, самое главное для вебмастера – это чтобы Платоны не выкидывали сайты из индекса. А насчёт временного расколбаса выдачи уверен, что через пару недель региональная выдача станет адекватной.

  2. Евгений:

    да большинства он даже и не затронет, просто мимо обйдёт) особенно блоггеров…

  3. Smar:

    Привет, земляк, круто что в кемерово, тоже знают про Сео :)
    Приятно видеть земляков этом деле.
    Что касается алгоритма, на мой взгляд, Янексоиды просто облажались, я говори это как обычный юзер, найти теперь в яндексе что-то довольно проблематично, ну а как сеошник, хрен пойми как теперь двигать проекты.

  4. Smar:

    Кстати скажи как подписаться на блог?

  5. XT:

    Здравствуйте! если у вас есть время пожалуйста отпишите мне мне мыло,у меня есть к вам дело)
    Контактов не нашел (((

  6. Один:

    Как, у вас выдача по Кемерово? В Новосибе полный мусор, просто трындец.

  7. Кемеровский сео-бомж:

    Да такой же мусор. Он по всей расеи такой.

    Я себе врубил московскую выдачу.

  8. Один:

    Аналогично, теперь осталось съездить к Новосибирским клиентам и врубить и Москву.

  9. Кемеровский сео-бомж:

    :-)

    У меня один клиент уже спрашивал а как дела в регионах…

Оставить комментарий

E-Mail *

*

Лучшая система размещения статей
CPA сеть Адмитад