Качество поиска Google: глобально и локально

Тема в разделе "Зарубежные поисковики", создана пользователем ewg777, 4 дек 2008.

Статус темы:
Закрыта.
  1. ewg777

    ewg777

    Регистр.:
    6 авг 2007
    Сообщения:
    763
    Симпатии:
    321
    Дафни Дембо, Директор по разработкам

    Цель Google – сделать поисковый сервис эффективным для каждого пользователя, и неважо, где он живет и на каком языке говорит. Многие из тех алгоритмов, которые мы обычно используем, могут быть применены ко всем языкам, но в ряде случаев уникальные характеристики требуют особого подхода.
    Сегодня Google ищет более чем на ста языках. Сначала разработкой и улучшением системы поиска на каждом из них занимались инженеры отдела по улучшению качества обработки поисковых запросов. Каждый специалист увлечённо работал над решением конкретных задач для своего языка. По мере роста объема иноязычного поиска мы обращались за помощью к сотрудникам компании по всему миру. Сейчас над проблемами улучшения поиска работает большая команда специалистов, которые помогают нам понять уникальные особенности языков.
    Для наложения поисковой модели на определённый язык первым делом мы тестируем поиск на множестве документов на этом языке. Таким образом мы можем убедиться, что языковая модель точна и универсальна, — например, что она включает имена, идиомы, просторечия и неологизмы, еще не вошедшие в словари. После общей настройки, проиндексировав документы, мы получаем возможность их категоризировать и разобрать в соответствии с запросом пользователя. После завершения этого этапа локализованный поиск запускается в работу.
    Кроме языковых особенностей для предоставления наиболее релевантных результатов поисковая система должна учитывать местоположение пользователя, хотя бы с точностью до страны. Запрос [Côte d'Or] во Франции должен давать информацию об этом регионе, а в Бельгии – о производителе шоколада. Информация также должна соответствовать стандартам данной страны. Например, по запросу норвежского пользователя [Перейти по ссылке] – в градусах Фагенгейта.
    Что умеет поиск Google
    Если пользователь забывает переключить язык ввода и запрос теряет смысл, Google исправляет ошибку. Например, кириллический запрос [Перейти по ссылке].
    Поиск Google «понимает» транслитерированные слова. Например, по запросу на латинице [Перейти по ссылке].
    Поиск Google старается экономить ваше время. Служба Google Suggest предлагает вам варианты запроса, допечатывая слово в режиме онлайн.
    Google может перевести запрос на английский, затем найти в сети документы и перевести полученные результаты на исходный язык запроса. Например, корейские пользователи могут искать новинки по Гарри Поттеру по запросу [Перейти по ссылке].
    Google исправит грамматические ошибки. Например, если вы не помните, как точно написать на эстонском «детектор дыма», система предложит исправленный вариант для слова [Перейти по ссылке].
    Google учтёт диакритические значки: поисковик выдаст одинаково хорошие результаты, если запрос будет введен с диакритическими знаками [Перейти по ссылке].
    Google может распознать синонимы на разных языках. «Самсунг» — это синоним корейского "삼성", поэтому пользователи, запрашивающие [Перейти по ссылке], получают результаты, содержащие имя компании на корейском.
    Распознаёт сложные слова: документы, посвященные Университету города Упсала в Швеции, будут выданы и на запрос по слову [Перейти по ссылке].
    Google ищет производные от одного корня. Польский пользователь может искать ответ на запрос по слову «фильм» [Перейти по ссылке] и получать результаты, которые содержат корень этого слова, в частности — «filmów», «filmu», «filmie», «filmy».

    Сегодня Поиск Google разрабатывается более чем для ста языков в ста пятидесяти странах мира, причем каждый месяц запускается множество улучшений. Перечисленные выше возможности – лишь малая часть того, над чем мы работаем каждый день, чтобы сделать поиск еще лучше. Удобство пользования, внешний вид стартовой страницы и страницы результатов поиска, понимание культурных особенностей конкретной страны также крайне важно для создания поисковой системы, которая будет близка и понятна людям из разных стран.

    По материалу блога Google.
     
Статус темы:
Закрыта.