И снова Google

Тема в разделе "Мегафлуд", создана пользователем t0wer, 19 ноя 2008.

Статус темы:
Закрыта.
  1. t0wer

    t0wer BlackHerald

    Регистр.:
    24 июн 2008
    Сообщения:
    731
    Симпатии:
    421
    Google научился индексировать отсканированные документы

    Компания Google объявила о том, что ее поисковик научился индексировать текст на отсканированных изображениях. По словам представителей компании, для определения текста на картинке используется специальная технология оптического распознавания Optical Character Recognition, которая умеет конвертировать изображение слов в файлы с текстом.
    На сегодняшний день, поисковик Google умеет распознавать только текст в документах формата PDF.

    Кто-нибудь как-то юзал эту фишку Гугла?!
     
  2. polyetilen

    polyetilen Заблокирован

    Регистр.:
    10 авг 2006
    Сообщения:
    814
    Симпатии:
    474
    Да похоже уже индексирует отсканенные документы в pdf формате, пишут об этом в своём блоге:
    http://googleblog.blogspot.com/2008/10/picture-of-thousand-words.html
    демо:
    http://www.google.com/search?q=spin+lock+performance
    первый документ в результате отсканенный.
     
  3. dee_motard

    dee_motard

    Регистр.:
    26 июл 2008
    Сообщения:
    247
    Симпатии:
    76
    да, удобная фишка! Да и раньше поиск по ПДФкам тоже радовал. Находишь ПДФку в выдаче Гугля, и чтобы не качать ее (и особенно если не установлен ридер) щелкаешь по "просмотреть в виде HTML". Форматирование там конечно кривоватое, но понятно можно нужная это инфа или нет. Что есть польза!
     
Статус темы:
Закрыта.