Индексируются ли форматы .pdf и .djvu?

Тема в разделе "Вопросы новичков", создана пользователем seobeginner, 3 авг 2008.

Статус темы:
Закрыта.
  1. seobeginner

    seobeginner ищу кнопку бабло

    Регистр.:
    5 июл 2008
    Сообщения:
    224
    Симпатии:
    57
    Собственно, сабж.

    Нужно это потому, что хочу брать контент из книг, скаченных в сети в формате pdf или djvu , будет ли текст уникален или уже проиндексировался поисковиками?
     
  2. BBnics

    BBnics Читатель

    Заблокирован
    Регистр.:
    28 мар 2008
    Сообщения:
    490
    Симпатии:
    109
    http://www.google.com.ua/search?hl=ru&safe=off&q=%D0%B2+filetype%3Apdf&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&meta=

    в яндексе чего-то не могу ссылку вставить, вообщем там тоже любой запрос и в настройках поиска поставить Область поиска: формат — PDF
     
  3. dimafal

    dimafal Писатель

    Регистр.:
    23 янв 2008
    Сообщения:
    5
    Симпатии:
    0
    Насчет отсканенных текстов (где сами тексты - это картинки) - практически сто процентов, что нет.

    А вот электронные версии, где как минимум работает выделение и вставка текста, гуглом индексируются очень даже ничего.
     
  4. west bomzh

    west bomzh Постоялец

    Регистр.:
    25 апр 2008
    Сообщения:
    69
    Симпатии:
    13
    djvu однозначно не индексируется. Это просто джипеги. С пдфками все не так однозначно.
     
  5. famin

    famin

    Регистр.:
    31 янв 2008
    Сообщения:
    164
    Симпатии:
    54
    pdf нормально индексируется(текст), подобная тема обсуждалась на серче, djvu не индексируется, но не все книги в сети уникальны...так что вам сначала придется их проверять на уникальность
     
  6. ant1-pa

    ant1-pa

    Регистр.:
    3 ноя 2007
    Сообщения:
    448
    Симпатии:
    95
    пдф только качественный индексит, если пдф скан книги...то не индексит
     
  7. dumber

    dumber

    Регистр.:
    23 апр 2007
    Сообщения:
    272
    Симпатии:
    123
    Проще говоря тот PDF при просмотре которого можно выделить внутри текст, и также осуществялется поиск по содержанию внутри PDF, в таких файликах и поискивики покопаются. А там где нужно использовать OCR роботы лезть не будут ;)
     
  8. DOKTOR_666

    DOKTOR_666

    Регистр.:
    14 июн 2006
    Сообщения:
    532
    Симпатии:
    239
    яндексом ПДФ индексируется точно
    djvu вряд ли так как это картинка фактически
     
  9. kip

    kip Постоялец

    Регистр.:
    7 янв 2007
    Сообщения:
    145
    Симпатии:
    15
    Google и Yandex точно индексируют pdf. А вот Ссылки из этих документов никто не учитывает
     
  10. swed

    swed

    Moderator
    Регистр.:
    17 апр 2008
    Сообщения:
    509
    Симпатии:
    494
    pdf не все, а только с текстом. Сканы как и djvu не индексятся точно.
     
Статус темы:
Закрыта.