Сканированый текст для контента??

Тема в разделе "Вопросы новичков", создана пользователем mcgregord-d, 14 янв 2008.

Статус темы:
Закрыта.
  1. mcgregord-d

    mcgregord-d

    Регистр.:
    11 дек 2007
    Сообщения:
    300
    Симпатии:
    99
    Имеются сканированые книги, в основном с интернета (нужно было для работы), есть ли смысл брать текст из них - разбавлять ключевиками (в доргене) и использовать его для контента (текста) в доре ??? Будет ли он уникальным и насколько, и как его схавают поисковики ???
     
  2. studik

    studik

    Регистр.:
    7 сен 2007
    Сообщения:
    194
    Симпатии:
    25
    я думаю, єто очень неплохой вариант....
    Проще ведь копи-пейстнуть, нежели сканить...
    Посему текст должен біть достаточно уникален.
     
  3. SkiLLer

    SkiLLer

    Регистр.:
    22 авг 2007
    Сообщения:
    307
    Симпатии:
    64
    Ну если текст еще не распознавался и не индексировался поисковиками, то чень даже есть смысл. Ведь некоторые пдф файлы индексируются поисковиками, потому что они в текстовом формате, а если это действительно сканы - то самое оно.
     
  4. mcgregord-d

    mcgregord-d

    Регистр.:
    11 дек 2007
    Сообщения:
    300
    Симпатии:
    99
    Сканы на руском, буду делать перевод на английский (Промпт 8) и кидать в доры разбавляя ключевиками, думаю такой ход будет нормальным??. Еще вопрос будет ли такой текст (скажем из книги "Война и Мир" :) ) тематическим если его разбавить ключевиками по нужной теме, скажем по цифровой технике???
     
  5. SkiLLer

    SkiLLer

    Регистр.:
    22 авг 2007
    Сообщения:
    307
    Симпатии:
    64
    ИМХО Тематический текст - это например какая-нибудь статья, а текст сгенеренный тем же марковым или еще кем уже будет просто текст. Думаю, что делать качественный текст для доров очень дорого, лучше делать его для нормальных сайтов, а для доров пойдет любой, с подмешанными кеями, и сканы русские переведенные на английский, и "Война и Мир" :)
     
  6. mcgregord-d

    mcgregord-d

    Регистр.:
    11 дек 2007
    Сообщения:
    300
    Симпатии:
    99
    Про тематику понятно, вопрос еще стоит об уникализации текста взятого с "сканы русские переведенные на английский, и "Война и Мир" :) " будет ли он таковым (уникальным) для поисковика???
     
  7. SkiLLer

    SkiLLer

    Регистр.:
    22 авг 2007
    Сообщения:
    307
    Симпатии:
    64
    Ну если до тебя еще никто не переводил "Войну и мир" и сканы - то будут, почему нет? :) А вообще сам уже задумывался над распознаванием сканов ну если скан русский - то и перевести не грех и скормить поисковику :).
     
  8. need help

    need help

    Регистр.:
    2 сен 2007
    Сообщения:
    149
    Симпатии:
    11
    да будет, но лучше не войну и мир взять, а то ее уже все расклонировали :).

    Только наличие скана например в djvu не значит, что нет аналога в PDF - стоит потратить минуту на поиск имеющейся книги в PDF. Если есть в PDF ИМХО лучше взять другую книгу, так как возможно кто-то уже с этими текстами сделал то же самое, что ты задумал.

    Ну и тематику не стоит забывать. Таблетки с книжками про простоквашино не очень вяжутся. ИМХО.
     
  9. mcgregord-d

    mcgregord-d

    Регистр.:
    11 дек 2007
    Сообщения:
    300
    Симпатии:
    99
    Так вродебы поисковик различает текст по ключевикам, а то откуда он будет знать что текст не по теме ключевика?
     
  10. Flexner

    Flexner

    Регистр.:
    17 сен 2007
    Сообщения:
    183
    Симпатии:
    25
    Да сканированный текст и не только на доры пойдет :). На саттелит и книженция 22 года издания покатит (если ее никто раньше не выложил).
     
Статус темы:
Закрыта.