Сканированый текст для контента??

Статус
В этой теме нельзя размещать новые ответы.

mcgregord-d

Гуру форума
Регистрация
11 Дек 2007
Сообщения
296
Реакции
99
Имеются сканированые книги, в основном с интернета (нужно было для работы), есть ли смысл брать текст из них - разбавлять ключевиками (в доргене) и использовать его для контента (текста) в доре ??? Будет ли он уникальным и насколько, и как его схавают поисковики ???
 
я думаю, єто очень неплохой вариант....
Проще ведь копи-пейстнуть, нежели сканить...
Посему текст должен біть достаточно уникален.
 
Ну если текст еще не распознавался и не индексировался поисковиками, то чень даже есть смысл. Ведь некоторые пдф файлы индексируются поисковиками, потому что они в текстовом формате, а если это действительно сканы - то самое оно.
 
Сканы на руском, буду делать перевод на английский (Промпт 8) и кидать в доры разбавляя ключевиками, думаю такой ход будет нормальным??. Еще вопрос будет ли такой текст (скажем из книги "Война и Мир" :) ) тематическим если его разбавить ключевиками по нужной теме, скажем по цифровой технике???
 
ИМХО Тематический текст - это например какая-нибудь статья, а текст сгенеренный тем же марковым или еще кем уже будет просто текст. Думаю, что делать качественный текст для доров очень дорого, лучше делать его для нормальных сайтов, а для доров пойдет любой, с подмешанными кеями, и сканы русские переведенные на английский, и "Война и Мир" :)
 
ИМХО Тематический текст - это например какая-нибудь статья, а текст сгенеренный тем же марковым или еще кем уже будет просто текст. Думаю, что делать качественный текст для доров очень дорого, лучше делать его для нормальных сайтов, а для доров пойдет любой, с подмешанными кеями, и сканы русские переведенные на английский, и "Война и Мир" :)

Про тематику понятно, вопрос еще стоит об уникализации текста взятого с "сканы русские переведенные на английский, и "Война и Мир" :) " будет ли он таковым (уникальным) для поисковика???
 
Ну если до тебя еще никто не переводил "Войну и мир" и сканы - то будут, почему нет? :) А вообще сам уже задумывался над распознаванием сканов ну если скан русский - то и перевести не грех и скормить поисковику :).
 
да будет, но лучше не войну и мир взять, а то ее уже все расклонировали :).

Только наличие скана например в djvu не значит, что нет аналога в PDF - стоит потратить минуту на поиск имеющейся книги в PDF. Если есть в PDF ИМХО лучше взять другую книгу, так как возможно кто-то уже с этими текстами сделал то же самое, что ты задумал.

Ну и тематику не стоит забывать. Таблетки с книжками про простоквашино не очень вяжутся. ИМХО.
 
Ну и тематику не стоит забывать. Таблетки с книжками про простоквашино не очень вяжутся. ИМХО.

Так вродебы поисковик различает текст по ключевикам, а то откуда он будет знать что текст не по теме ключевика?
 
Да сканированный текст и не только на доры пойдет :). На саттелит и книженция 22 года издания покатит (если ее никто раньше не выложил).
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху