Почему не рекомендуется сканированый контент?

Статус
В этой теме нельзя размещать новые ответы.
Может какие то программы есть по исправлению таких недорузамений (как кол-во страниц, тире длинные и т.д) в сканеном тексте?
 
Может какие то программы есть по исправлению таких недорузамений (как кол-во страниц, тире длинные и т.д) в сканеном тексте?

TextPipe - это современный инструмент обработки текстов. Он позволяет вам автоматически обрабатывать сотни файлов в соответствии с набором правил, указанным вами.

Для просмотра ссылки Войди или Зарегистрируйся
 
Часто, ленивый вебмастер пихает скан без обработок. Есть несколько признаком очевидных. Кривые переводы строк...

Можна по подробнее, что за кривые переводы строк?

ЗЫ Может вопрос и глупый просто сканами никогда не занимался
 
когда в книге идет
Lorem ipsum dolor sit amet, consectetuer adipscing elit, sed diam no-
nummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

а в распознаном тексте

Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam no- nummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.
 
Согласно закону об авторских правах, до 15% от объема книги можно перевести в электронный вид без разрешения автора. Так что если вы не злоупотребляете сканирование, то проблем с авторскими правами не будет.;)
 
Согласно закону об авторских правах, до 15% от объема книги можно перевести в электронный вид без разрешения автора.

Если оформить на сайте в виде цитаты, указать первоисточник - юридически задеть очень сложно. Зарплата обработчику текста будет стоить меньше, чем рерайтеру. Текст в итоге - для людей.

ТС, вас, видимо кто-то ввел в заблуждение. Использовать хорошо обработанные сканы - рекомендуется.
 
У меня на настоящий момент большинство сателлитов под сапу на скане.
Друзья приносят книги свои\из библиотеки\прочих мест сразу пачкой, с каждой сканирую несколько произвольных страниц и проверяю на уникальность для сети. Неуникальные отбрасываю, остальные сканирую полностью, обрабатываю (в том числе убираю разные "таб.", "рис."). И на zebrum lite либо sat-x.
Книги стараюсь брать не позднее 90го года выпуска... Постарее, так сказать... С выдержкой :)
Все сателлиты быстро залетают в индекс и, вроде как, держаться.
Последний на sat-x залил на хост 7 числа. Сейчас в индексе янд. и гуг. не менее десятка страниц.
Т.ч. думаю, если текст уникален для ПС, то... он уникален.
Авторское право, опасаетесь, - как и сказал, берите подревней фолианты.
А почему не рекомендуют сканированный контент... Ну, самое логичное объяснение- устраняют конкурента. Ибо даже в библиотеке уже все труднее и труднее найти уникальный для сети текст :)
 
Читаем статью 27 Закона РФ "Об авторском праве и смежных правах" №5351-1: "Авторское право действует в течение всей жизни автора и 70 лет после его смерти". Т.е. автор должен был умереть до 1939г. По сути, практически вся советская литература попадает под закон, не говоря уже о современной. Другое дело, что в эпоху СССР об авторском праве не особо пеклись, поэтому использовать советские книги менее опасно. Но каждый должен знать, на что он идет. Не поленитесь, почитайте эту статью целиком, она небольшая
 
Сканирование - хорошие вариант для пополнения контента, но все в меру конечно...
 
Может какие то программы есть по исправлению таких недорузамений (как кол-во страниц, тире длинные и т.д) в сканеном тексте?



Сам я делаю в word. Один раз пишешь макрос на автозамену всех корявых знаков и дальше без проблем)))

А если у тебя раскидано по множеству файлов то -- @Text Replacer хорошая програмка для массовой автозамены без замарочек.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху