Хочу сграбить желтые страницы

Статус
В этой теме нельзя размещать новые ответы.

Alexanderod

Создатель
Регистрация
15 Янв 2009
Сообщения
49
Реакции
11
Хочу сграбить каталог желтые страницы на предмет емейлов.
Проблема в том, что вебмастер генерирует картинки в качестве емейлов(с написанными на них е-мейлами), картинки имени не имеют(чтоб сохранить).
Как возможно сграбить сайт? Есть софт, позволяющие распознавать на лету при сканировании текст в картинках(без искажений)?
Спасибо)
 
на предмет существующего софта ничего сказать не могу.
но написать такой не трудно.
без искажений говорите?
от получаса до пары часов же.
 
написать распознавалку текста на лету? к граберу?
пхп?
 
А с CD-диска Желтых Страниц не вариант выдрать?
 
написать распознавалку текста на лету? к граберу?
пхп?
возможно
возможно
возможно

я бы именно по такому варианту и работал бы.
в свое время писал один анализатор(Alex-ы), и там требовалось распознавание цифр на рисунке.
несмотря на некоторую размытость(как в JPEG-е,хотя рисунок в PNG кажется был)
ничего сложного не было, так как не было искажений
точнее распознование цифр было не самым сложным.
сложнее было выделить темно-синюю линию графика на просто синем логотипе, с учетом использования множества градаций как для одного так и для другого
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху