Ломаем каптчу Яндекса

Тема в разделе ".:: Готовые решения", создана пользователем kactetus, 23 авг 2009.

Статус темы:
Закрыта.
  1. kactetus

    kactetus митя is here )

    Регистр.:
    26 авг 2007
    Сообщения:
    441
    Симпатии:
    278
    Итак, у нас есть вот такая каптча:

    Основные особенности:
    6 цифр;
    Изображение монохромное;
    Фон белый;
    Искажения, которые, однако, незначительно смещают цифры со своих позиций;
    Две шумовые линии очень похожие на синусоиды.

    Эту каптчу Яндекс использует давно (больше года, насколько я помню), что означает никто за это время её не сломал, они бы заметили, наверное. Поскольку даже человек иногда не в состоянии распознать все цифры, ставить задачу стопроцентного распознавания было бы глупо, да и цель у меня — просто решить интересную задачу, а не написать спам-бота. Поэтому поставим задачу распознавания каптчи с некоторой вероятность, даже одного процента будет достаточно.

    Задача: написать программу, распознающую каптчу Яндекса с вероятностью не менее одного процента.

    Полностью статья
    Перейти по ссылке

    без скриптов для обучения и вариант с 40% вероятностью распознавания (для каждой цифры).
    Исходник:
    Перейти по ссылке
     
    pori нравится это.
  2. artcosmic

    artcosmic

    Регистр.:
    16 сен 2008
    Сообщения:
    198
    Симпатии:
    161
    Со скриптами для обучения кто-нибудь успел скачать? Там полчаса всего они были доступны, я не успел. А было бы интересно...
     
  3. polutin

    polutin Создатель

    Регистр.:
    11 авг 2007
    Сообщения:
    39
    Симпатии:
    51
    Можно не взламывая, воспользоваться сервисом, где индийцы разгадывают капчи за нас... Там процент вообще больше 95% :)... А так, концепция действительно интересная... На очереди Гугл...
     
  4. Atec

    Atec

    Регистр.:
    28 апр 2007
    Сообщения:
    296
    Симпатии:
    31
    Статья фуфло, подобные нейросети медленны и в 99% не преминимы, нормальную НС никто не опубликует да и на пыхе реализовывать НС довольно смешное занятие :)

    PS> Давно есть классы, и даже для пыха, где НС юзают для распознования образов, и все (те что публичные) работают либо очень медленно либо с большими погрешностями, поэтому думайте стоит ли тратить 15-20 сек. машинного времени на 25% вероятность разгадывания???

    P.P.S> Пример вобще смешной, чел тратит 7 сек. на убирание синусоид которые вобще для нейросети по определению не помеха...
     
  5. kactetus

    kactetus митя is here )

    Регистр.:
    26 авг 2007
    Сообщения:
    441
    Симпатии:
    278
    Я вижу ты спец по нейронным сетям, так покажи свой пример?
     
  6. o_nix

    o_nix

    Регистр.:
    7 ноя 2007
    Сообщения:
    1.073
    Симпатии:
    1.037
    Очень полезный скрипт былбы еслибы имелись скрипты для обучения...
    Кто в курсе на хабре их выкладывали и удалили ?? или вообще невыкладывали ??
    просто так скрипт абсолютно бесполезен ... процент успешного распознования всех шести цифр получится мизерным
     
  7. iehon

    iehon Постоялец

    Регистр.:
    7 ноя 2008
    Сообщения:
    104
    Симпатии:
    13
    http://www.anti-captcha.com/ неплохо подбирает, но тоже не идеально.
    Я к тому, что всегда большой процент ошибок, а это ведет к санкциям ПС
     
  8. WildKOT

    WildKOT Постоялец

    Регистр.:
    17 фев 2010
    Сообщения:
    93
    Симпатии:
    3
    А если сделать полуавтомат, показывается куча капчей и решений, которые сделаны ботом. Человек отмечает те, что правильные. Это снижает с одной стороны снижает процент ошибок, а с другой - всё равно в несколько раз быстрее, чем вводить вручную.
     
  9. Xeez

    Xeez

    Регистр.:
    24 июн 2008
    Сообщения:
    193
    Симпатии:
    18
    Это медленнее, а не быстрее
     
Статус темы:
Закрыта.