Определение формы на странице для сабмита

Тема в разделе "Тех. вопросы", создана пользователем ViD, 21 мар 2008.

Статус темы:
Закрыта.
  1. ViD

    ViD Бигбосс

    Регистр.:
    13 апр 2006
    Сообщения:
    221
    Симпатии:
    225
    Начал писать фришную тулзу по поиску формы на странице и оценка ее для возможности постинга. Также хочу чтобы еще можно было отслеживать сам пост.
    Итак – что имеем сейчас на этот момент. Написал небольшой анализатор формы. Программа берет урл гостевой и оценивает форму. Вот пример гостевой и результат – Перейти по ссылке

    Код:
    FORM #0 at: 
    TAG: INPUT src: <INPUT size=30 name=realname>
    name: realname value:  size: 30 type:text
    TAG: INPUT src: <INPUT size=30 name=username>
    name: username value:  size: 30 type:text
    TAG: INPUT src: <INPUT size=30 name=url>
    name: url value:  size: 30 type:text
    TAG: INPUT src: <INPUT size=15 name=city>
    name: city value:  size: 15 type:text
    TAG: INPUT src: <INPUT size=2 name=state>
    name: state value:  size: 2 type:text
    TAG: TEXTAREA src: <TEXTAREA name=comments rows=8 cols=80></TEXTAREA>
    TAG: INPUT src: <INPUT type=submit value=Submit>
    name:  value: Submit size: 20 type:submit
    TAG: INPUT src: <INPUT type=reset value=Reset>
    name:  value: Reset size: 20 type:reset
    Form prc:#0 is 170
    
    Используется оценка формы на нахождение элементов и капчи. Схема довольна известная – ищем все формы на странице и начинаем оценивать форму. Нашли input +10 к форме, textarea +100, img –500. Для картинки еще надо ввести наверное поиск размеры картинки и близость к элементу INPUT. По такой схеме подходят для постинга те, кто набрал более 100 баллов. Верхнюю планку не будет отслеживать. Теперь вот вопрос, я никак не реагирую на hidden поля, то есть оценка не меняется. Также есть еще типы INPUT type:checkbox, radio и есть SELECT. Тут я потерялся - как правильнее считать такое. Если есть мысли или вдруг делали такое – подскажите плиз [​IMG]
    Ко всему прочему я так понимаю, правильнее будет учитывать имена поля name для оценки и как то увеличивать значения для формы.
    Теперь насчет нахождения поста или формы для добавления. К примеру у нас есть урл на страницу где есть сообщения. Собираем все линки на странице, ищем по шаблону текст в ссылке и/или адресу ссылки внутри домена. То есть форму найти достаточно просто, как только соберем приличный словарь.
    Но теперь наоборот, имеем страницу из примера выше, как найти страницу поста и его проходимость. Во первых на post мы должны получить ответ 200 или 301. Тогда с большей уверенностью можно сказать, что пост прошел. Теперь как его искать?! По той же логике – ищем на странице все ссылки и оцениваем. В примере выше нету ссылок, тогда пытаемся перейти на уровень ниже – то есть Перейти по ссылке/ И вот тут не понятно, если и тут не нашли ссылки на наши посты, стоит ли идти дальше. Вообщем пишите что думаете по этому поводу.
     
  2. yop

    yop Писатель

    Регистр.:
    19 авг 2007
    Сообщения:
    1
    Симпатии:
    0
    ну картинка может быть как капчей, так и элеметом дизайна, иконкой, смайлом и т.д.? за чтож тогда -500?

    здесь выкладывали большие списки имён полей; нужно сравнить имена полей name из формы с этим списком, чем больше совпадений - тем форма кошернее. Конкретно у меня скрипт только это и смотрит + наличие textarea + тупо размер формы типа strlen()

    инпут для капчи тоже удобнее искать по списку name

    вообще такие поиски будут трафа жрать нещадно, так что если и делать такой углубленный поиск то опционально, чтобы если с трафом напряг то можно было отключить
     
Статус темы:
Закрыта.