Определение формы на странице для сабмита

Статус
В этой теме нельзя размещать новые ответы.

ViD

Бигбосс
Регистрация
12 Апр 2006
Сообщения
223
Реакции
232
Начал писать фришную тулзу по поиску формы на странице и оценка ее для возможности постинга. Также хочу чтобы еще можно было отслеживать сам пост.
Итак – что имеем сейчас на этот момент. Написал небольшой анализатор формы. Программа берет урл гостевой и оценивает форму. Вот пример гостевой и результат – Для просмотра ссылки Войди или Зарегистрируйся

Код:
FORM #0 at: 
TAG: INPUT src: <INPUT size=30 name=realname>
name: realname value:  size: 30 type:text
TAG: INPUT src: <INPUT size=30 name=username>
name: username value:  size: 30 type:text
TAG: INPUT src: <INPUT size=30 name=url>
name: url value:  size: 30 type:text
TAG: INPUT src: <INPUT size=15 name=city>
name: city value:  size: 15 type:text
TAG: INPUT src: <INPUT size=2 name=state>
name: state value:  size: 2 type:text
TAG: TEXTAREA src: <TEXTAREA name=comments rows=8 cols=80></TEXTAREA>
TAG: INPUT src: <INPUT type=submit value=Submit>
name:  value: Submit size: 20 type:submit
TAG: INPUT src: <INPUT type=reset value=Reset>
name:  value: Reset size: 20 type:reset
Form prc:#0 is 170
Используется оценка формы на нахождение элементов и капчи. Схема довольна известная – ищем все формы на странице и начинаем оценивать форму. Нашли input +10 к форме, textarea +100, img –500. Для картинки еще надо ввести наверное поиск размеры картинки и близость к элементу INPUT. По такой схеме подходят для постинга те, кто набрал более 100 баллов. Верхнюю планку не будет отслеживать. Теперь вот вопрос, я никак не реагирую на hidden поля, то есть оценка не меняется. Также есть еще типы INPUT type:checkbox, radio и есть SELECT. Тут я потерялся - как правильнее считать такое. Если есть мысли или вдруг делали такое – подскажите плиз
smile3.gif

Ко всему прочему я так понимаю, правильнее будет учитывать имена поля name для оценки и как то увеличивать значения для формы.
Теперь насчет нахождения поста или формы для добавления. К примеру у нас есть урл на страницу где есть сообщения. Собираем все линки на странице, ищем по шаблону текст в ссылке и/или адресу ссылки внутри домена. То есть форму найти достаточно просто, как только соберем приличный словарь.
Но теперь наоборот, имеем страницу из примера выше, как найти страницу поста и его проходимость. Во первых на post мы должны получить ответ 200 или 301. Тогда с большей уверенностью можно сказать, что пост прошел. Теперь как его искать?! По той же логике – ищем на странице все ссылки и оцениваем. В примере выше нету ссылок, тогда пытаемся перейти на уровень ниже – то есть Для просмотра ссылки Войди или ЗарегистрируйсяДля просмотра ссылки Войди или Зарегистрируйся/ И вот тут не понятно, если и тут не нашли ссылки на наши посты, стоит ли идти дальше. Вообщем пишите что думаете по этому поводу.
 
ну картинка может быть как капчей, так и элеметом дизайна, иконкой, смайлом и т.д.? за чтож тогда -500?

Ко всему прочему я так понимаю, правильнее будет учитывать имена поля name для оценки и как то увеличивать значения для формы.
здесь выкладывали большие списки имён полей; нужно сравнить имена полей name из формы с этим списком, чем больше совпадений - тем форма кошернее. Конкретно у меня скрипт только это и смотрит + наличие textarea + тупо размер формы типа strlen()

инпут для капчи тоже удобнее искать по списку name

можно сказать, что пост прошел. Теперь как его искать?! По той же логике – ищем на странице все ссылки и оцениваем. В примере выше нету ссылок, тогда пытаемся перейти на уровень ниже – то есть Для просмотра ссылки Войди или Зарегистрируйся И вот тут не понятно, если и тут не нашли ссылки на наши посты, стоит ли идти дальше. Вообщем пишите что думаете по этому поводу.
вообще такие поиски будут трафа жрать нещадно, так что если и делать такой углубленный поиск то опционально, чтобы если с трафом напряг то можно было отключить
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху