1. Внимание! Строго запрещен ап своих тем чаще чем раз в 7 дней! Если ваши услуги/товары никому не интересны - UP вам не поможет! Хотите чтобы тема была сверху всегда - оплачивайте закрепление!

[Куплю] Срочно. Парсинг формы сайта

Тема в разделе "Рекламный раздел", создана пользователем masterfaster, 19 сен 2012.

Информация :
  1. masterfaster

    masterfaster Постоялец

    Регистр.:
    24 мар 2008
    Сообщения:
    109
    Симпатии:
    8
    Необходимо как можно раньше сделать скрипт, который бы проверял эту форму


    Так вот - надо чтобы приходили уведомления если есть что-то
    Кто может сделать - пишите цену и контакты в личку.
     
  2. stealthdebuger

    stealthdebuger Механик

    Administrator
    Регистр.:
    25 авг 2008
    Сообщения:
    624
    Симпатии:
    1.379
    Устроит цена - будет готово сегодня.
     
  3. zzallexx

    zzallexx

    Регистр.:
    11 июн 2008
    Сообщения:
    1.036
    Симпатии:
    699
    ну судя по всему парсить надо всетаки с этой страницы
     
  4. masterfaster

    masterfaster Постоялец

    Регистр.:
    24 мар 2008
    Сообщения:
    109
    Симпатии:
    8
    $50 дорого


    zzallexx - ага, получается оттуда
     
  5. marvinz

    marvinz

    Регистр.:
    7 апр 2009
    Сообщения:
    158
    Симпатии:
    74
    Код:
    # coding: utf-8
    from lxml import etree
    import base64
    import time
    import codecs
    import ctypes
    import re
    from grab import Grab
    import logging
    import sys
    import locale
    from sys import stderr
    reload(sys)
    sys.setdefaultencoding('utf-8')
    sys.stdout = codecs.getwriter('cp866')(sys.stdout,'replace')
     
    nextstep = "ctl00$plhMain$cboVAC"
    nextstep1 = "ctl00$plhMain$cboVisaCategory"
    errors = "We are sorry for the inconvenience"
    errors1 = "Invalid Attempt"
    def go2():
        g.set_input('ctl00$plhMain$cboVAC', "8")
        g.set_input('ctl00$plhMain$cboPurpose', "1")
        g.submit()
        tmp = g.response.body
        if nextstep1 in g.response.body :
            return 2
        else:
            return 0
     
    def go3():
        if errors in g.response.body :
            return 0
        else:
            g.set_input('ctl00$plhMain$cboVisaCategory',"239")
            g.set_input('__EVENTTARGET', "239")
            g.submit(submit_name='ctl00$plhMain$btnSubmit')
            tmp = g.response.body
            if errors1 in g.response.body :
                return 0
            #if errors in g.response.body :
            #    return 0
            return 2
     
    def go1():
        if "EVENTTARGET" in g.response.body :
            time.sleep(3)
            g.set_input('__EVENTTARGET', "ctl00$plhMain$lnkSchApp")
            g.submit()
            tmp = g.response.body
            if nextstep in g.response.body :
                return 2
            else:
                return 0
        else:
            return 0
     
    chekurl = "visaservices.firm.in/Poland-Ukraine/Ukranian/scheduleanappointment.html"
     
    g = Grab(charset='utf-8', reuse_cookies=False, user_agent='Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)', referer='visaservices.firm.in/Poland-Ukraine/Ukranian/scheduleanappointment.html', hammer_mode=True, debug_post=False, hammer_timeouts=((90, 90),(90, 90)))
    g.setup(log_dir='C:\\Log1\\')
     
    g.go(chekurl)
    tmp = g.response.body
    chekurl = tmp.split("<iframe src=")[1].split("width")[0].split('"')[1]
     
    time.sleep(3)
    g.go(chekurl)
    print chekurl
    n=1
    while n > 0:
        if go1() > 1:
            print 1
            if go2() > 1:
                time.sleep(4)
                print 2
                if go3() > 1:
                    print 3
                    time.sleep(4)
                    n = 0-1
     
     
    tmp = g.response.body
    errors2 = "No date(s) available for appointment at"
    if errors2 in g.response.body :
        print "No date(s) available"
    else :
        g.submit()
        print "done. sleeping 10 sec"
        time.sleep(10)
    поставьте себе питон и библиотеку Grab http://grablib.org/docs/index.html#
     
  6. masterfaster

    masterfaster Постоялец

    Регистр.:
    24 мар 2008
    Сообщения:
    109
    Симпатии:
    8
    большое спасибо marvinz
    как раз несколько часов назад договорился с stealthdebuger за обоюдоприемлимую оплату

    на Нулледе самые лучшие участники, хотя сталкивался с разными форумами :ay: реально все помогли!
     
  7. tolik1802

    tolik1802 Постоялец

    Регистр.:
    11 янв 2008
    Сообщения:
    83
    Симпатии:
    14
    Поставил Ваш скрипт. Скрипт запустился. В папке лог. создались файлы. В Скрипт подставил нужные мне значения из формы.
    Вы можете объяснить как работает скрипт? как смотреть.

    вот логи:
     
    Последнее редактирование: 20 июн 2014