Парсер текста с сайта.

Тема в разделе "Мелочи", создана пользователем nemeve, 27 фев 2008.

  1. coguar

    coguar Постоялец

    Регистр.:
    4 авг 2007
    Сообщения:
    61
    Симпатии:
    11
    это RSS парсер.
     
  2. bork75

    bork75 The Team

    Регистр.:
    21 июн 2008
    Сообщения:
    1.450
    Симпатии:
    717
    Пока лучше Content Downloader ничего не видел, за последний месяц функционал расширился многократно.

    Перейти по ссылке
     
    Maza и opa100pe нравится это.
  3. kraman

    kraman Постоялец

    Регистр.:
    8 июн 2006
    Сообщения:
    129
    Симпатии:
    26
    По поводу Content Downloader - игруша для сеошников, но не маркетологов. Прога предназначена только для сбора контента, но никак не профессиональных базы данных.

    Предлагаю скинуться на парсер - программа для сбора данных с сайтов в Access


    Данный скрипт документируется обучающим курсом (видеоинструкцией по эксплуатации, без которой тяжело будет самому разобраться).

    Краткое ревью:
    - сбор всех страниц в одну;
    - сбор разбросанных на страницах таблиц в одну;
    - сбор конкретной повторяющейся ячейки в одну;
    - сбор извлечение изображений из табличек или повторяющихся страничек в директорию;
    - извлечение указанных однородных объектов в ячейки;

    Более того:
    - экранирование области поиска между тегами(например: <b></b>, <tr><td> < a href= "это1" title="это2 " > и даже это3 < / a > и еще вот это4 и так далее) ;
    - одновременная работа 50 потоков;
    - использование HTTP прокси по импортируемому из файла списку;
    - список плохих ссылок (404 ошибок) и автоматическая перезагрузка(для сбивчивого пинга);
    - возможность ввода диапозона;
    - выбор методов GET или POST;
    - скрытие (тунелирование) трафика;
    - автозамены объектов на ходу;
    - ограничитель частей ссылок для запрета сайтов;
    - круговой обход ссылок в пределах домена(url, сайта);
    - извлечение объектов, содержащих промежуточное значение альфы @;
    - кодировки языка UTF-8 и др(кириллица, английский);
    - инструменты автоматизации приведения кода в 1 строку, облегчающий работу;
    - ограничитель таймаута обхода;
    - браузер логин и пароль;
    - установка приоритета;
    - + в бонус автогенератор чисел, автосборщик, подборщик и сортировщик списков - супер инструмент для профессионалов!;
    - модуль макросов для подстановки сложных объектов (типа &pref=xxx&pref2=yyy&pref3=zzz и т.д.);
    - фиксация ограничителя символов при неожиданных случаях;
    - множество количество полей(столбцов)

    еще есть bget но цена кусается! Кто-то юзал эту прогу?
     
  4. ventus

    ventus Писатель

    Регистр.:
    1 июн 2013
    Сообщения:
    5
    Симпатии:
    0
    Если парсить с Content Downloader в таблицу, а потом обработать (сгенерировать дополнительные данные), то полученный файл вполне подходит для импорта на любой сайт.
     
  5. printsprint

    printsprint Постоялец

    Регистр.:
    22 июл 2009
    Сообщения:
    73
    Симпатии:
    28
    Если парсить с помощью Content Downloader, то в версии ULTIMATE предусмотрены дополнительные макросы
     
  6. meromax

    meromax

    Регистр.:
    19 янв 2013
    Сообщения:
    156
    Симпатии:
    22
    Если кому то нужно что то спарсить, обращайтесь
    Мелкие задачи сделаю за спасибо :)
     
  7. Yul717

    Yul717 Писатель

    Регистр.:
    11 май 2017
    Сообщения:
    1
    Симпатии:
    0
    Добрый день!
    Есть кое-какая задачка. Нужен парсер. Может кто-нибудь помочь?