[Ищу] Парсер яндекс рефератов

Тема в разделе "SEO Скрипты", создана пользователем monia, 18 окт 2009.

Статус темы:
Закрыта.
  1. monia

    monia

    Регистр.:
    27 июл 2007
    Сообщения:
    421
    Симпатии:
    68
    Нужен парсер вот этого чуда _http://vesna.yandex.ru Видел один, который валяется в паблике, тот, что отправляет контент на мыло - немного не то. Хотелось бы, чтобы парсил сразу много статей и сохранял все в текстовый файл. Никто не встречал?:)
     
  2. ZCFD

    ZCFD

    Регистр.:
    16 янв 2008
    Сообщения:
    989
    Симпатии:
    437
    так а что там парсить то ?
    у меня такое было в спамере ЖЖ

    грубишь страницу , и парсишь ? Защиты там никакой, банов никаких

    Готового скрипта не видел, но пишется такое 10 минут.
     
  3. monia

    monia

    Регистр.:
    27 июл 2007
    Сообщения:
    421
    Симпатии:
    68
    не напишешь?:) кстати, а хуман может здесь как-нить помочь?
     
  4. ZCFD

    ZCFD

    Регистр.:
    16 янв 2008
    Сообщения:
    989
    Симпатии:
    437
    хуман может помочь , хз только зачем он тут

    коммерческие предложения в личку

    технические вопросы сюда
    =)
     
  5. monia

    monia

    Регистр.:
    27 июл 2007
    Сообщения:
    421
    Симпатии:
    68
    ок, тогда посмотри вот этот скриптец, почему-то на денвере выдает ошибку
    по идее должен сохранять контент в текстовые файлы
     
  6. ZCFD

    ZCFD

    Регистр.:
    16 янв 2008
    Сообщения:
    989
    Симпатии:
    437
    PHP:
    <?php
    $site 
    file_get_contents("http://referat.yandex.ru/astronomy.xml");
    #меняешь здесь astronomy.xml на нужный тебе(посмотреть их можно на главной, там ссылки будут на разделы) 
    preg_match("/margin-left:0;\">(.*)<\/h1>/i"$site$title);
    $title[1]=str_replace(':','-',$title[1]);
    $title[1]=str_replace('?','-',$title[1]);
     
    preg_match_all("/<p>(.*)<\/p>/i"$site$text); 
    $fp fopen($title[1]."txt""w"); 
    fwrite ($fpimplode("\n",$text[1]));
     
    fclose($fp);
    ?>
    на будующее пиши что за ошибки, а еще лучше читай что тебе пишет интерпритатор, просветишься
     
    monia нравится это.
  7. LEXAlForpostl

    LEXAlForpostl

    Регистр.:
    21 май 2008
    Сообщения:
    740
    Симпатии:
    226
    Да, только зачём?
    Яндекс всё равно в бан выкенет это всё.
    Тем более АГС-17 сейчас шерудит. :)
     
  8. Hilo

    Hilo

    Moderator
    Регистр.:
    31 мар 2008
    Сообщения:
    911
    Симпатии:
    568
    Где-то на форуме откопал непоню уже где.
    PHP-код
    PHP:
    <?
    // Обновление 14.06.2009
    // Использование скрипта - запускаем его http://путь_к_файлу?count=количество_обращений_к_серваку
    header("Content-Type: text/html; charset=windows-1251");

    $count $_GET['count'];
    $i=1;
    $link 'http://vesna.yandex.ru/estetica.xml'// Откуда будем брать текст

    echo "Задано ".$count." обращений к серверу Яндекса. Поехали...";

    while (
    $i<=$count){
    $content file_get_contents($link);
    preg_match_all('#<div.*?>(.*?)</div>#is'$content$text);
    $text preg_replace('#<h1.*?</h1>#'''$text[1][4]);
    $text preg_replace('#<h2>.*?</h2>#'''$text);
    $text preg_replace('#<p>#'''$text);
    $text preg_replace('#</p>#'''$text);
    $text preg_replace('#\n#'''$text);
    $f fopen("text.txt","a+");
    fwrite($f$text);
    fwrite($f"\r \n");
    fclose($f);
    $i++;
    }

    echo 
    'Готово';
    ?> 
     
  9. vaa008

    vaa008

    Регистр.:
    9 фев 2008
    Сообщения:
    165
    Симпатии:
    101
    TextMaker http://www.nulled.ws/showthread.php?t=73160
     
Статус темы:
Закрыта.