Помогите с патерном на извлечение числа проиндексированных страниц яндексом

Тема в разделе "Регулярные выражения", создана пользователем G-Null, 9 мар 2008.

Статус темы:
Закрыта.
Модераторы: xpert13
  1. G-Null

    G-Null

    Регистр.:
    6 сен 2007
    Сообщения:
    180
    Симпатии:
    21
    Подскажите, пожалуйста, такой патерн, который бы отделял
    340 913 от всего остального в случае
    http://www.yandex.ru/yandsearch?pag=u&surl=ya.ru&


    вроде работает (1-й элемент matches)
     
  2. andead

    andead Создатель

    Регистр.:
    11 ноя 2007
    Сообщения:
    30
    Симпатии:
    11
    Код:
    /страниц\&nbsp;\&mdash; \<b\>(.*)\<\/b\>/
    ??
     
    G-Null нравится это.
  3. savit

    savit Писатель

    Регистр.:
    4 апр 2008
    Сообщения:
    7
    Симпатии:
    3
    в $str содержимое страницы

    preg_match('/страниц&nbsp;&mdash;<b>(.*?)<\/b><br>/',$str,$p);

    print "Кол-во стрнаниц: ".str_replace("&nbsp;","",$p[1]);
     
    G-Null нравится это.
  4. Avtandil

    Avtandil Создатель

    Регистр.:
    30 сен 2006
    Сообщения:
    30
    Симпатии:
    24
    PHP:
    $html join(file($url)); // получение html-кода страницы
    if (ereg('страниц &mdash; <b>([0-9 ]+)</b>'// после '0-9' есть пробел
    str_replace('&nbsp;',' ',$html),$res)) echo $res[1];
    else echo 
    'Шаблон не найден.';
     
    G-Null нравится это.
  5. G-Null

    G-Null

    Регистр.:
    6 сен 2007
    Сообщения:
    180
    Симпатии:
    21
    Хочу вытащить весь тайтл яндексовской страницы поиска. При использовании следующего кода
    PHP:
    $html join(file('http://yandex.ru/yandsearch?pag=u&surl=nulled.ws'));

    $yaQtyPattern "!<title>(.*?)<\/title>!si";

    preg_match($yaQtyPattern$html$matches);
    echo 
    $matches[1];
    в рез-тате чего получаю следующую штуку
    подскажите, пожалуйста, как исправить этот баг с кодировкой ..
     
  6. ozware

    ozware

    Регистр.:
    22 апр 2007
    Сообщения:
    327
    Симпатии:
    42
    PHP:
    $html iconv("utf8""cp1251"$html);
     
  7. Avtandil

    Avtandil Создатель

    Регистр.:
    30 сен 2006
    Сообщения:
    30
    Симпатии:
    24
    Соединю всё вместе и выкину лишнее на мой взгляд:
    PHP:
    $html join(file('http://yandex.ru/yandsearch?pag=u&surl=nulled.ws'));
    if (
    preg_match('~<title>(.*)</title>~si',$html,$matches)) echo iconv('UTF-8','WINDOWS-1251',$matches[1]);
     
  8. artcosmic

    artcosmic

    Регистр.:
    16 сен 2008
    Сообщения:
    198
    Симпатии:
    161
    Если нет iconv можно просто файл скрипта сохранить в кодировке UTF8 при помощи EmEditor, Notepad++ или другого редактора.
    Полет нормальный )
     
Статус темы:
Закрыта.