РегЭксп для определения склейки PR

Тема в разделе "Регулярные выражения", создана пользователем dig555, 5 янв 2009.

Статус темы:
Закрыта.
Модераторы: xpert13
  1. dig555

    dig555

    Регистр.:
    22 июн 2007
    Сообщения:
    362
    Симпатии:
    148
    Что-то в последнее время почти все доступные скрипты для определения склейки PR начали врать. Нужно заиметь рабочий вариант.

    Склейку можно узнать по запросу вида:
    info:site.com
    Если найден тот же сайт - то всё ОК. Если другой - клей.

    Пример. Домен xbox360.com склеен с xbox.com

    Вообщем, я забираю curl'ом страницу по запросу info:xbox360.com

    Естественно, единственная позиция в выдаче выдаёт сайт xbox.com

    Ниже кусок страницы с нужными данными.

    HTML:
    <h2 class=hd>Результаты поиска</h2><div><ol><li class=g><h3 class=r><a href="http://www.xbox.com/" target=_blank class=l onmousedown="return clk(this.href,'','','res','1','')">Xbox.com | Xbox.com Home</a></h3><span class="std nobr">&nbsp;- [ <a href="http://translate.google.ru/translate?hl=ru&amp;sl=en&amp;u=http://www.xbox.com/&amp;sa=X&amp;oi=translate&amp;resnum=1&amp;ct=result&amp;prev=/search%3Fq%3Dinfo:xbox360.com%26hl%3Dru%26newwindow%3D1%26rlz%3D1T4GFRB_ruBY246BY246" class=fl target=_blank>Перевести эту страницу</a> ]</span>
    Помогите выдрать из этого безобразия url найденной страницы :thenks:
    Тогда сравнив её с страницей в запросе c info: я смогу узнать склеен ли домен, и если склеен, то с кем...
     
  2. bumer3

    bumer3

    Регистр.:
    10 янв 2008
    Сообщения:
    291
    Симпатии:
    154
    PHP:
    preg_match_all('#<h2 class=hd>.*?<\/h2><div><ol><li class=g><h3 class=r><a href="(.*?)" target=_blank class=.*?>.*?<\/a><\/h3><span class="std nobr">.*?<\/span>#i'$text$matches)
    Пробуй этот
     
    dig555 нравится это.
Статус темы:
Закрыта.