Сигнатуры для Web2.0 Portator

Тема в разделе "Автоблоггинг", создана пользователем Yus, 25 фев 2008.

Статус темы:
Закрыта.
  1. Yus

    Yus

    Регистр.:
    12 янв 2008
    Сообщения:
    255
    Симпатии:
    71
    Собственно, разбирался сидел с дезендом сигнатуры для сайта expert.ru.
    Мало что получилось. Если есть умельцы и php-кодеры, прокомментируйте пожалуйста синтаксис и что за что отвечает. Очень хочу научиться писать сигнатуры сам.

    Вот синтаксис

    post.php
    list.php

    Думаю информация будет полезна многим, кто сталкивался с проблемой создания уникальных сигнатур!
     
  2. Conroe

    Conroe

    Регистр.:
    16 янв 2008
    Сообщения:
    204
    Симпатии:
    23
    первым разбирай файл лист. т.к. он парсит урлы новостей.
    $pattern = "<div class=\"pub\">.*<a href=.+><img src=.+><\\/a>.*<p class=\"date\">.+<\\/p>.*<h2><a href=\"\\/(.*)\">.+<\\/a>.+<\\/h2>.*<p>.+<a href=.+>.+<\\/a><\\/p>.*<\\/div>"; эта штука находит в тексте код со структурой
    <div class=\"pub\">.*<a href=.+><img src=.+><\\/a>.*<p class=\"date\">.+<\\/p>.*<h2><a href=\"\\/(.*)\">.+<\\/a>.+<\\/h2>.*<p>.+<a href=.+>.+<\\/a><\\/p>.*<\\/div> и выдирает от-туда значение (.*) это и есть ссылка на новость(кстати эта дезенденая сигнатура работать недолжна нормально, хотя может работает у меня она немного по другому выглядит)
    в файле пост тот же прицип, только там этих (.*) больше, плюс они там обзываются по определенному:
    $content = array( $n[1][0], $n[2][0], $n[3][0] )[2];
    $autor = array( $n[1][0], $n[2][0], $n[3][0] )[1];
    $subj = array( $n[1][0], $n[2][0], $n[3][0] )[0];
    ниже этого не стоит менять т.к. там идет очистка от разных тегов(если не ошибаюсь.) можно только что-то убрать например автора. и т.д.
     
    baaltazar25 и Yus нравится это.
  3. GNurik

    GNurik Постоялец

    Регистр.:
    8 авг 2007
    Сообщения:
    72
    Симпатии:
    9
    Можно ли выложить хэлп по написанию сигнатур? Допустим, если собрать синтаксис регулярных выражений. И определить что за что отвечает и как работает. Это пишу со слов Conroe. Давайте разберёмся в этих сигнатурах, они же всем нужны. Больше всего меня интересует доступ к ресурсам забугорных новостных сайтов.
     
  4. Citron

    Citron Постоялец

    Регистр.:
    17 фев 2007
    Сообщения:
    125
    Симпатии:
    15
    Дезенд я научился делать. Благо, что на форуме все для этого есть. Сам дезенд брал здесь
    Результаты здесь.
    Вот сразу после дезенда затык и начинается. Что дальше...?
     
  5. GNurik

    GNurik Постоялец

    Регистр.:
    8 авг 2007
    Сообщения:
    72
    Симпатии:
    9
    Сейчас тоже качаю ДеЗенд. Никогда не приходилось самому такими вещами заниматься. А смысл дезенда просто раскрыть код в читабельный вид, да? А дальше как будет поступать. Как я понял, можно взять сигнатуру на RSS любого сайта и переделать его под другой сайт, так?
     
  6. Nike59

    Nike59

    Регистр.:
    13 ноя 2006
    Сообщения:
    459
    Симпатии:
    100
    Главное написать регулярное выражение под конкретный сайт. Для этого надо хорошо знать синтаксис регеспов. Книжка Фридла в помощь.
     
  7. GNurik

    GNurik Постоялец

    Регистр.:
    8 авг 2007
    Сообщения:
    72
    Симпатии:
    9
    Nike59, выложи пожалуйста мануалы.
     
  8. VadoZ

    VadoZ Постоялец

    Регистр.:
    23 окт 2007
    Сообщения:
    146
    Симпатии:
    55
    Мануалов или хелпа по написанию сигнатур не существует в природе.

    мануал по регуляркам в РНР можно читать этот
    http://www.php.net/manual/ru/ref.pcre.php
     
    GNurik нравится это.
  9. Nike59

    Nike59

    Регистр.:
    13 ноя 2006
    Сообщения:
    459
    Симпатии:
    100
    dmMrak и GNurik нравится это.
  10. dmMrak

    dmMrak Писатель

    Заблокирован
    Регистр.:
    1 ноя 2007
    Сообщения:
    98
    Симпатии:
    13
    частично разобрался с регуляркой для expert.ru (заголовок уже выдернул для новости) Вот только косяк в том, что он в не правильной кодирорвке. с этим можно что то сделать или проще искать другого донора?
     
Статус темы:
Закрыта.