1. Уважаемые пользователи, прежде чем ответить в теме или создать новую,
    внимательно ознакомьтесь с правилами раздела

    Кому лень работать или руки не оттуда - пользуйтесь услугами специалистов
  2. Не задавайте глупых вопросов "Посоветуйте какой-нибудь компонент.."

    Есть JED!!! Ищите там!!!

[Moved] Компонент yos_news_crawler

Тема в разделе "Joomla", создана пользователем CAPAXA, 26 мар 2010.

Информация :
  • Уважаемые пользователи, прежде чем ответить в теме или создать новую, внимательно ознакомьтесь с правилами раздела
  • Не задавайте глупых вопросов "Посоветуйте какой-нибудь компонент.." Есть JED!!! Ищите там!!!
  • Аналоги ищите там же - на JED!!!
  • Новая версия? - У кого будет - тот выложит!
Статус темы:
Закрыта.
Модераторы: arman29, DMS, Genk0
  1. CAPAXA

    CAPAXA

    Регистр.:
    7 июн 2007
    Сообщения:
    896
    Симпатии:
    535
    3ner нравится это.
  2. 3ner

    3ner

    Регистр.:
    21 июн 2009
    Сообщения:
    760
    Симпатии:
    198
    К сожалению на втором этапе споткнулся. В RegExp еще не очень силен.

    Хочу настроить на грабинг новостей с http://www.gamespot.com/
    Прописываю в Step 2:
    HTML:
    /<h3 class="title"><a href="(.*?)[^\?][^sid=*]"(?:*)title="(.*?)"\>(?:*)<\/a><\/h3>/i
    Получаю Invalid RegExp.
    Поправьте меня, где ошибся?
    Инструкция по теме находится тут:
    http://yopensource.com/en/documentation/yos-news-crawler/429-how-to-make-a-crawler-link
     
  3. CAPAXA

    CAPAXA

    Регистр.:
    7 июн 2007
    Сообщения:
    896
    Симпатии:
    535

    Не забывай экранировать кавычки (одинарные и двойные) обратным слешем "\"
     
  4. 3ner

    3ner

    Регистр.:
    21 июн 2009
    Сообщения:
    760
    Симпатии:
    198

    Примерно разобрался.
    Прим. В данной случае нужно описывать меньше чем того требует сам RedExp.
    Что у меня получилось:
    Step1:
    http://www.gamespot.com/
    Step2:
    /<h3 class="title">\s*<a href="(.*?)".*?>/i ->1
    Step3:
    /<h3 class="title">\s*<a href="(.*?)".*?>(.*?)<\/a>/i ->2
    Step4:
    Intro and Fulltext
    Step5:
    /<p property="v:summary">(.*?)<\/p>/i ->1 (не все проходит, надо более детально указать в Step1, пока не получается)
    А вот опять облом на Step6:
    /<div class="story_body\s*">\s<p>(.*?)</p>*\s*<\/div>/i (не проходит)
    Конструкция такая:
    <div class="story_body ">
    <p>
    Text ...
    </p><p>
    <div class="video_embed" style="width:480px;"><OBJECT classid="clsid: D27CDB6E-AE6D-11cf-96B8-444553540000" WIDTH=480 HEIGHT=310 id="videoPlayer"><PARAM NAME=movie VALUE="http://image.com.com/gamespot/images/cne_flash/production/eidothea/release/eidothea.swf"><PARAM NAME=scale VALUE="noScale"><PARAM NAME=salign VALUE="lt"><PARAM NAME=quality VALUE=high><PARAM NAME=allowscriptaccess VALUE="always"><PARAM NAME=flashvars VALUE="bwr=400&playerMode=embedded&movieAspect=16.9&mapp=editorial&gen=1&viewMode=sd&autoPlay=false&paramsXML=http%3A%2F%2Fwww.gamespot.com%2Fpages%2Fvideo_player%2Fxml.php%3Fid%3D6263919%26mode%3Dembedded%26width%3D480%26height%3D310%26newplayer%3D1%26skin%3DeidotheaEditorial480_169_light.xml"><embed id="mymovie" width="480" height="310" flashvars="bwr=400&playerMode=embedded&movieAspect=16.9&mapp=editorial&gen=1&viewMode=sd&autoPlay=false&paramsXML=http%3A%2F%2Fwww.gamespot.com%2Fpages%2Fvideo_player%2Fxml.php%3Fid%3D6263919%26mode%3Dembedded%26width%3D480%26height%3D310%26newplayer%3D1%26skin%3DeidotheaEditorial480_169_light.xml" wmode="opaque" allowscriptaccess="always" scale="noScale" salign="lt" allowFullScreen="true" quality="high" name="mymovie" style="" src="http://image.com.com/gamespot/images/cne_flash/production/eidothea/release/eidothea.swf" type="application/x-shockwave-flash"/></embed></OBJECT><div class="video_details"><p class="caption">Dan Hardy's welterweight title comes under threat from a GameSpot reviewer.</p><ul class="video_actions">
    <li class="comment first"><a href="/xbox360/action/ufcundisputed2010360/video/6263919?tag=embedded_video#generic_comments">Comment<span class="surplus"> on this video</span></a></li><li class="hd"><a href="/xbox360/action/ufcundisputed2010360/video/6263919?hd=1"><span>Watch <span class="surplus">this video </span>in </span>High Def</a></li></ul></div></div>
    </p><p>
    Text ...
    </p><p>
    Text ...
    </p><p>
    Text ...
    </p><p>
    <div class="embscreen_large">
    <a href="http://www.gamespot.com/xbox360/action/ufcundisputed2010360/images/6263908/2/?path=2010%2F145%2Freviews%2F981302_20100526_embed002.jpg&caption=When%2Bthe%2Bcamera%2Bgets%2Bthis%2Bclose%2Bto%2Bthe%2Baction%252C%2Bsomeone%2Bis%2Bin%2Btrouble.&cvr=I2c%2F">
    <img class="thumb" src="http://image.com.com/gamespot/images/2010/145/reviews/981302_20100526_embed002.jpg" alt="" /></a><p class="embscreen_caption"><a href="http://www.gamespot.com/xbox360/action/ufcundisputed2010360/images/6263908/2/?path=2010%2F145%2Freviews%2F981302_20100526_embed002.jpg&caption=When%2Bthe%2Bcamera%2Bgets%2Bthis%2Bclose%2Bto%2Bthe%2Baction%252C%2Bsomeone%2Bis%2Bin%2Btrouble.&cvr=I2c%2F">When the camera gets this close to the action, someone is in trouble.</a></p></div>
    </p><p>
    Text ...
    </p><p>
    Text ...
    </p><p>
    Text ...
    </p><p>
    <div class="embscreen_large">
    <a href="http://www.gamespot.com/xbox360/action/ufcundisputed2010360/images/6263908/3/?path=2010%2F145%2Freviews%2F981302_20100526_embed003.jpg&caption=Having%2Bthe%2Boption%2Bto%2Bpush%2Bopponents%2Bup%2Bagainst%2Bthe%2Bcage%2Badds%2Ba%2Bnew%2Bdimension%2Bto%2Bcombat.&cvr=zW50">
    <img class="thumb" src="http://image.com.com/gamespot/images/2010/145/reviews/981302_20100526_embed003.jpg" alt="" /></a><p class="embscreen_caption"><a href="http://www.gamespot.com/xbox360/action/ufcundisputed2010360/images/6263908/3/?path=2010%2F145%2Freviews%2F981302_20100526_embed003.jpg&caption=Having%2Bthe%2Boption%2Bto%2Bpush%2Bopponents%2Bup%2Bagainst%2Bthe%2Bcage%2Badds%2Ba%2Bnew%2Bdimension%2Bto%2Bcombat.&cvr=zW50">Text ...</a></p></div>
    </p><p>
    Text ...
    </p>
    </div>
    Need help:thenks:
     
  5. huygenn

    huygenn Постоялец

    Регистр.:
    20 ноя 2007
    Сообщения:
    132
    Симпатии:
    176
    Пожалуйста, зеркало новую ссылку
    спасибо
     
  6. 3ner

    3ner

    Регистр.:
    21 июн 2009
    Сообщения:
    760
    Симпатии:
    198
    silmarion и huygenn нравится это.
Статус темы:
Закрыта.