Чем парсить коментарии от вконтакте

Тема в разделе "Мегафлуд", создана пользователем zilon, 15 авг 2012.

  1. zilon

    zilon

    Регистр.:
    30 июл 2011
    Сообщения:
    370
    Симпатии:
    147
    мне нужны 100-200К уникальных коментариев я смотрел, на сайтах, на которых подключены коментарии от VK - они не индексируются уникальный контент пропадает, негоже их там оставлять:-]

    я хотел content downlouderom их спарсить но не вышло... они просто не отображаются во встроеном браузере, даже при включеных скриптах
     
  2. latteo

    latteo Эффективное использование PHP, MySQL

    Moderator
    Регистр.:
    28 фев 2008
    Сообщения:
    1.546
    Симпатии:
    1.418
    Опционально коменты транслируются на стене написавшего, а контакт уже давненько открыл стены для ПС... так что уник не 100%

    Проверь выдачу ручками стоит оно того или нет?
     
  3. zilon

    zilon

    Регистр.:
    30 июл 2011
    Сообщения:
    370
    Симпатии:
    147
    точно... а если репост сделать, то тогда комент появится на стене, где же уникальные коменты брать, в закрытых группах ?:nezn:
     
  4. Genk0

    Genk0

    Регистр.:
    2 июн 2010
    Сообщения:
    10
    Симпатии:
    10
    Я парсил как то для Лифта через CD, он тоже не мог настроить. Могу попробовать, пиши в ЛС.
     
    zilon нравится это.
  5. lift

    lift Читатель

    Заблокирован
    Регистр.:
    1 июл 2007
    Сообщения:
    2.226
    Симпатии:
    1.377
    Я конкрено СД не смог спарсить. В итоге забил и парсил как обычно :)
     
  6. Genk0

    Genk0

    Регистр.:
    2 июн 2010
    Сообщения:
    10
    Симпатии:
    10
    Так я ж тебе тогда и выложил архив со всех стеной)
     
  7. lift

    lift Читатель

    Заблокирован
    Регистр.:
    1 июл 2007
    Сообщения:
    2.226
    Симпатии:
    1.377
    Ты мне выложил ссылки, по каким принципам парсить стены. Дальше я форумы (или как их там в вк называть не помню) так же раздербанил.
    Я же тебе тогда сказал: мне только на 1 ссыле пример показать надо, у меня этих групп сейчас напарсено на 4 месяца уже в отложеном постинге забито + раз в 10 больше в загашнике.
     
  8. zilon

    zilon

    Регистр.:
    30 июл 2011
    Сообщения:
    370
    Симпатии:
    147
    я проект почти настроил только не получается повторяющиеся границы правильно задать, я парсю имя и комментарий, использую для вывода тег <CD_CYCLE_GRAN_ALL!> шаблон вывода у меня такой

    [REPLACE(<td class="fw_reply_info">|<?php $db = mysql_connect("localhost","pobegporru_*****","******"); mysql_select_db("pobegporru_********" ,$db); @mysql_query("SET NAMES 'cp1251'"); $result = mysql_query ("INSERT INTO jos_jcomments (object_id, object_group, lang, userid, name, username, comment, date, published) VALUES ('8272', 'com_content', 'ru-RU', '0', '{break}<div class="fw_reply_text">|', '123456', '{break}</div>|', NOW(), '1' ) "); if ($result == true) { echo '<h1>всё ништяк</h1>'; } else { echo'не сработало'; } mysql_close($db); ?>{br}{br})]<CD_CYCLE_GRAN_ALL!>[/REPLACE]

    парсю сохраняя границы парсинга, которые в шаблоне вывода заменяются частями скрипта для импорта в базу, на выходе получается скрипт для импорта коментариев в джумлу вот такой

    <?php $db = mysql_connect("localhost","pobegporru_********","*********"); mysql_select_db("pobegporru_*********" ,$db); @mysql_query("SET NAMES 'cp1251'"); $result = mysql_query ("INSERT INTO jos_jcomments (object_id, object_group, lang, userid, name, username, comment, date, published) VALUES ('8272', 'com_content', 'ru-RU', '0', 'Valera Rabosch
    ', '123456', 'Та да темы сильные,красава', NOW(), '1' ) "); if ($result == true) { echo '<h1>всё ништяк</h1>'; } else { echo'не сработало'; } mysql_close($db); ?>


    Но если второй границы парсинга нету, то и скрипт не полностью загружается и обрывается по середине и получается критическая ошибка...

    <?php $db = mysql_connect("localhost","pobegporru_*******","*******"); mysql_select_db("pobegporru_********" ,$db); @mysql_query("SET NAMES 'cp1251'"); $result = mysql_query ("INSERT INTO jos_jcomments (object_id, object_group, lang, userid, name, username, comment, date, published) VALUES ('8272', 'com_content', 'ru-RU', '0', 'Рома Мармаєвський
    ', '123456', '<?php $db = mysql_connect("localhost","pobegporru_muzon","252197"); mysql_select_db("pobegporru_muzon" ,$db); @mysql_query("SET NAMES 'cp1251'"); $result = mysql_query ("INSERT INTO jos_jcomments (object_id, object_group, lang, userid, name, username, comment, date, published) VALUES ('8272', 'com_content', 'ru-RU', '0', 'Александр Манюх
    ', '123456', 'спасибо тебе', NOW(), '1' ) "); if ($result == true) { echo '<h1>всё ништяк</h1>'; } else { echo'не сработало'; } mysql_close($db); ?>

    помогите пожалуйста настроить :thenks:

    вот проект http://narod.ru/disk/59467731001.1a32a7290f19ab1b57b581f7c0583a20/VK.COM.zip.html

    там если открыть самую первую ссылку http://vk.com/wall-22866546_132224?reply=132424 в режиме предпросмотра, то в районе 26 строчки будет та самая проблема. Она из за того, что кто-то ответил кому-то и границы парсинга сбились, а я не знаю какие новые границы задать, уже мозг кипит:crazy:
     
  9. zilon

    zilon

    Регистр.:
    30 июл 2011
    Сообщения:
    370
    Симпатии:
    147