Как создать новостной агрегатор

Тема в разделе "Как сделать...", создана пользователем tarhan, 4 окт 2013.

Статус темы:
Закрыта.
  1. tarhan

    tarhan Постоялец

    Регистр.:
    6 апр 2007
    Сообщения:
    91
    Симпатии:
    5
    Как создать новостной агрегатор по типу ЯН, Новотека. Подскажите с чего начать, может у кого наработки есть?
    Пока на ум пришло построение похожих новостей с similar_text (заголовок новости, обрезаем до энного к-ва символов, по дате) или не то?
     
  2. Bauka

    Bauka Постоялец

    Регистр.:
    17 янв 2013
    Сообщения:
    114
    Симпатии:
    58
    Здесь я выложил скрипт :)
     
  3. tarhan

    tarhan Постоялец

    Регистр.:
    6 апр 2007
    Сообщения:
    91
    Симпатии:
    5
    не то, что нужно
     
  4. etosh

    etosh Создатель

    Регистр.:
    22 июл 2013
    Сообщения:
    32
    Симпатии:
    4
    Мда, как-то очень уж мутно задача сформулирована. Дали ссылку на RSS аггрегатор, оказывается не то.
    Ты напиши конкретнее, что должен делать твой "новостной агрегатор".
    Глядишь, и наработки будут.
     
  5. tarhan

    tarhan Постоялец

    Регистр.:
    6 апр 2007
    Сообщения:
    91
    Симпатии:
    5
    по типу ЯН, Новотека. Куда уж яснее формулировать, примером они и есть.
     
  6. etosh

    etosh Создатель

    Регистр.:
    22 июл 2013
    Сообщения:
    32
    Симпатии:
    4
    Ну без конкретики - фиг знает каких наработок ты ждёшь. Во-первых, есть категории, это первый уровень приближения. Во-вторых даты. В третьих - парсишь статьи, выкидываешь мусорные слова и и по ключам (+ категории +даты) ищещь соответствия. Что-то вроде similar articles плагинов, да. Правда по-хорошему нужно с морфологией ещё работать тут. Ну и последний этап - редакторы, люди которые вручную просматривают новости (хотя бы по заголовкам), думаю без них ЯН точно не обходится.
     
  7. tarhan

    tarhan Постоялец

    Регистр.:
    6 апр 2007
    Сообщения:
    91
    Симпатии:
    5
    В БД мы уже засунули данные прочитанные из rss, теперь нам нужно выстроить новости, с конечным материалом http://novoteka.ru/sevent/7970772/17825594 проблем не должно возникать - выстраиваем результаты с ограничением по дате, по полнотекстовому поиску мускуля или можно искать по similar_text заголовка с обрезанием в энное к-во символов и с опред. процентом, проблема возникает в выводе категории или на главной http://novoteka.ru/, каким образом оно выстраивается т.к. потоков с одной и той же новостью с рерайтом или копирайтом может быть много и разбиты они могут быть по большому промежутку времени, нам нужно всех относящихся к конкретному материалу отловить, пометить что 100 этих новостей относятся к новости №1, 25 других новостей относятся к новости №2 и т.д., и потом вывести новости №1........№222222 в категории.
     
  8. Arconoid

    Arconoid Писатель

    Регистр.:
    26 окт 2013
    Сообщения:
    2
    Симпатии:
    0
    Поставь какую нибудь CMS там есть всё в виде модулей.Новости ,форумы,каталоги,магазины,блоги и
    многое другое.
    Не надо ничего с нуля писать.Время не будешь зря тратить.
     
Статус темы:
Закрыта.