Помощь Как почистить новости от HTML мусора.

Тема в разделе "DLE", создана пользователем jcrush, 31 май 2010.

Информация :
Актуальная версия DataLife Engine 12.0
( Final Release v.12.0 | Скачать DataLife Engine | Скачать 12.0 demo )
Нужно ли обновляться | Как обновиться | Изменения в шаблонах
> Нет русских символов <
[Приватная тема DLE (Все подробности в ЛС к модератору раздела)]

Версии 11.3 и ниже - уязвимы!

Локализации | F.A.Q. | Внешний вид
Правила раздела | Правила форума
Обсуждение хайда карается баном!
В каждом сообщении указывайте версию DLE, которого они касаются!
Статус темы:
Закрыта.
Модераторы: killoff
  1. jcrush

    jcrush

    Регистр.:
    10 ноя 2006
    Сообщения:
    692
    Симпатии:
    55
    Добрый день всем, многие парсят сайты, и после граббинга, остается много мусора, конечно можно об этом заранее позаботиться, но не всегда об этом помнишь.

    И так есть новости на сайте, нужно убрать остатки хтмл, вырезать не нужные теги, дивы, p теги и в тоже время оставить нужное, например br и прочее... кто что посоветует не ручками естественно?
     
  2. bbk

    bbk Создатель

    Регистр.:
    24 июл 2007
    Сообщения:
    19
    Симпатии:
    2
    А почему бы относительно легко и просто это не делать через php-функцию htmlspecialchars?
     
  3. Горбушка

    Горбушка Ищу её...

    Регистр.:
    2 май 2008
    Сообщения:
    3.209
    Симпатии:
    2.237
    Может потому, что она не вырезает </p> а превращает его в &lt;/p&gt; ?
    А нам надо вырезать определённые куски кода, а не превращать их в текст...

    Попробуй использовать работу со строками: str_replace, к примеру.
     
  4. CheburatoR-all

    CheburatoR-all Гипножаба

    Регистр.:
    26 апр 2009
    Сообщения:
    295
    Симпатии:
    438
    Чуваку нужно только определенные вырезать
     
  5. jcrush

    jcrush

    Регистр.:
    10 ноя 2006
    Сообщения:
    692
    Симпатии:
    55
    Можно было бы конечно strip_tags использовать самое оно, но это не работает непосредственно в SQL, а базу сливать это много и долго....
     
Статус темы:
Закрыта.