[Плагин] Работа с тэгами (удалить нулевые)

Тема в разделе "Wordpress", создана пользователем ustas007, 20 дек 2008.

Статус темы:
Закрыта.
Модераторы: Sorcus
  1. ustas007

    ustas007 Создатель

    Регистр.:
    28 ноя 2008
    Сообщения:
    22
    Симпатии:
    3
    Проблема следующего порядка... надергал я 6000 нужных тэгов, грузанул себе в WP Проавтотагал все статьи... но появилась проблема - есть куча нулевых тагов (не использованных), и все бы ничего, да на одном из хостов память ограничена, и если тагов более чем 3000-4000 то сайтмэп не хочет создаваться. Теперь внимание вопрос:
    1. Если такой плагин который мне позволит удалить не используемые тэги или хотя бы дать мне возможность отсортировать их по использованности чтобы можно было удалить?
    2. Как это чудо называется?

    Ни один из мне известных плагинов не хочет так работать, позволяют удалять, но проходить 600 страниц чтобы искать какой из них имеет 0 как то не очень хочется.
    За ранее спасибо за наВодку. )
     
  2. itex

    itex

    Регистр.:
    15 ноя 2007
    Сообщения:
    274
    Симпатии:
    64
    Наверно чисто писать надо, врятли много людей парсят по 6000 тегов, а потом удаляют ненужные.
     
  3. ustas007

    ustas007 Создатель

    Регистр.:
    28 ноя 2008
    Сообщения:
    22
    Симпатии:
    3
    Гмм, одно дело, когда ты работаешь с одним ворд прессом, другое когда у тебя их десяток. Достаточно насобирать нужные фразы и загрузить в WP. Единственный недостаток это лишние тэги... Так все-таки кто-нибудь втречался с чисткой? Или хотя бы структуру баз данных WP может кто подсказать где посмотреть?
    Заранее спасибо.
     
  4. joefast

    joefast

    Заблокирован
    Регистр.:
    6 ноя 2007
    Сообщения:
    464
    Симпатии:
    74
    Таблица wp_term_taxonomy поле taxonomy должно быть равно "post_tag" поле count должно быть больше 0. Получается что-то вроде

    PHP:
    DELETE FROM wp_term_taxonomy WHERE taxonomy="post_tag" AND count=0
    Проверять на себе не хочется ;)
     
  5. itex

    itex

    Регистр.:
    15 ноя 2007
    Сообщения:
    274
    Симпатии:
    64
    Должно получиться, еще потом может wp_term_relationships почистить придется, но это если удалите теги которые использовались в постах.
     
  6. partizannn

    partizannn

    Регистр.:
    15 сен 2008
    Сообщения:
    418
    Симпатии:
    52
    По моему плагин Simple Tags умеет килять нулевые теги...
     
  7. udalov

    udalov Создатель

    Регистр.:
    7 ноя 2008
    Сообщения:
    25
    Симпатии:
    2
    да, насколько я знаю, этот плагин помечает тегами, полностью соответствующими словам в тексте. если каких то меток в тексте просто нет, то он их не использует.

    в wp, кстати баг есть (или был), из за которого при импотре\экспорте записи помечаются тегами в виде цифр. о баге _wordpress.org/support/topic/152253 как пофиксить тут _trac.wordpress.org/ticket/5330
     
  8. partizannn

    partizannn

    Регистр.:
    15 сен 2008
    Сообщения:
    418
    Симпатии:
    52
    Совершенно верно, но кроме умения помечать - у него еще довольно сильная ситема управления метками, в том числе и удалять нулевые...
     
  9. udalov

    udalov Создатель

    Регистр.:
    7 ноя 2008
    Сообщения:
    25
    Симпатии:
    2
    конечно, чистка ненужных меток из базы в 6000 - нелёгкая работка... я делаю так:

    для получения меток использую программу wordtabulator. собственно говоря, программа анализирует частотность слов и словосочетаний в тексте. можно брать пару сотен наиболее часто встречающихся слов, и плагином simpletags помечать заметки.

    возможно, всякие деепричастия (не знаю, что это такое) в облаке меток для человека и будут выглядеть странно, но в сателлите для поисковиков будет нормально.

    полное описание программы _www.rvb.ru/soft/wt/wt.htm_

    выдержки из описания

    Программа WordTabulator предназначена для анализа текстов в среде Windows 9x/NT/2000/XP. Это удобный инструмент для построения упорядоченного индекса символьных элементов в заданном множестве текстов. Программа понимает тексты в основных русскоязычных кодировках (Win-1251, KOI8-r, DOS-866). Дополнительной возможностью является задание кодовой страницы ASCII, для которой множество символов алфавита обрабатываемых элементов ограничивается латинскими буквами. В качестве таких элементов могут быть словоформы, словосочетания или синтагмы.

    Анализируемые тексты задаются совокупностью входных текстовых файлов в формате HTML или обычного текста. Программа может обрабатывать документы в формате HTML 4.01, игнорируя их разметку. Дополнительной возможностью анализа может быть обработка двух совокупностей текстов, которые можно сравнивать на общность или различие по составу исследуемых элементов.

    Обрабатываемая совокупность элементов может быть сужена путем задания поисковых запросов, в которых допускаются стандартные символы маскирования (* и ?).

    В версии 2.2 появилась возможность поиска всех видоизменений слова, заданного в базовой форме. Для этого используется генератор словоформ, построенный на основе грамматического словаря А.А.Зализняка.

    Выходным результатом программы является файл, содержащий упорядоченный индекс искомых элементов. Упорядочение может производиться в алфавитном порядке или по частоте встречаемости. При сохранении выходного индекса в формате HTML-документа он дополняется ссылками на исходный контекст.

    На размеры обрабатываемых совокупностей текстов никаких ограничений не накладывается - лишь бы выдержал компьютер.

    конец цитаты
    скачать программу можно где-то там же

    кто что думает по поводу программы и моего подхода?
     
  10. partizannn

    partizannn

    Регистр.:
    15 сен 2008
    Сообщения:
    418
    Симпатии:
    52
    По поводу вашего подхода: человек уже написал что теги уже существуют и собирать их не надо... ему надо лишь удалить не нужные, советов по этой теме ему было предложено несколько , сам автор затих и молчит. а судя по описанию вашей проги она не подходит... И вообще при чем тут анализа текстов в среде Windows 9x/NT/2000/XP если речь идет про WordPress?
     
Статус темы:
Закрыта.