Плагин Работа с тэгами (удалить нулевые)

ustas007 · 19 Дек 2008

Проблема следующего порядка... надергал я 6000 нужных тэгов, грузанул себе в WP Проавтотагал все статьи... но появилась проблема - есть куча нулевых тагов (не использованных), и все бы ничего, да на одном из хостов память ограничена, и если тагов более чем 3000-4000 то сайтмэп не хочет создаваться. Теперь внимание вопрос:
1. Если такой плагин который мне позволит удалить не используемые тэги или хотя бы дать мне возможность отсортировать их по использованности чтобы можно было удалить?
2. Как это чудо называется?

Ни один из мне известных плагинов не хочет так работать, позволяют удалять, но проходить 600 страниц чтобы искать какой из них имеет 0 как то не очень хочется.
За ранее спасибо за наВодку. )

itex · 21 Дек 2008

Наверно чисто писать надо, врятли много людей парсят по 6000 тегов, а потом удаляют ненужные.

ustas007 · 1 Янв 2009

Гмм, одно дело, когда ты работаешь с одним ворд прессом, другое когда у тебя их десяток. Достаточно насобирать нужные фразы и загрузить в WP. Единственный недостаток это лишние тэги... Так все-таки кто-нибудь втречался с чисткой? Или хотя бы структуру баз данных WP может кто подсказать где посмотреть?
Заранее спасибо.

joefast · 4 Янв 2009

Таблица wp_term_taxonomy поле taxonomy должно быть равно "post_tag" поле count должно быть больше 0. Получается что-то вроде

PHP:

DELETE FROM wp_term_taxonomy WHERE taxonomy="post_tag" AND count=0

Проверять на себе не хочется

itex · 4 Янв 2009

Должно получиться, еще потом может wp_term_relationships почистить придется, но это если удалите теги которые использовались в постах.

partizannn · 5 Янв 2009

По моему плагин Simple Tags умеет килять нулевые теги...

udalov · 20 Янв 2009

partizannn написал(а):
По моему плагин Simple Tags умеет килять нулевые теги...

да, насколько я знаю, этот плагин помечает тегами, полностью соответствующими словам в тексте. если каких то меток в тексте просто нет, то он их не использует.

в wp, кстати баг есть (или был), из за которого при импотре\экспорте записи помечаются тегами в виде цифр. о баге _wordpress.org/support/topic/152253 как пофиксить тут _trac.wordpress.org/ticket/5330

partizannn · 20 Янв 2009

udalov написал(а):
да, насколько я знаю, этот плагин помечает тегами, полностью соответствующими словам в тексте. если каких то меток в тексте просто нет, то он их не использует.

в wp, кстати баг есть (или был), из за которого при импотре\экспорте записи помечаются тегами в виде цифр. о баге _wordpress.org/support/topic/152253 как пофиксить тут _trac.wordpress.org/ticket/5330

Совершенно верно, но кроме умения помечать - у него еще довольно сильная ситема управления метками, в том числе и удалять нулевые...

udalov · 21 Янв 2009

конечно, чистка ненужных меток из базы в 6000 - нелёгкая работка... я делаю так:

для получения меток использую программу wordtabulator. собственно говоря, программа анализирует частотность слов и словосочетаний в тексте. можно брать пару сотен наиболее часто встречающихся слов, и плагином simpletags помечать заметки.

возможно, всякие деепричастия (не знаю, что это такое) в облаке меток для человека и будут выглядеть странно, но в сателлите для поисковиков будет нормально.

полное описание программы _www.rvb.ru/soft/wt/wt.htm_

выдержки из описания

Программа WordTabulator предназначена для анализа текстов в среде Windows 9x/NT/2000/XP. Это удобный инструмент для построения упорядоченного индекса символьных элементов в заданном множестве текстов. Программа понимает тексты в основных русскоязычных кодировках (Win-1251, KOI8-r, DOS-866). Дополнительной возможностью является задание кодовой страницы ASCII, для которой множество символов алфавита обрабатываемых элементов ограничивается латинскими буквами. В качестве таких элементов могут быть словоформы, словосочетания или синтагмы.

Анализируемые тексты задаются совокупностью входных текстовых файлов в формате HTML или обычного текста. Программа может обрабатывать документы в формате HTML 4.01, игнорируя их разметку. Дополнительной возможностью анализа может быть обработка двух совокупностей текстов, которые можно сравнивать на общность или различие по составу исследуемых элементов.

Обрабатываемая совокупность элементов может быть сужена путем задания поисковых запросов, в которых допускаются стандартные символы маскирования (* и ?).

В версии 2.2 появилась возможность поиска всех видоизменений слова, заданного в базовой форме. Для этого используется генератор словоформ, построенный на основе грамматического словаря А.А.Зализняка.

Выходным результатом программы является файл, содержащий упорядоченный индекс искомых элементов. Упорядочение может производиться в алфавитном порядке или по частоте встречаемости. При сохранении выходного индекса в формате HTML-документа он дополняется ссылками на исходный контекст.

На размеры обрабатываемых совокупностей текстов никаких ограничений не накладывается - лишь бы выдержал компьютер.

конец цитаты
скачать программу можно где-то там же

кто что думает по поводу программы и моего подхода?

partizannn · 21 Янв 2009

По поводу вашего подхода: человек уже написал что теги уже существуют и собирать их не надо... ему надо лишь удалить не нужные, советов по этой теме ему было предложено несколько , сам автор затих и молчит. а судя по описанию вашей проги она не подходит... И вообще при чем тут анализа текстов в среде Windows 9x/NT/2000/XP если речь идет про WordPress?

Плагин Работа с тэгами (удалить нулевые)

ustas007

Создатель

itex

Гуру форума

ustas007

Создатель

joefast

Гуру форума

itex

Гуру форума

partizannn

Гуру форума

udalov

Создатель

partizannn

Гуру форума

udalov

Создатель

partizannn

Гуру форума