Индексация HTML страниц созданных в Microsoft Word

Статус
В этой теме нельзя размещать новые ответы.

Scaltro

Гуру форума
Регистрация
15 Сен 2007
Сообщения
1.148
Реакции
79
Хотел бы поинтересоваться, как индексируются поисковиками HTML страницы созданные в Microsoft Office Word и индексируются ли они вообще?
Там просто код исходный очень кудрявый какой то.....
 
Код корявый это факт но индексируются нормально, вот к примеру у заказчиков таким макаром сделан прайс на сайте

Также встречал самописный движек внутренние страницы которого имеют такую верстку как у Ворда, ничё индексируется... Естественно не идеально но такие страницы поисковики понимают
 
Имхо лучше написать скрипт, который в заголовки будет прописывать мета теги. в остальном верстка ворда вполне цивильная
 
Естественно не идеально но...
Что понимается под неидеальностью?

Имхо лучше написать скрипт, который в заголовки будет прописывать мета теги. в остальном верстка ворда вполне цивильная
Я код редактируемой страницы вставляю в контент CMS, так что это лишнее будет...
 
неидеальность в первую очередь из-за несоответствия W3C. Хотя не знаю может в новых вордах эту проблему уже решают, я 2003-й юзаю.

Ну и конечно же из-за того что перед тем как начинается сам контент идёт куча комментариев, стилей и классов, такое дело для поисковых систем лучше запихивать в отдельные файлы чтобы бот не тратил время на перелистывания кода не имеющего для него значения
 
На выходе Microsoft Office Word дает много лишнего кода, и это может повлиять на разное отображение в различных браузерах. Поэтому его лучше почистить.
Наберите в гугле: Чистка кода Office XP или Чистильщик HTML кода. Там куча сайтов с тулзой, где его можно почистить. Автор скрипта, говорит что на выходе получается что то более вменяемое.
 
А если Office 2007 юзаю...

Добавлено через 10 минут
Вот эта онлайн софтина:

Но толком мусора то не уменьшается, после чистки по прежнему куча говна остаётся.....
 
я бы использовал tinymce
Он код из word'a достаточно чисто импортирует
 
Индексация HTML страниц созданных в Microsoft Word - это проверка поисковика на сообразительность и делать этого не стоит, разьве что для эксперимента.
 
Что понимается под неидеальностью?
Я код редактируемой страницы вставляю в контент CMS, так что это лишнее будет...
так а смысл перегонять в хтмл? не проще ли использую визуальный редактор воткнуть из ворда напрямую?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху