SiteMap для EE

Тема в разделе "ExpressionEngine", создана пользователем indian.rider, 27 ноя 2008.

Статус темы:
Закрыта.
  1. indian.rider

    indian.rider Постоялец

    Регистр.:
    20 окт 2008
    Сообщения:
    119
    Симпатии:
    26
    Есть такой чудесный модуль для EE как sitemap.

    Легко прикручивается и работает. Но у меня в день появляется значительно больше сотни новостей, а в базе их больше 200 тыщ. на данный момент.

    Карту сайта по все новостям сгенерить -- это, мне кажется, безумие.

    Как вообще быть в этом случае?
     
  2. mxnr

    mxnr Постоялец

    Регистр.:
    7 июн 2007
    Сообщения:
    134
    Симпатии:
    39
    Ну так же LG Better Meta v1.7.0 - с встроенным SiteMap'om
    Но если у вас столько новостей... может просто прикрутить xml-sitemaps и поставить его на крон (пусть запускается раз в 24 часа)? У меня так форум мапится.
     
  3. indian.rider

    indian.rider Постоялец

    Регистр.:
    20 окт 2008
    Сообщения:
    119
    Симпатии:
    26
    Спасибо. Это тоже посмотрю.

    Добавлено через 1 минуту
    Вопрос в том, что новостей слишком много. Файл получается огромный.

    Как быть в таком случае?
     
  4. mxnr

    mxnr Постоялец

    Регистр.:
    7 июн 2007
    Сообщения:
    134
    Симпатии:
    39
    А вас что больше волнует - то что долго делается или то что он вообще огромен?
    Возможно стоит сделать для себя лимит в n-количество новостей и скорей всего написать свой sitemap которые будет не генерировать лист с 0, а добавлять записи в конец (или начала), ориентируясь по id последней записи.
     
  5. ppr

    ppr Постоялец

    Регистр.:
    2 апр 2006
    Сообщения:
    68
    Симпатии:
    20
    Если я не ошибаюсь

    Если это новости, то на них есть ссылки и Google их сам найдет. Sitemap помогает указать страницы, на которые нет ссылки (например, доступ по поиску или через несканируемый флэш).

    P.S. И еще. Если скормить готовые ссылки в Google, то в этом случае он не выполняет ранжирование. Просто принял к сведению и всё. Когда Google сам сканирует сайт, он выполняет и ранжирование.

    P.P.S. И мне кажется, что для таких случаев с большим числом страниц и придуманы генераторы типа http://a1-sitemap-generator.com/

    И ещё, если у Вас 200'000 статей, то сайтмэпов должно быть 200 штук. Так как:

    Эту цитату я скопировал с Google.
     
  6. indian.rider

    indian.rider Постоялец

    Регистр.:
    20 окт 2008
    Сообщения:
    119
    Симпатии:
    26
    Спасибо за Ваши ответы. Я понимаю, что ничего не понимаю ;)

    нашел такой источник http://www.google.ru/support/news_pub/bin/topic.py?topic=11666

    А еще увидел в гугл 5 типов sitemap :nezn:

    Буду разбираться и делиться опытом.
     
  7. [/root.]

    [/root.] Он самый

    Регистр.:
    20 май 2006
    Сообщения:
    368
    Симпатии:
    58
    Не забываем про рекомендуемый лимит ссылок в каждом сайтмапе, следовательно решение должно создавать новые карты сайта при "заполнении" предыдущего.
     
  8. indian.rider

    indian.rider Постоялец

    Регистр.:
    20 окт 2008
    Сообщения:
    119
    Симпатии:
    26
    Нашел то, что карты сайта можно отдавать в в формате gzip.

    Я так понимаю, что нужно не GZIP вывод шаблонов использовать, а именно отдавать файлик в GZIP.

    На ум приходит сжимать указанные файлы по cron отдельным скриптом.

    Есть ли более изящные решения?
     
  9. budulay

    budulay

    Регистр.:
    8 апр 2006
    Сообщения:
    283
    Симпатии:
    87
    Самый нормальный вариант через сам ЕЕ - http://expressionengine.com/wiki/Google_Sitemaps/
     
  10. indian.rider

    indian.rider Постоялец

    Регистр.:
    20 окт 2008
    Сообщения:
    119
    Симпатии:
    26

    Хорошая статья. Я именно через шаблоны и решил выводить карту. Гибко и понятно.

    Решил отдавать гуглу только новости (за последние 3 дня). Остальное он и сам находит рано или поздно.

    С пингом только вопросик. Поскольку у меня новости "сами заходят" в БД, то экстенш для пинга для конкретной новсти смысл теряет.

    Думаю, по крону дергать пинг несколько раз в час.
     
Статус темы:
Закрыта.