Ищу robots.txt для Magento

Тема в разделе "Magento", создана пользователем Kodzhesyan, 26 окт 2017.

XEvil 4.0 Релиз Состоялся!
Метки:
Модераторы: artmouse, Violent
  1. Kodzhesyan

    Kodzhesyan Постоялец

    Регистр.:
    23 май 2015
    Сообщения:
    104
    Симпатии:
    62
    Камрады, поделитесь рабочими файлами robots.txt для Magento.
    Заранее всем благодарен.
     
  2. rawbony

    rawbony

    Регистр.:
    30 мар 2008
    Сообщения:
    172
    Симпатии:
    180
    Я такой пользую, время от времени что-то дописываю.

    User-agent: Googlebot-Image
    User-agent: YandexImages
    Allow: /media/catalog/product/

    # Crawlers Setup
    User-agent: *

    ## Don't crawl development files and folders
    Disallow: /*.svn$
    Disallow: /*.idea$
    Disallow: /*.sql$
    Disallow: /*.tgz$


    # Now come the rules: restrict robots from indexing the following pages:
    Disallow: /admin/
    Disallow: /app/
    Disallow: /downloader/
    Disallow: /errors/
    Disallow: /cgi-bin/
    Disallow: /includes/
    Disallow: /404/
    Disallow: /js/
    Disallow: /lib/
    Disallow: /pkginfo/
    Disallow: /shell/
    Disallow: /skin/
    Disallow: /var/
    Disallow: /pkginfo/
    Disallow: /report/
    Disallow: /scripts/
    Disallow: /stats/
    Disallow: /media/captcha/
    Disallow: /media/customer/
    Disallow: /media/dhl/
    Disallow: /media/downloadable/
    Disallow: /media/import/
    Disallow: /media/pdf/
    Disallow: /media/sales/
    Disallow: /media/tmp/
    Disallow: /media/wysiwyg/
    Disallow: /media/xmlconnect/

    # Paths (clean URLs)
    Disallow: /index.php/
    Disallow: /catalog/product_compare/
    Disallow: /catalog/product/gallery/
    Disallow: /catalog/category/view/
    Disallow: /catalog/product/view/
    Disallow: /catalogsearch/
    Disallow: /checkout/
    Disallow: /onestepcheckout/
    Disallow: /tag/
    Disallow: /poll/
    Disallow: /control/
    Disallow: /contacts/
    Disallow: /customer/
    Disallow: /customer/account/
    Disallow: /customer/account/login/
    Disallow: /customer/
    Disallow: /customize/
    Disallow: /newsletter/
    Disallow: /review/
    Disallow: /sendfriend/
    Disallow: /wishlist/
    Disallow: /*?manufacturer*
    Disallow: /sales/guest/form
    Disallow: /*reviews/*
    Disallow: /*brand/*
    Disallow: /dostavka-oplata

    # Files
    Disallow: /cron.php
    Disallow: /cron.sh
    Disallow: /error_log
    Disallow: /install.php
    Disallow: /LICENSE.html
    Disallow: /LICENSE.txt
    Disallow: /LICENSE_AFL.txt
    Disallow: /api.php
    Disallow: /get.php
    Disallow: /mage
    Disallow: /RELEASE_NOTES.txt

    # Paths (no clean URLs)
    Disallow: /*.php$
    Disallow: /*?p=*&
    Disallow: /*?SID=
    Disallow: /*?dir*
    Disallow: /*?dir=desc
    Disallow: /*?dir=asc
    Disallow: /*?limit=all
    Disallow: /*?mode*
    Disallow: /*?price*
    Disallow: /*?ser*
    Disallow: /*?prof_klin*
    Disallow: /*?cat*

    Host:
    Sitemap:
     
    Kodzhesyan нравится это.
  3. Shur79

    Shur79 Писатель

    Регистр.:
    1 июл 2011
    Сообщения:
    5
    Симпатии:
    0
    Я бы еще добавил к предыдущему ответу блокировку спам роботов:

    # Begin block Bad-Robots from robots.txt
    User-agent: asterias
    Disallow:/
    User-agent: BackDoorBot/1.0
    Disallow:/
    User-agent: Black Hole
    Disallow:/
    User-agent: BlowFish/1.0
    Disallow:/
    User-agent: BotALot
    Disallow:/
    User-agent: BuiltBotTough
    Disallow:/
    User-agent: Bullseye/1.0
    Disallow:/
    User-agent: BunnySlippers
    Disallow:/
    User-agent: Cegbfeieh
    Disallow:/
    User-agent: CheeseBot
    Disallow:/
    User-agent: CherryPicker
    Disallow:/
    User-agent: CherryPickerElite/1.0
    Disallow:/
    User-agent: CherryPickerSE/1.0
    Disallow:/
    User-agent: CopyRightCheck
    Disallow:/
    User-agent: cosmos
    Disallow:/
    User-agent: Crescent
    Disallow:/
    User-agent: Crescent Internet ToolPak HTTP OLE Control v.1.0
    Disallow:/
    User-agent: DittoSpyder
    Disallow:/
    User-agent: EmailCollector
    Disallow:/
    User-agent: EmailSiphon
    Disallow:/
    User-agent: EmailWolf
    Disallow:/
    User-agent: EroCrawler
    Disallow:/
    User-agent: ExtractorPro
    Disallow:/
    User-agent: Foobot
    Disallow:/
    User-agent: Harvest/1.5
    Disallow:/
    User-agent: hloader
    Disallow:/
    User-agent: httplib
    Disallow:/
    User-agent: humanlinks
    Disallow:/
    User-agent: ia_archiver
    Disallow:/
    User-agent: InfoNaviRobot
    Disallow:/
    User-agent: JennyBot
    Disallow:/
    User-agent: Kenjin Spider
    Disallow:/
    User-agent: Keyword Density/0.9
    Disallow:/
    User-agent: LexiBot
    Disallow:/
    User-agent: libWeb/clsHTTP
    Disallow:/
    User-agent: LinkextractorPro
    Disallow:/
    User-agent: LinkScan/8.1a Unix
    Disallow:/
    User-agent: LinkWalker
    Disallow:/
    User-agent: LNSpiderguy
    Disallow:/
    User-agent: lwp-trivial
    Disallow:/
    User-agent: lwp-trivial/1.34
    Disallow:/
    User-agent: Mata Hari
    Disallow:/
    User-agent: Microsoft URL Control - 5.01.4511
    Disallow:/
    User-agent: Microsoft URL Control - 6.00.8169
    Disallow:/
    User-agent: MIIxpc
    Disallow:/
    User-agent: MIIxpc/4.2
    Disallow:/
    User-agent: Mister PiX
    Disallow:/
    User-agent: moget
    Disallow:/
    User-agent: moget/2.1
    Disallow:/
    User-agent: mozilla/4
    Disallow:/
    User-agent: Mozilla/4.0 (compatible; BullsEye; Windows 95)
    Disallow:/
    User-agent: Mozilla/4.0 (compatible; MSIE 4.0; Windows 95)
    Disallow:/
    User-agent: Mozilla/4.0 (compatible; MSIE 4.0; Windows 98)
    Disallow:/
    User-agent: Mozilla/4.0 (compatible; MSIE 4.0; Windows NT)
    Disallow:/
    User-agent: Mozilla/4.0 (compatible; MSIE 4.0; Windows XP)
    Disallow:/
    User-agent: Mozilla/4.0 (compatible; MSIE 4.0; Windows 2000)
    Disallow:/
    User-agent: Mozilla/4.0 (compatible; MSIE 4.0; Windows ME)
    Disallow:/
    User-agent: mozilla/5
    Disallow:/
    User-agent: NetAnts
    Disallow:/
    User-agent: NICErsPRO
    Disallow:/
    User-agent: Offline Explorer
    Disallow:/
    User-agent: Openfind
    Disallow:/
    User-agent: Openfind data gathere
    Disallow:/
    User-agent: ProPowerBot/2.14
    Disallow:/
    User-agent: ProWebWalker
    Disallow:/
    User-agent: QueryN Metasearch
    Disallow:/
    User-agent: RepoMonkey
    Disallow:/
    User-agent: RepoMonkey Bait & Tackle/v1.01
    Disallow:/
    User-agent: RMA
    Disallow:/
    User-agent: SiteSnagger
    Disallow:/
    User-agent: SpankBot
    Disallow:/
    User-agent: spanner
    Disallow:/
    User-agent: suzuran
    Disallow:/
    User-agent: Szukacz/1.4
    Disallow:/
    User-agent: Teleport
    Disallow:/
    User-agent: TeleportPro
    Disallow:/
    User-agent: Telesoft
    Disallow:/
    User-agent: The Intraformant
    Disallow:/
    User-agent: TheNomad
    Disallow:/
    User-agent: TightTwatBot
    Disallow:/
    User-agent: Titan
    Disallow:/
    User-agent: toCrawl/UrlDispatcher
    Disallow:/
    User-agent: True_Robot
    Disallow:/
    User-agent: True_Robot/1.0
    Disallow:/
    User-agent: turingos
    Disallow:/
    User-agent: URLy Warning
    Disallow:/
    User-agent: VCI
    Disallow:/
    User-agent: VCI WebViewer VCI WebViewer Win32
    Disallow:/
    User-agent: Web Image Collector
    Disallow:/
    User-agent: WebAuto
    Disallow:/
    User-agent: WebBandit
    Disallow:/
    User-agent: WebBandit/3.50
    Disallow:/
    User-agent: WebCopier
    Disallow:/
    User-agent: WebEnhancer
    Disallow:/
    User-agent: WebmasterWorldForumBot
    Disallow:/
    User-agent: WebSauger
    Disallow:/
    User-agent: Website Quester
    Disallow:/
    User-agent: Webster Pro
    Disallow:/
    User-agent: WebStripper
    Disallow:/
    User-agent: WebZip
    Disallow:/
    User-agent: WebZip/4.0
    Disallow:/
    User-agent: Wget
    Disallow:/
    User-agent: Wget/1.5.3
    Disallow:/
    User-agent: Wget/1.6
    Disallow:/
    User-agent: WWW-Collector-E
    Disallow:/
    User-agent: Xenu's
    Disallow:/
    User-agent: Xenu's Link Sleuth 1.1c
    Disallow:/
    User-agent: Yandex
    Disallow:/
    User-agent: Zeus
    Disallow:/
    User-agent: Zeus 32297 Webster Pro V2.9 Win32
    Disallow:/

    # SEO-related bots
    User-agent: rogerbot
    Disallow:/
    User-agent: mj12bot
    Disallow:/
    User-agent: dotbot
    Disallow:/
    User-agent: ahrefsbot
    Disallow:/
     
  4. rawbony

    rawbony

    Регистр.:
    30 мар 2008
    Сообщения:
    172
    Симпатии:
    180
    Толку от этого 0.
    Эти боты плют на все запреты в роботс. Их банить только
     
  5. shadowrun

    shadowrun

    Регистр.:
    13 июл 2011
    Сообщения:
    203
    Симпатии:
    132
    robots.txt - это не запрет или разрешение, а рекомендация.
     
    Sahh нравится это.
  6. Sahh

    Sahh

    Регистр.:
    5 апр 2014
    Сообщения:
    169
    Симпатии:
    131
    Disallow: /admin/
    Никогда не делайте так!
    В magento при инсталляции специально заедается путь к админке что бы его сложнее было найти, а в этом случае вы показываете где админка для брутфорса.

    Disallow: /review/
    А зачем запрет индексирования отзывов это же самое лучшее seo?
     
    Последнее редактирование: 21 ноя 2017
  7. masterdio

    masterdio Создатель

    Регистр.:
    25 авг 2013
    Сообщения:
    27
    Симпатии:
    6
    Вы не указали какая именно версия 1 или 2 так как есть разница в рекомендациях.
    Для 2 я недавно наткнулся вот на этот список

    User-agent: *
    # Directories
    Disallow: /app/
    Disallow: /bin/
    Disallow: /dev/
    Disallow: /lib/
    Disallow: /phpserver/
    Disallow: /pkginfo/
    Disallow: /report/
    Disallow: /setup/
    Disallow: /update/
    Disallow: /var/
    Disallow: /vendor/
    # Paths (clean URLs)
    Disallow: /index.php/
    Disallow: /catalog/product_compare/
    Disallow: /catalog/category/view/
    Disallow: /catalog/product/view/
    Disallow: /catalogsearch/
    Disallow: /checkout/
    Disallow: /control/
    Disallow: /contacts/
    Disallow: /customer/
    Disallow: /customize/
    Disallow: /newsletter/
    Disallow: /review/
    Disallow: /sendfriend/
    Disallow: /wishlist/
    # Files
    Disallow: /composer.json
    Disallow: /composer.lock
    Disallow: /CONTRIBUTING.md
    Disallow: /CONTRIBUTOR_LICENSE_AGREEMENT.html
    Disallow: /COPYING.txt
    Disallow: /Gruntfile.js
    Disallow: /LICENSE.txt
    Disallow: /LICENSE_AFL.txt
    Disallow: /nginx.conf.sample
    Disallow: /package.json
    Disallow: /php.ini.sample
    Disallow: /RELEASE_NOTES.txt
    # Do not index pages that are sorted or filtered.
    Disallow: /*?*product_list_mode=
    Disallow: /*?*product_list_order=
    Disallow: /*?*product_list_limit=
    Disallow: /*?*product_list_dir=
    # Do not index session ID
    Disallow: /*?SID=
    Disallow: /*?
    Disallow: /*.php$
    # CVS, SVN directory and dump files
    Disallow: /*.CVS
    Disallow: /*.Zip$
    Disallow: /*.Svn$
    Disallow: /*.Idea$
    Disallow: /*.Sql$
    Disallow: /*.Tgz$
     
  8. rawbony

    rawbony

    Регистр.:
    30 мар 2008
    Сообщения:
    172
    Симпатии:
    180
    На счет админки согласен.
    По поводу отзывов - зачем они нужны на отдельной странице? Они прекрасно индексируются на карточке товара, а если не будет запрета - то будет дубль.
     
  9. Sahh

    Sahh

    Регистр.:
    5 апр 2014
    Сообщения:
    169
    Симпатии:
    131
    Для мадженты 2 есть отдельная ветка
    <-------------- добавлено через 160 сек. -------------->
    В большинстве тем отзывы по умолчанию не видны (Css display none) значит Гугл не будет их индексировать
     
  10. rawbony

    rawbony

    Регистр.:
    30 мар 2008
    Сообщения:
    172
    Симпатии:
    180
    Сколько разных тем смотрел, всегда нормально отзывы индексируются.
    А отдельный вынос старинцы с отзывом - это реально плохо.