[На русском] Википедия бэки с нее и кирилица

Тема в разделе "Материалы по SEO", создана пользователем onnegrio, 13 авг 2010.

Статус темы:
Закрыта.
  1. onnegrio

    onnegrio

    Регистр.:
    15 янв 2010
    Сообщения:
    263
    Симпатии:
    86
    Намного предыстории. На сайт имеются вхождения с википедии. Много. Но некоторые ссылки ошибочны и имеют вид
    site.com/res/report.htmlКИРИЛИЦА
    собственно путь до report.html правильный. но прилепленное КИРИЛИЦА обрабатывается как 404.
    Обидно терять такие бэки.
    Терь вопросы:
    1 Как создать на сайте под такие линки страницы report.htmlКИРИЛИЦА
    1,1 может можно как извратиться чтоб report.htmlКИРИЛИЦА и report.html это были разные файлы.
    1,2 если возможно 1,1 то как перенаправить с "кривого дубля" на report.html
    2 чем обработать "кракозябры" и как они правильно называются http://ru.wikipedia.org/wiki/Кирилица аля
    http://ru.wikipedia.org/wiki/КИРИЛИЦА
    то что браузер видит по русски /КИРИЛИЦА/ а через буфер в блокнот отдает /%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%B8%D1%86%D0%B0/ есть какие инструменты для преобразования.
    3 не проще ли будет влезть в википедию и поправить ссылки.
    4 вообще интересует принцип работы с wikipedia.org. что там надо. профиль? репу? что?
     
  2. bork75

    bork75 Д☼брая собака )

    Регистр.:
    21 июн 2008
    Сообщения:
    1.449
    Симпатии:
    716
    Посмотри в логах сервера, в каком виде приходят обращения и потом под них пиши регулярное выражение редиректа в htaccess.

    о что ты видишь в адресной строке и то что приходит на сервер - разные вещи при использовании кириллицы. Браузер ее может отослать в разных кодировках. Как правило, кириллические ссылки каверкует Opera
     
  3. kirillka

    kirillka

    Регистр.:
    2 дек 2006
    Сообщения:
    151
    Симпатии:
    6
    Кстати, обратил внимание, что в русскоязычной википедии внешние ссылки загнали в nofollow :(
     
  4. Agler

    Agler Постоялец

    Регистр.:
    17 авг 2008
    Сообщения:
    94
    Симпатии:
    13
    там все ссылки в nofollow. А то что ты видишь иногда %24 и т.д это hex коды русских букв. В utf-8 русская буква занимает два байта (так называемые многобайтные кодировки)
    в итоге одна русская буква это два %32%48 и т.д
     
  5. onnegrio

    onnegrio

    Регистр.:
    15 янв 2010
    Сообщения:
    263
    Симпатии:
    86
    оно конечно верно что правильно сформулированный вопрос 90% успеха.
    только хз как его по другому:). так как
    1 КИРИЛИЦА ->> %32%48 и т.д - чем переконвертить туда/сюда.
    2 может он и в nofollow не проверял. но с него идет живой траф
    и еще идет траф обрабатываемый как 404 поскольку ссылка с вики имеет вид site.com/res/report.htmlКИРИЛИЦА (именно так .htmlКИРИЛИЦА а не .html%32%48)
    поскольку таких ссылок единичные случаи как их принять на сайте чтоб открыло site.com/res/report.html
     
Статус темы:
Закрыта.