[Ищу] Нужно решение, которое может показать популярность сабов

Тема в разделе "SEO Скрипты", создана пользователем vestal, 21 янв 2009.

Статус темы:
Закрыта.
  1. vestal

    vestal

    Регистр.:
    3 ноя 2007
    Сообщения:
    172
    Симпатии:
    55
    Есть база ссылок, где много повторных доменов и сабдоменов, нужно такое решение, чтобы можно было отделить домены от сабдоменов и показать наиболее популярные (например таких то сабдоменов - 100, а таких то 55 и тд), такое ощущение, что я такое решение где то видела, но забыла где, может кто нибудь знает что можно применить, может это даже в экселе можно сделать, но как?
     
  2. Serg78

    Serg78

    Регистр.:
    18 ноя 2006
    Сообщения:
    191
    Симпатии:
    61
    Можно намутить в TextPipe такое, используя регулярки.
    Допустим обрезать урл до / (удалив предварительно http://

    Потом заюзать фильтр, который посчитает дубликаты "Count duplicate lines"-

    Потом сортировать по первым 4м (прикинь, сколькизначные цифры получились и поставь соответственно) цифрам,по убыванию

    В итоге у тебя на выходе будет лист с количеством повторов и сабдоменов.




    Также была какая-то софтина от на блоге Как-Так, которая обрезала до сабов.
    http://kak-tak.com/content/getdomains-v20-poluchenie-chistykh-sabdomenovdomenov-iz-adresov
     
    vestal нравится это.
  3. vestal

    vestal

    Регистр.:
    3 ноя 2007
    Сообщения:
    172
    Симпатии:
    55
    Serg78 спасибо тебе огромное, твоя метода работает! На будущее, если кто захочет отделить домены от сабдоменов, или отфильтровать домены, то есть простой способ. С помощью этой тулзы, что предложил Serg7 обрезаем сперва до сабов (получаем текстовый файл 1), затем исходный файл обрезаем до доменов (получаем файл 2), потом хрумом (инструменты - фильтр базы ссылок) ну или ещё чем вычитаем из базы 1 базу 2 и получаем чистый список сабов, потом опять обрезаем до доменов, ну а дальше, как Serg78 сказал сортируем по убыванию (чтобы повторы шли рядом, я так поняла иначе текстпайп не посчитает повторы) и текстпайпом считаем дубликаты и им же сортируем по числам и на выходе получаем самые популярные сабы:)
     
Статус темы:
Закрыта.