Ищу Программа которая чистит базы?

Тема в разделе "Софт", создана пользователем zilon, 25 фев 2012.

  1. zilon

    zilon

    Регистр.:
    30 июл 2011
    Сообщения:
    370
    Симпатии:
    147
    Хотел узнать есть ли программа которая чистит базы?

    Например я в неё экспортирую несколько txt файликов она их в один собирает, удаляя дубли строк(как кейвосер). Потом определяет какой движок у сайта и сохраняет все урлы с одним движком в отдельные файлики с названиями движка (DLE, vbuletin,Invision Power Board...). А потом проверяет наличие ссылок в профилях, а также наличее nofollow, запрет в robots.txt чтоб ссылки были не через редирект и не через js...
     
  2. gothmog

    gothmog Постоялец

    Регистр.:
    18 июн 2011
    Сообщения:
    60
    Симпатии:
    24
    Насчет готовой не знаю, вряд ли есть. Но вот это:
    Лично я могу написать бесплатно на php\perl. Единственное, неясно как определять версию движка. Или брать просто - если на главной написано "powered by vbulletin", то определять как булку. Некоторые люди просто скрывают копирайт, и надо определять движок как-то иначе.
    Все остальное не знаю как сделать, ибо не спец в сео.
     
    zilon нравится это.
  3. zilon

    zilon

    Регистр.:
    30 июл 2011
    Сообщения:
    370
    Симпатии:
    147
    Очень круто будет если ты сделаешь такой софт :ay:

    Вот я написал немного о том как узнать, движок vBulletin, DLE или IPB

    vbulletin можно определить перейдя по такой ссылке

    http://forum.searchengines.ru/LICENSE

    http://www.seocafe.info/LICENSE

    если открывается файл и в title написано <title>vBulletin License Agreement</title>

    то 100% двиг - булка, но если его удалили то можно на страничку регистрации посмотреть например https://hacker-pro.net/register.php если она откроется до движок vBulletin

    Еще можно исходный код открыть и в теге head найти например <meta name="generator" content="vBulletin 3.8.4" />

    но его могут удалить так что лучше первыми двумя способами.

    Теперь как узнать DLE

    Можно отрыть rss ленту http://new-muzon.net/engine/rss.php если открылось то 99,9% что движок DLE но она долго открывается, лучше страничку авторизации открыть http://babada.ru/admin.php но адрес странички авторизации можно поменять через админку, поэтому надёжнее всего открыть файлик

    http://babada.ru/engine/ajax/registration.php

    и если написано: Имя пользователя не может быть пустым!

    то этот двиг 100% ДЛЕ

    Ещё как вариант можно в теге head найти

    <meta name="generator" content=" DataLife Engine Nulled by M.I.D-Team (http://www.mid-team.ws)" /> или <meta name="generator" content="DataLife Engine (http://dle-news.ru)" />

    и в самом низу после закрывающего тега html копирайт есть

    <!-- DataLife Engine Copyright SoftNews Media Group (http://dle-news.ru) -->

    но этого может и не быть поэтому надёжнее всего по этому файлику проверять http://babada.ru/engine/ajax/registration.php


    А Invision Power Board можно узнать по страничке авторизации она даже в старых версиях по этому урлу доступна

    http://moneymasterforum.ru/admin/index.php

    http://ipbskins.ru/forum/admin/index.php

    http://vladimir.bz/admin/index.php

    а в современных версиях Invision Power Board также можно искать файлики

    http://vladimir.bz/public/min/README.txt

    http://vladimir.bz/public/min/LICENSE.txt



    http://ipbskins.ru/forum/public/min/README.txt

    http://ipbskins.ru/forum/public/min/LICENSE.txt

    если они есть значит 100 % двиг IPB
     
  4. gothmog

    gothmog Постоялец

    Регистр.:
    18 июн 2011
    Сообщения:
    60
    Симпатии:
    24
    Спасибо, попробую на основе этого сделать мини-детектор.
     
    zilon нравится это.