Размещение доров на платном хостинге или как банит Google IPшники

Статус
В этой теме нельзя размещать новые ответы.
насколько сильно зависит индексация от выбронного хостера, именно платного (бесплатных не рассматриваем). По идеи есть такиеже трастовые и выбирать стоит уже устоявшихся на рынке услуг, или как ?

Индексация от конкретного хостера особо не зависит, но зависит от сайтов, которые хостятся на одном с тобой IP-шнике. По моим наблюдениям, чем больше пиаристых сайтов на твоем IP тем быстрее проходит первоначальная проверка перед заходом бота, однако не советую сразу же вешать дор на основной домен, индексации может и вообще не быть, тем более если используются разного рода хитрые редиректы, попапы, ифреймы. Желательно на основной домен сначала повесить белый сайтец, хотя бы с несколькими страницами, дождаться его индексации, а затем можно и доры вешать. Исходя из моего предыдущего поста, необходимость новых доменов практически отпадает, т.к боты все равно видят основной домен и папки с дорами на нем, поэтому можно просто вешать доры в папках в виде Для просмотра ссылки Войди или Зарегистрируйся или делать поддомены к основному домену. После бана домена необходимо удалить все папки из public_html, и написать хостеру чтоб поменял основной домен, а можно и просто открыть новый аккаунт, а на этот забить.
 
После дополнительного анализа логов забаненного аккаунта продолжаю тему.
Исходя из анализа логов смею утверждать, что google использует сервис Для просмотра ссылки Войди или Зарегистрируйся IP 208.80.194.36, а точнее их так называемый Websense Web Security Gateway. Данный вывод сделан при анализе логов до бана доров и после. Бан доров происходил именно после захода данного бота, далее, после бана , при прикреплении другого домена и проспама первоначально приходил именно этот бот.
Зайдя на сайт данной конторы я нашел очень много интересного для себя, в частности то, что их сервис использует свой супер оригинальный алгоритм фильтрации и распознавания текста, данных, а также всего прочего, особенно вирусов, эксплойтов и т.д. Вот интересные выдержки с их сайта:
(Through a multi-vector traffic scanning engine, the Websense Web Security Gateway analyzes Web traffic in real-time, instantly categorizing new sites and dynamic content, discovering security risks, and blocking dangerous malware) Перевод:
Через мультивекторный сканирующий движок, Websense Web Gateway анализирует веб-трафик в режиме реального времени, мгновенно классифицируя новые сайты и динамическое содержание, выявляя риски для безопасности, а также блокирует опасное содержимое.
Вот еще оттуда-
(Leverages content classification and data identification with binary,
lexical and statistical analysis along with heuristics, image recognition,
machine learning, pattern detection, natural language processing and data fingerprinting
) Превод: Производит классификацию контента и идентификацию данных как бинарным, лексическим так и статистическим и эвристичеким анализом, распознавание изображений, машино обучаемое распознавание паттернов и отпечатков данных.
(Uses more than 50 million real-time data collecting systems parsing
through one billion pieces of content daily) Перевод: Использует более чем 50 млн. систем парсинга данных в реальном масштабе времени,
через один биллион единиц контента ежедневно.
(Assigns more than 2 million domains, networks, IPs and hosts with
reputations every hour) Каждый час определение 2 миллионов доменов, сетей, IP шников и хостов с репутацией.
Вот один из их сервисов
PreciseIDTM Technology
(PreciseID technology provides accurate identification and classification of content in more than 370 different file types and formats- from source code binaries to CAD drawings to Verilog code, and beyond- even if that content is cut and pasted from one format to another.)
Перевод:
PreciseID технология обеспечивает точное определение и классификацию контента в более чем 370 различных типов файлов и форматов: от исходного кода бинарников до CAD чертежей и Verilog-кодов, и в последующем , даже если этот контент вырезать и вставлять из одного формата в другой.
А вот и анализ контента доров и связь с google-
( PreciseID technology uses multiple detection methods to help organizations discover organizational compliance risk and automatically enforce content use policies, including:
-Fingerprinting technology
-Natural Language Processing NEW
-Rules
-Lexicons
-Dictionaries
-Exact and partial matching
-Statistical analysis )
Перевод:
PreciseID технология использует несколько методов обнаружения, чтобы помочь организациям обнаруживать организационные риски и автоматически применять политики использования содержимого, в том числе:
-технологии Отпечатков (математическая репрезентация группы характеров, слов, предложений и полей данных в документе)
-Обработка натурального языка
-Правила
-Лексикон
-Словари
-Точные и частичное соответствие
-Статистический анализ

Дальше я не буду расписывать, думаю, что и так все понятно.
Правда там еще упоминается о ,так называемых, ихних "виртуальных пользователях ", которые просматривают страницы для выявления всяких гадостей ( Это по вопросам различного рода редиректов:D)
Исходя из вышеперечисленного можно сделать вывод, что google активно стал использовать сторонние наработки в области анализа содержания.
 
Вопрос может не новый ,но не нашёл ответа,сколька можна держать доров без белых сайтов,на одном ip шнике ,если ip из нормальной подсети взлетает в индекс на ура...Хотелось бы узнать из опыта примерное количество..если на своих доменах к примеру пять доменов и к каждому 10 папок или поддоменов вообщем варианты..Когда ip начинает опускаться в выдаче или потихоньку в фильтры,или всё таки подсеть играет роль на пс...И ещё вопр например отдельная впс как то могут днс попадать у пс в фильтр..
 
сколька можна держать доров без белых сайтов,на одном ip шнике ,если ip из нормальной подсети взлетает в индекс на ура.
Пока взлетает в индекс- клепай сколько сможешь,и чем быстрее -тем лучше. Если на одном ip будут только доры, тем более генеренные одним доргеном, особенно DMII - то бан ip обеспечен.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху