критерии бана по плагиату

Статус
В этой теме нельзя размещать новые ответы.

lena berkova

Местный житель
Регистрация
14 Янв 2009
Сообщения
437
Реакции
21
текст должен быть уникален вплоть до предложений из пары строк? по какой длине строк в среднем можно определить неуникальность?
 
текст должен быть уникален вплоть до предложений из пары строк? по какой длине строк в среднем можно определить неуникальность?
проверить уникальность, предложений, абзацев, не важно чего, можно программой
 
Вопрос по теме. Если я выложу текст на сайте 1, который уже есть на сайте 2, а через некоторое время сайт 2 удалит этот текст, то мой текст сайта 1 будет уникальным?
 
С неуникальным контентом ты не будешь забанен. Ты попадешь в supplemental results (как видно из последних результатов выдачи, термин пропал, но суть осталась). Это "наказание за неуникальный контент", твой сайт может попасть в выдачу но только в том случае если гуглю больше нечего будет туда ставить.
Если текст на сайте-источнике пропадет, то думаю, через какое-то время ты вылезешь из соплей. Если конечно, только на двух сайтах использовался этот уникальный текст.
 
  • Заблокирован
  • #5
текст должен быть уникален вплоть до предложений из пары строк? по какой длине строк в среднем можно определить неуникальность?

Алгоритм шинглов (которым так любят пугать оптимизаторов) учитывает каждое 9-ое слово - вот и считайте.

За неуникальный контент можно получить бан, если этого контента слишком много.
 
Много слышал рассуждений по этому поводу. Приведу теперь свое. Яндекс считает уникальной ту статью, которая раньше появилась в Сети (читай проиндексировалась его роботом) - с этим кстати связано некая тема, када пацаны начинают воровать старый контент на крупных новостных порталах, который уже давно выпал из индекса. Ну а Google смотрит на рейтинг - чем выше рейтинг - тот и прав, т.е. если с сайта с PR3 возьмут статью на сайт с PR5, то первоисточником будет второй сайт.
 
Алгоритм шинглов (которым так любят пугать оптимизаторов) учитывает каждое 9-ое слово - вот и считайте.

За неуникальный контент можно получить бан, если этого контента слишком много.

как понять каждое 9 слово? т.е. если оно повторяется то значит плагиат?
 
  • Заблокирован
  • #8
Сорри, невнятно выразился:
1) берем 9 слов
2) рассчитываем для них хеш
3) если текст не закончился берем еще 9 слов (причем частично эти слова накладываются)
таким образом получаем хеш страницы. Если рассматриваемая страница имеет совпадения хеша с какой-либо страницей из базы - найден дубль.

В Яндексе, вроде, для каждых 9 хешей рассчитывают суперхеш и сравнивают уже его.

Т.е. для того, чтобы бороться с алгоритмом шинглов нужно менять минимум одно слово из 9.
 
С неуникальным контентом ты не будешь забанен. Ты попадешь в supplemental results (как видно из последних результатов выдачи, термин пропал, но суть осталась). Это "наказание за неуникальный контент", твой сайт может попасть в выдачу но только в том случае если гуглю больше нечего будет туда ставить.
Если текст на сайте-источнике пропадет, то думаю, через какое-то время ты вылезешь из соплей. Если конечно, только на двух сайтах использовался этот уникальный текст.


абсолютно мимо. саплементал с уникальностью контента имеет мало общего. поставить жирных ссылок и неуник мигом выйдет из соплей, и наоборот сделать 10к уникальных страниц и без ссылок свалится в сопли как милые :D
 
узайте ShinglesExpert для сверки статей, считаю где-то 5-10% схожести нормой, яша хавает на ура
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху