критерии бана по плагиату

lena berkova · 22 Янв 2009

текст должен быть уникален вплоть до предложений из пары строк? по какой длине строк в среднем можно определить неуникальность?

SEOKinG · 22 Янв 2009

lena berkova написал(а):
текст должен быть уникален вплоть до предложений из пары строк? по какой длине строк в среднем можно определить неуникальность?

проверить уникальность, предложений, абзацев, не важно чего, можно программой

Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.

Rocknrostov · 22 Янв 2009

Вопрос по теме. Если я выложу текст на сайте 1, который уже есть на сайте 2, а через некоторое время сайт 2 удалит этот текст, то мой текст сайта 1 будет уникальным?

IgVan · 22 Янв 2009

С неуникальным контентом ты не будешь забанен. Ты попадешь в supplemental results (как видно из последних результатов выдачи, термин пропал, но суть осталась). Это "наказание за неуникальный контент", твой сайт может попасть в выдачу но только в том случае если гуглю больше нечего будет туда ставить.
Если текст на сайте-источнике пропадет, то думаю, через какое-то время ты вылезешь из соплей. Если конечно, только на двух сайтах использовался этот уникальный текст.

joefast · 22 Янв 2009

lena berkova написал(а):
текст должен быть уникален вплоть до предложений из пары строк? по какой длине строк в среднем можно определить неуникальность?

Алгоритм шинглов (которым так любят пугать оптимизаторов) учитывает каждое 9-ое слово - вот и считайте.

За неуникальный контент можно получить бан, если этого контента слишком много.

eshka · 22 Янв 2009

Много слышал рассуждений по этому поводу. Приведу теперь свое. Яндекс считает уникальной ту статью, которая раньше появилась в Сети (читай проиндексировалась его роботом) - с этим кстати связано некая тема, када пацаны начинают воровать старый контент на крупных новостных порталах, который уже давно выпал из индекса. Ну а Google смотрит на рейтинг - чем выше рейтинг - тот и прав, т.е. если с сайта с PR3 возьмут статью на сайт с PR5, то первоисточником будет второй сайт.

lena berkova · 22 Янв 2009

joefast написал(а):
Алгоритм шинглов (которым так любят пугать оптимизаторов) учитывает каждое 9-ое слово - вот и считайте.

За неуникальный контент можно получить бан, если этого контента слишком много.

как понять каждое 9 слово? т.е. если оно повторяется то значит плагиат?

joefast · 22 Янв 2009

Сорри, невнятно выразился:
1) берем 9 слов
2) рассчитываем для них хеш
3) если текст не закончился берем еще 9 слов (причем частично эти слова накладываются)
таким образом получаем хеш страницы. Если рассматриваемая страница имеет совпадения хеша с какой-либо страницей из базы - найден дубль.

В Яндексе, вроде, для каждых 9 хешей рассчитывают суперхеш и сравнивают уже его.

Т.е. для того, чтобы бороться с алгоритмом шинглов нужно менять минимум одно слово из 9.

Jacob · 22 Янв 2009

IgVan написал(а):
С неуникальным контентом ты не будешь забанен. Ты попадешь в supplemental results (как видно из последних результатов выдачи, термин пропал, но суть осталась). Это "наказание за неуникальный контент", твой сайт может попасть в выдачу но только в том случае если гуглю больше нечего будет туда ставить.
Если текст на сайте-источнике пропадет, то думаю, через какое-то время ты вылезешь из соплей. Если конечно, только на двух сайтах использовался этот уникальный текст.

абсолютно мимо. саплементал с уникальностью контента имеет мало общего. поставить жирных ссылок и неуник мигом выйдет из соплей, и наоборот сделать 10к уникальных страниц и без ссылок свалится в сопли как милые

betalik · 24 Янв 2009

узайте ShinglesExpert для сверки статей, считаю где-то 5-10% схожести нормой, яша хавает на ура

критерии бана по плагиату

lena berkova

Местный житель

SEOKinG

Гуру форума

Rocknrostov

Полезный

IgVan

Гуру форума

joefast

Гуру форума

eshka

Создатель

lena berkova

Местный житель

joefast

Гуру форума

Jacob

Местный житель

betalik

Участник