Генерация текста

Тема в разделе "Вопросы новичков", создана пользователем Softrix, 3 фев 2010.

Статус темы:
Закрыта.
  1. Softrix

    Softrix Постоялец

    Регистр.:
    9 июл 2008
    Сообщения:
    65
    Симпатии:
    4
    Народ что думаете, по поводу принципа генерации текста для доров?

    Я сейчас делаю синонимайз, но что-то не важно заходят, делал просто мешанину, доры заходили, но тоже не супер. Сейчас еще пробую просто не измененный текст, с ключами, пока еще не понятно, что будет!
    Какой принцип генерации более удачный, кто что думает?
     
  2. rec801

    rec801 Постоялец

    Регистр.:
    19 май 2009
    Сообщения:
    81
    Симпатии:
    3
    Softrix, таких тем на форуме знаешь сколько?.. короче или пиши конкретно что и как у тебя делается + результаты по индексации и какие пути видишь дальнейшего улучшения или вообще не пиши..
    нужны исследования. много тестов. теперь яшка еще и синтаксис предложений будет учитывать http://www.cognitive.ru/about/news/2010/4.htm.
    хоть, думаю и раньше его учитывал.. но теперь будет все серьезнее. надо работать над новыми генераторами текста (синтаксически и семанитически верными) + необходима семанитическая связь между предложениями (в пределах абзаца) - что бы текст получался как бы об одном и том же. Жаль что тех кто шарит в этом не занимают такие мелочи как "доры"..
     
  3. venetu

    venetu

    Регистр.:
    28 мар 2007
    Сообщения:
    735
    Симпатии:
    261
    Сейчас тоже. Тебе ж не просто в индекс попасть надо, нужен трафик с поисковиков. А на дубли траф не шлют, шлют на первоисточник.

    Ну и плюс - копипаст в индекс загоняется оччень медленно, если даже и загоняется. А для дора каждая минута дорога. Так что уник и только уник!
     
  4. betatest

    betatest

    Регистр.:
    3 дек 2007
    Сообщения:
    517
    Симпатии:
    127
    для гугла вообще пох, там совершенно другие факторы играют роль, достаточно несколько доров по ВЧ в топе посмотреть и всё понятно станет
    хоть в столбик, хоть синонимайз, хоть человеческий уник - все одинаково встают, одинаково вылетают

    раньше использовал генерацию - сейчас вообще отключил нафиг её - берем текст и набиваем ключами - и всё, дор есть дор
     
  5. Softrix

    Softrix Постоялец

    Регистр.:
    9 июл 2008
    Сообщения:
    65
    Симпатии:
    4
    rec801:
    Если по конкретнее, то пробовал синонимизировать предложения, без упора на смысл, но с соблюдением морфологии т.е. глаголы заменять глаголами, существительные существительными, прилагательные прилагательными и т.п. Сделал сотни 3 таких доров, результат не фонтан, отвалилось сразу после первого апа процентов 60, у остальных заходили морды или пара страниц, со след апа отвалилось еще столькоже в итоге остается в ПС у фришек процентов 10, у рушек процентов 30, траф так себе.
    Хотя казалось бы идея не плоха... :(



    Я в принципе новичок в этом, может другие какие факторы не учел, кеи вроде норм, сам собирал или с чужих доров брал. Шаблоны разные пробовал. Видно идея шлак :)
     
  6. SergeiSP

    SergeiSP

    Регистр.:
    13 фев 2007
    Сообщения:
    375
    Симпатии:
    115
    Лучше не заниматься офтопом. Напарсить текст - в сапе давно был, если нет, то зайди и посмотри, там любителей тысячи были, кто напарсил с яндекс маркета и прочее и где они сейчас - под АГС как минимум. Для сателит то же уник рулит, причем там более актуально.
    Дор - это другое и сравнивать смысла нет и цели другие. Под яшу доры лезут туго, вылетают зато быстро. Аля генерированный текст рулит как говорится...
    В гугле все проще в этом плане, там фильтров для рунета и нет как таковых. Потому и бардак, кто играется со спамом, линковкой, перекачкой веса, те и в топе, причем дор не дор, висят долго без проблем. Если хорошо загнать то год провесит, так у меня было, пока срок доменов не истек.
    Сейчас под яшу в паблике по крайней мере надежного решения нет, как я понял. Под гугл, все стабильно, просто немного спамить надо иначе, чем, например год назад, но в целом, как лезло, так и лезет с любым текстом.
     
  7. rec801

    rec801 Постоялец

    Регистр.:
    19 май 2009
    Сообщения:
    81
    Симпатии:
    3
    именно
    не прокатывает такое.
    1. нарушается т.н. "частотность" текста (усредненные показатели для по частоте встречающихся слов и словосочетаний)
    2. вставка ключей. как реализована?
    3. все больше склоняюсь к мнению, что яшка анализирует структуру контента странички (пристально и это есть ИМХО решающий фактор в вынесении приговора, при более-менее нормальном тексте) - т.е. чем замысловатее структура - тем лучше. много картинок итд - положительно влияют. расположение текстовых блоков на странице, структура ссылок (например, не просто ключи, а целые предложения с ключом), налядная навигация (аля "хлебные крошки")... если подумать можно много чего сюда еще добавить. одним словом - надо тестить.
    зы. на разработку генератора уйдет много времени. это есть в планах - но пока не могу посвятить все внимание именно этому.
     
  8. SergeiSP

    SergeiSP

    Регистр.:
    13 фев 2007
    Сообщения:
    375
    Симпатии:
    115
    Дело не в этом, влазит и машинный текст, суть в другом, что после индексации через некоторое время, аппа так через два сайт начинает проверять уже другой бот, который анализирует контент и выносит доры. Почему доры в яше долго не живут, конечно есть и другие показатели, но основное палево - контент.
     
  9. karapet

    karapet

    Регистр.:
    9 сен 2008
    Сообщения:
    168
    Симпатии:
    104
    Сидел писал генератор 3 дня:) Вообщем выдает такой текст:
    Мой прошлый эксперемент с child-birth.narod.ru показал что яша или очень любит свой narod.ru, либо все же хреново определяет плохой контент. Во всяком случае в индексе уже около двух месяцев 220 страниц из залитых 257. Сейчас вот буду генерить на вышепреведенном. Посмотрим что получится. Попозжа отпишусь о результатах.
     
  10. Softrix

    Softrix Постоялец

    Регистр.:
    9 июл 2008
    Сообщения:
    65
    Симпатии:
    4

    А где ссыль на партнерку ? Если ее нет, то эксперемент не слишком показательный, нужно тестить со ссылкой. Да, и какой траф дает данный дор? Чет есть подозрения что ни какого, учитывая достаточно не большое колличество основного ключа на странице !

    А как текст генеришь если не секрет, меняешь отдельные слова в готовом тексте?
     
Статус темы:
Закрыта.