Морфология в тексте дора. Yandex.

Статус
В этой теме нельзя размещать новые ответы.
Есть некоторые трудности. Отпишусь чуть позже.
Если кто-то желает помочь с созданием шаблонов согласования слов в словосочетаниях - прошу в личку.


---------- Post added at 22:30 ---------- Previous post was at 20:59 ----------

 
Да чего самим то делать, надо скинуться и заказать, обработка нужна, тоже заказываем, быстрее и без заморочек. Главное всё грамотно расписать, сначала концепцию, потом шаги, потом задания для каждого этапа для фрилансеров.
 
Да чего самим то делать, надо скинуться и заказать, обработка нужна, тоже заказываем, быстрее и без заморочек. Главное всё грамотно расписать, сначала концепцию, потом шаги, потом задания для каждого этапа для фрилансеров.

Ну вот и надо концепция шаги и задание. А не как придумаете я тоже скинусь и тд тп.

Скидываться деньгами на много больше людей, чем тех кто что-то дельное предлагает...

Вот и в твоем посте я не вижу смыла, и так ясно что надо решить что заказывать прежде чем заказывать...
 
Я пока не понял концепции, что например вот это значит? Кто объяснит?


Сначала общие положения простым языком, для тех кто хочет участвовать, чтобы деньги выделили. А потом ТС расписывает подробно задания для фрилансеров.

Добавлено через 15 минут
 
Я пока не понял концепции, что например вот это значит? Кто объяснит?
*** скрытое содержание ***
Сначала общие положения простым языком, для тех кто хочет участвовать, чтобы деньги выделили. А потом ТС расписывает подробно задания для фрилансеров.
Попробую объяснить ещё раз. Но всё-таки процитирую своё предыдущее сообщение:
В исходном варианте имели кей "звонки для мобильников" и предложение "Я очень люблю заниматься сексом с девушками."
Определяем форму слова "сексом". Единственное число, творительный падеж. Ставим кей в эту форму. Имеем в виду, что в кее у нас два существительных. Одно в именительном (или винительном) падеже, второе в родительном. Если ставить только первое существительное, то это куда ни шло - звонками для мобильников: "Я очень люблю заниматься звонком для мобильника." Mystem определит слова верно. Но текст уже не торт. Но если и поставить и второе существительное в творительный, то получается абсолютная лажа. "Я очень люблю заниматься звонком для мобильником."
А если исходный кей содержит глагол? Допустим "скачать звонки для мобильников"? Тогда всё ещё хреновее.
Проблема с постановкой в нужную форму понятна? Т.е. понятно ли почему нужны такие манёвры с шаблонами? Чтобы кей стоял в предложении в нужной форме. Если кому-то нужно объяснить на примерах - прошу в ПМ - расскажу.
То, что
для яндекса все три замены одинаковые, то есть эти фразы не будут уникальным
Правильно! Этого и добиваемся. НАШ кей в различных формах. Для яндекса это одно и тоже. Плотность на уровне - признаков генерации почти нет.
А если вы боитесь, что текст будет неуникальным - почитайте плз, про методики определения уникальности яндексом. Всё очень зависит от исходного текста.
Про скинуться на услуги фрилансеров для анализа - я за. В универах там, и научных институтах выделяются гранты на разработку всяких забавных штук :) А тут приходится самим.
Куда проще заплатить сначала фрилансеру, чтобы он сделал софт, для обработки исходных данных. А потом, уже передавать нормальное ТЗ основному кодеру.
Ведь как правильно замечено выше - желающих дать денег хватает, не хватает желающих поработать.
 
Ну, и я говорю понять бы на что деньги пойдут и каков шанс что всё срастется, а с деньгами все быстрее раскочегарится.

Только речь пока идет о кеях, но одними кеями сыт не будешь, текста нужны горы, и желательно чтобы кеев там было немного. Встроим мы их, а остальные предложения как будут строиться? Где база для построения множества предложений со словами-не-кеями?
 
Ну, и я говорю понять бы на что деньги пойдут и каков шанс что всё срастется, а с деньгами все быстрее раскочегарится.
Только речь пока идет о кеях, но одними кеями сыт не будешь, текста нужны горы, и желательно чтобы кеев там было немного. Встроим мы их, а остальные предложения как будут строиться? Где база для построения множества предложений со словами-не-кеями?

В любом случае, в сотый раз говорю, погуглите про шинглы и обратный индекс. И тогда уже давайте строить разговор предметно.
 
dig555 написал(а):
Нужно взять свою базу кеев побольше (на 10-20К) прогнать скриптом из темы /showthread.php?t=155524 и получить на выгоде (10-20К) шаблонов вида "предлог существительное наречие существительное прилагательное".
Посчитать сколько раз встречается каждый из шаблонов в базе (какие конструкции самые популярные). Потом вывести на экран все конструкции без дублей, но с 2-3 примерами из базы.
Вот с этой информацией можно работать дальше. Я в php достаточно слаб. Сам скрипт допилить не могу. Плюс до сих пор с температурой. Хотите быстрее? Помогайте!
вам надо скрипт написать, который это делать будет или вручную обработать свою базу (или кусок) и скинуть результаты?
 
вам надо скрипт написать, который это делать будет или вручную обработать свою базу (или кусок) и скинуть результаты?
Конечно, скрипт был бы предпочтительнее. Тогда бы им смогли воспользоваться все желающие. Все бы прогнали свои базы, и мы могли бы знать точно, какие шаблоны нужны и на примерах, смогли бы определить алгоритм замены для каждого.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху