Предложение: давайте сделаем тематический Eng словарь Adult синонимов

Статус
В этой теме нельзя размещать новые ответы.

glas_naroda

Постоялец
Регистрация
4 Авг 2007
Сообщения
83
Реакции
16


Кому интересно, отпишитесь плз. в теме и/или мне в ПМ. Если наберется народу мало - попробую еще кинуть клич по буржуйским AWM форумам.
 
есть же гугл-документы, там вроде можно расшаривать и как-то отчетность вести
сам с английским не особо дружу, но можно по ходу создавать и русский
вообще интересно в принципе набрать опыта по теме составления словарей
 
есть же гугл-документы, там вроде можно расшаривать и как-то отчетность вести
сам с английским не особо дружу, но можно по ходу создавать и русский
вообще интересно в принципе набрать опыта по теме составления словарей

Насчет Гугл документов - ИМХО нет смысла заморачиваться с изучением; работы и так хватит, а мылом все пользоваться умеют:)

Насчет русского словаря - можно делать и его параллельно; полагаю, на нулледе участники для составления русского словаря наберутся быстрее, чем для английского. Но тут есть нюанс: кто-то должен составить методологию синонимизации, учитывающую разные формы одних слов. Либо брать за основу синонимайзер, различающий числа-падежи-и т.п. С английским у меня все наработано, и я могу всем желающим конкретно рассказать неплохой алгоритм работы, который юзаю сам. С рунетом я никогда работать не пробовал, и потому тему не прорабатывал. Т.е. искать подходящий синонимайзер и разрабатывать методологию работы (читай - координировать проект) придется кому-нибудь другому. В принципе, я могу описать свой алгоритм работы с английским, он не сложный, чтобы помочь сориентироваться - и если наберутся желающие для составления русского словаря, кто-то один возьмет школьный учебник и сделает "по образу и подобию".

Ах, да: если кто может привлечь заинтересованных грамотных и разумных людей к этой теме с других ресурсов - не стесняйтесь им писать, в т.ч. то, что я поставил под хайдом. Ибо хайд символический и нужен для защиты от недальновидных случайно зашедших школьников. Толковые люди здесь понадобятся - чем больше, тем лучше;)
 
по мылу не будет наглядности и мотивации работать со всеми, тем более многое будет зависеть от 1-2 человек, а в случае с расшаренными документами процесс пойдет независимо

и все равно что принцип работы с мылом объяснять что с каким-то приложением, сложность то одинаковая, то есть просто и там и там
 
Подразумевается создание словаря, который бы дал человеческий текст? Если да, то такой словарь и самому несложно создать. Надо лишь дампануть описания для галлерей и вычитать их. После 450-го слова в своем словаре мой прогресс значительно замедлился т.к. я уже не встречал реально заменимых частотных слов. Все дески делятся на два типа:
1. Стандартные типа: "мускулистый чувак жестко тра..ет офигенную бабу", где каждое слово можно заменить, имея словарь в 300 слов.
2. Нестандартные типа: "Мы уже видели Ли Мэй в наших прошлых выпусках и получили множество писем с просьбами снять еще пару видео с ней." Чтоб синонимизировать такую фразу надо очень большой словарь. При том, это должен быть неадалт словарь(коих, кстати, уже полно).
Резюме: неясно, какой именно словарь вы хотите сделать. В качестве обьяснения, приведите, пожалуйста, пример текста, который он должен синонимизировать и что в итоге должно получиться.

PS или я не разобрался или oxford сакс... мне не удалось найти и половины моих слов... Но мне понравился этот сайтик
 
Похоже, с синонимайзером вышла промашка: глючит безбожно при добавлении своей английской базы на примерно 400 слов; придется искать и брать что-то другое. Может убедю одного своего товарища написать простенький за большое спасибо и скромную сумму WMZ. Нужна простая замена слова на рандомный его синоним из словаря; обратная синонимизация (т.е. слово в тексте заменяется на синоним и синоним в тексте заменяется на слово); запрет обратной синонимизации в словаре (т.е. слово в тексте заменяется на синоним, но синоним в тексте не заменяется на слово); если прикрутит возможность в словаре указывать, как часто данное слово (в %) должно заменяться в любом тексте (наподобие 30%her/the chick's/the girl's) - вообще замечательно получится.

Поэтому сейчас пример привести не могу, но в целом - вариант 2. Поэтому словарь по большей части получается общетематическим, но с учетом адалт тематики и некоторыми специфическими синонимами (rod=dick и т.п.). Если в целом - то на входе берется RSS Feed или описание TGP галеры спонсора, прогоняется через синонимайзер, и на выходе получается уникальный для ПС и подходящий для людей текст. Который если и выглядит странно - то лишь в некоторых местах, совсем незначительно, и больше похож на результат работы не совсем англоговорящего AWMа, чем машинную обработку. Для адалта это допустимо - в отличие, скажем, от финансов.

 
30%her/the chick's/the girl's - пишу генератор на php, если интересно, там как раз такое будет. Сам работал над подобной работой, только в другой тематике. 2 добровольца и все?
 
Интересная тема.
Вот несколько ресурсов (взял с Армады), содержащие английские адалт-синомимы:

Если сбор базы еще актуален, при наличии свободного времени буду собирать синонимы.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху