[DMI] Меняемся словарями!

Статус
В этой теме нельзя размещать новые ответы.
а в чем прикол? нафига такой высокий хайд то поставил? словари может любо напарсить:p

вот еще мои словари


раньше ничего не писал и хайд не понижал потому что в бане был:)

ЗЫ: у вас наверно 100 мбпс если за полчаса
ЗЗЫ: с возвращением меня, как-никак месяц - срок
 
ЗЫ: у вас наверно 100 мбпс если за полчаса
ЗЗЫ: с возвращением меня, как-никак месяц - срок

У меня около суток собирал на среднем железе и 10Мб.

Делаем приблизительный расчётик, исходя из подключения:
на 100 Мб ~ 2 часа 40 мин (160 мин.) на сбор словаря,
на 1 Гб ~ 16 мин .

Выводим что у товарища alexseo подключение ~ 500 Mbit, поздравляю с широким каналом :)

На мой взгляд делиться словарями нет смысла - на свежесобранных словарях контент доров будет актуальнее. А актуальность ИМХО фактор значимый. Т.е. например дор на тему освещения бубнит про свечи, а Яблочкин уже лампочку изобрёл. И как следствие, в топе по освещению твоего дора нет! Хотя есть вечные темы в токорых человечество почти не продвигается, способ размножения не изменился )))

ЗЫ
Добавлю капельку паранойи - а если в словаре будут чужие урлы размазаны? Сгенерил а вместо контента - сайтмап чей-то )))

ЗЗЫ: 2roddik с возвращением :)
 
На мой взгляд делиться словарями нет смысла - на свежесобранных словарях контент доров будет актуальнее. А актуальность ИМХО фактор значимый. Т.е. например дор на тему освещения бубнит про свечи, а Яблочкин уже лампочку изобрёл. И как следствие, в топе по освещению твоего дора нет! Хотя есть вечные темы в токорых человечество почти не продвигается, способ размножения не изменился )))

Ну это вряд ли, сейчас так раз на 5 лет появляется одно новое слово в теме, остальные не меняются - контент от этого не страдает, да и словарям-то два месяца от роду
 
Выводим что у товарища alexseo подключение ~ 500 Mbit, поздравляю с широким каналом :)
совсем нет, дорген стоит на серваке с поключением в 100mbit, но канал загружает не полностью при создании словаря
 
а при чем здесь скорость подключения? Выкачивает он совсем немного, потом ему ресурсы машины нужны именно для разбора по частям речи, и только. Чем быстрее железо,, тем быстрее будет результат
 
а при чем здесь скорость подключения? Выкачивает он совсем немного, потом ему ресурсы машины нужны именно для разбора по частям речи, и только. Чем быстрее железо,, тем быстрее будет результат

Что ты говоришь... интересно каким же это способом он узнает часть речи? а? сначала бы в сорцы посмотрел, а потом говорил - он смотрит на сайте
 
Даже если и лазит куда-то, то не думаю, что он в это время через себя гигабайты прокачивает. К тому же слов не так уж и много общеупотребительных, около 1000, и зашить их в в сам скрипт не так уж много места надо. Смысл этихх словарей в том, что в каждой теме свой набор слов используется.
В сорцы не лазил, если бы сам подобное писал, сделал бы так
 
Даже если и лазит куда-то, то не думаю, что он в это время через себя гигабайты прокачивает.
Тут дело в задержке.
Типо схавал он одно предложение - заслал на сторонний сайт(сс), сс захавал это предложение и отдал рассортированное по частям речи. Предложений пално (типический словать около 4-5 метров), сайт загружен, алгоритм неоптимизирован :)

К тому же слов не так уж и много общеупотребительных, около 1000,
У Эллочки-людоедочки 28 было и она прекрасно апчалась :D А вообще надо лексикон расширять по максимуму и свой и программный.
 
Даже если и лазит куда-то, то не думаю, что он в это время через себя гигабайты прокачивает. К тому же слов не так уж и много общеупотребительных, около 1000, и зашить их в в сам скрипт не так уж много места надо. Смысл этихх словарей в том, что в каждой теме свой набор слов используется.
В сорцы не лазил, если бы сам подобное писал, сделал бы так

Он лезет за каждым отдельным словом на сайт, ничего никуда не зашивает. Это вообще-то мы о том, что ты говорил, типа ему нужны ресурсы компа для разбора, а не скорость подключения:) в порядке ликбеза:) пис
 
раньше лазил, начиная с 2.2 локальный словарь, а начиная с 2.5 тож локально, но уже часть речи определяется исходя из контекста (в англ. языке одно слово может быт разными частями речи)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху