№ 146-РВ - Новый патент Google

Тема в разделе "Платная рассылка Ашманова", создана пользователем Rodik, 6 окт 2006.

Статус темы:
Закрыта.
  1. Rodik

    Rodik Прохожие

    [FONT=tahoma,arial]
    НОВЫЙ ПАТЕНТ GOOGLE
    Система и метод учета
    редакторского мнения при ранжировании
    результатов поиска ​
    [/FONT]

    Понимание, что "машинный" подход к организации поиска в вебе (только роботами, без участия человека) не может решить многих проблем, постепенно завоевывает рынок. Альтернативой является поиск "социальный". Но возможны, конечно, и промежуточные варианты - идея, что люди могут и смогут обучать машину, не нова. Примером подобного "промежуточного" подхода является новый патент гиганта мирового поиска Google - система и метод учета редакторского мнения при ранжировании результатов поиска.
    Читайте и наслаждайтесь. Мне особенно понравился пассаж о том, как в Google представляют модель поведения пользователя в поиске. "Например, предположим, потребитель желает приобрести принтер через интернет. Он подключается к сети интернет и в браузере вводит URL производителя..." Интересно, это представления разработчиков или результаты статистических исследований?..
    * * * А в Яндексе, судя по ежедневному бану поисковых каталогов, всерьез взялись за проблему новых дорвеев. Традиционно, дорвей - это страница, целью которой является: а) занять место в результатах поиска по нужному запросу; б) переправить пользователя на целевой сайт.
    Но... "когда Коран писали, еще мин не было. Иди вперед, Фатима!" С появлением партнерских программ, особенно PPC-партнерок, нужда в перенаправлении отпала: теперь достаточно показать посетителю блок оплаченной PPC-рекламы, добиться клика и получить свою "копеечку".
    Вопрос - как оценивать это за явление? Доры это или "честные сайты"? Вред дорвеев для поисковых технологий заключался в том, что на одну целевую страницу в индексе приходилось хранить и пытаться ранжировать сотни страниц, предназначенных исключительно для поисковиков. Что теперь?
    Интересный вопрос. Сколько фирм в городе Воронеже с населением 850 000 человек могут торговать пластиковыми окнами? Пять, десять, двадцать?.. А может ли на таком пространстве выжить сотня оконных компаний? Вряд ли, правда? Но, судя по выдаче Яндекса, информацию по запросу "пластиковые окна в Воронеже" предлагают аж 260 сайтов. Далеко не все (ой, как не все!) из них являются сайтами воронежских оконных, строительных и ремонтых компаний. Тогда в чем смысл жизни остальных в выдаче по данному запросу? Предоставлять пользователю "качественную информацию", "собирать копеечку" или это так "Яндекс плохо ищет"? Вопрос, как говорится, то ли открытый, то ли риторический.
    На форуме SEOChase появился топик, как раз в тему - Что готовит нам Ашмановская коференция 2006? И даже первый ответ есть: "А что, собственно, развивалось в Рунете с 2003 года, кроме PPC и поискового спама?" Может, об этом и поговорим на конференции? Разговор обещает быть исключительно острым. НОВЫЙ ПАТЕНТ GOOGLE Система и метод учета редакторского мнения
    при ранжировании результатов поиска


    Bharat; Krishna (Santa Clara, CA), Gomes; Benedict (Berkeley, CA), Harik;
    Georges R. (Mountain View, CA), Mayer; Marissa (Palo Alto, CA)
    Оригинальный текст - http://patft.uspto.gov/....
    Перевод выполнен с разрешения правообладателя. ​
    Общее описание
    Сервер улучшает ранжирование поисковых результатов. Сервер включает в себя процессор и память, в которой хранятся инструкции и группа тем запросов. Сервер получает поисковый запрос, который состоит из минимум одного поискового слова, а возвращает один или несколько объектов, основываясь на минимум одном поисковом слове и определяет, относится ли поисковое слово хотя бы к одной из групп тем поисковых запросов. Процессор в дальнейшем ранжирует один или несколько объектов, основываясь на том, соответствует ли поисковый запрос хотя бы одной теме поисковых запросов и предоставляет один или больше ранжированные объекты пользователю.
    Пункты патентной формулы
    Предметом патента является:
    1. Метод предоставления результатов поиска, осуществляемый с помощью компьютерной программы, и включающий в себя: получение поискового запроса; предоставление одного или более объектов в ответ на поисковый запрос; автоматическое определение соответствия поискового запроса хотя бы одной теме запросов из группы тем запросов; определение относится ли один или более объектов к списку предпочтительных или непредпочтительных источников; ранжирование одного или более объектов основываясь на результатах определения, соответствует ли поисковый запрос хотя бы одной поисковой теме и определение принадлежит ли один или более объектов к списку предпочтительных или непредпочтительных источников; предоставление одного или более ранжированных объектов клиенту.
    2. Метод, описанный в пункте 1, где объекты включают в себя веб страницы.
    3. Метод, описанный в пункте 1, где ранжирование включает в себя: определение общей оценки объектов безотносительно к списку предпочтительных или непредпочтительных источников используя первую группу параметров, определение общей оценки для этих объектов, которая соотносится со списком предпочтительных или непредпочтительных источников используя первую группу параметров и параметр редакторского мнения, и ранжирование документов, основываясь на определенной (с помощью всего вышеперечисленного) общей оценке.
    4. Метод, описанный в пункте 3, где параметр редакторского мнения для объектов соответствующих списку из предпочтительных источников улучшает их позиции, а позиции объектов соответствующих списку из непредпочтительных источников ухудшаются.
    5. Метод, описанный в пункте 1, где автоматическое определение включает в себя: определение соответствует ли поисковый запрос правилу запроса связанному с определенной темой запросов.
    6. Метод, описанный в пункте 1, где каждая тема запросов классифицируется как первый набор тематических разделов, где автоматическое определение разделов включает в себя: классификацию поискового запроса как второго набора тематических разделов, и определение соответствия поискового запроса теме запросов, когда второй набор тематических разделов соответствует первому набору тематических разделов ассоциированных с этой темой запроса.
    7. Компьютерная программа, которая предоставляет результаты поиска, и включает в себя: средства получения поискового запроса, который состоит из минимум одного слова; средства предоставления одного или более объектов основываясь на минимум одном поисковом слове; средства автоматического определения соответствует ли поисковый запрос хотя бы одному из множеств поисковых тем; средства определения одного или более объектов к списку предпочтительных или непредпочтительных источников; средства ранжирования одного или более объектов основанные на том, соответствует ли поисковый запрос хотя бы одному из множеств поисковых тем и относится ли один или более объектов к списку предпочтительных или непредпочтительных источников; и средства предоставления ранжированных объектов (одного или более) клиенту.
    8. Совместимое с компьютером физическое средство передачи информации содержащее инструкции, контролирующее минимум один процессор для исполнения метода предоставления результатов поиска, метода включающего в себя: получение поискового запроса, который состоит хотя бы из одного поискового слова; получении минимум одного объекта основываясь на минимум одном поисковом слове; автоматическое определение соответствует ли поисковый запрос хотя бы одному из множества поисковых тем; определение относится ли один или более объектов к списку предпочтительных или непредпочтительных источников; определение общей оценки для каждого из объектов основываясь на том соответствует ли поисковый запрос хотя бы одному из множеств поисковых тем и относится ли он (они) к списку предпочтительных или непредпочтительных источников; предоставление списка ранжированных объектов клиенту, основываясь на общей оценке.
    9. Совместимое с компьютером физическое средство передачи информации, описанное в пункте 8, где объекты включают в себя веб страницы.
    10. Совместимое с компьютером физическое средство передачи информации, где предоставление ранжированного списка включает в себя: определение общей оценки этих объектов, которая не соотносится со списком предпочтительных или непредпочтительных источников, используя первую группу параметров, определение общей оценки этих объектов, которая соотносится со списком предпочтительных или непредпочтительных источников используя первую группу параметров и параметр редакторского мнения, и ранжирование документов, основываясь на определенных ранее общих оценках.
    11. Совместимое с компьютером средство передачи информации, описанное в пункте 10, где параметр редакторского мнения увеличивает ранг тех объектов, которые входят в список предпочтительных источников, и уменьшает ранг тех, которые входят в список непредпочтительных источников.
    12. Совместимое с компьютером средство передачи информации, описанное в пункте 8, где определение принадлежит ли поисковый запрос, хотя бы одному из множеств поисковых запросов, включает в себя: определение соответствует ли поисковый запрос правилу, ассоциируемому с этой поисковой темой.
    13. Совместимое с компьютером средство передачи информации, описанное в пункте 8, где каждая поисковая тема классифицируется как первый набор тем, и в котором определение соответствует ли поисковый запрос хотя бы одному из множеств тем поисковых запросов включает в себя: классификацию поискового запроса как второй набор тем, и определение соответствия поискового запроса теме поисковых запросов, когда второй набор тем соответствует первому набору тем ассоциируемому с этой поисковой темой.
    14. Сервер, включающий в себя: память для хранения инструкции и группы поисковых тем; процессор, работающий с инструкциями для: получения поискового запроса, в который входит как минимум одно слово, предоставления одного или более объектов основываясь на минимум одном поисковом запросе, автоматическое определение соответствует ли поисковый запрос хотя бы одной поисковой теме из группы поисковых тем, определение относится ли хотя бы один или более объектов к списку предпочтительных или непредпочтительных источников, ранжирование одного или более объектов основываясь на том, соответствует ли поисковый запрос хотя бы одной поисковой теме из группы поисковых тем и относится ли хотя бы один или более объектов к списку предпочтительных или непредпочтительных источников, и предоставление ранжированных объектов клиенту.
    15. Сервер, описанный в пункте 14 где, при ранжировании одного или более документов, процессор настроен на: определение общей оценки одного или более объектов, которая не соотносится со списками предпочтительных или непредпочтительных источников, а использует первую группу параметров, определение общей оценки объектов относительно списка предпочтительных и непредпочтительных источников используя первую группу параметров, а также параметр редакторского мнения, и ранжирование объектов, основываясь на определенных оценках.
    16. Сервер, описанный в пункте 15, где параметр редакторского мнения увеличивает ранг тех объектов, которые входят в список предпочтительных источников, и уменьшает ранг тех, которые входят в список непредпочтительных источников.
    17. Метод, включающий в себя: разработку одной или более поисковых тем; определения для каждой поисковой темы первого набора объектов, как предпочтительных; определение для каждой поисковой темы второго набора объектов, как непредпочтительных; определение параметра редакторского мнения для каждого из объектов из первого и второго набора; автоматическое использование параметра редакторского мнения, через компьютерную программу, для изменения ранжирования списка объектов выдаваемых по запросу; и предоставление через компьютерную программу измененный список ранжированных объектов клиенту.
    18. Метод, описанный в пункте 17 также включающий в себя: определения для каждой поисковой темы, одного или более правила для определения поискового запроса поисковой теме.
    19. Метод, описанный в пункте 17 также включающий в себя: определения для каждой поисковой темы одной или более тем, где поисковый запрос соответствует поисковой теме.
    20. Метод, описанный в пункте 19, где одна или более тема выбирается из минимум одной иерархической директории.
    21. Метод, описанный в пункте 17, где первый и второй набор объектов являются наборами веб страниц.
    22. Метод, описанный в пункте 21, где определение первого набора объектов включает в себя: определение первого набора объектов, используя названия хостов.
    23. Метод, описанный в пункте 21, где определения первого набора объектов включает в себя: определение первого набора объектов, используя один или более префикс Uniform Resource Locator (URL).
    24. Метод, описанный в пункте 21, где определение первого набора объектов включает в себя: классификацию каждой поисковой темы в набор тем из иерархической директории, и определение хостов, которые входят в список набора тем из первого набора объектов для этого поискового запроса.
    25. Метод, описанный в пункте 17, где параметр редакторского мнения увеличивает или уменьшает ранг объектов, в зависимости от их принадлежности к первому или второму набору объектов.
    26. Совместимое с компьютером средство передачи информации, содержащее одну или более инструкций находящихся на физическом носителе для контроля хотя бы над одним процессором, который использует метод для предоставления результатов поиска, метод, состоящий из: определение для каждой группы поисковых тем первого набора объектов как предпочтительных объектов, определение для каждой группы поисковых тем второго набора объектов как непредпочтительных объектов; определение параметра редакторского мнения для каждого из объектов в первом и втором наборе объектов; автоматическое использование хотя бы одного параметра редакторского мнения из определенных параметров редакторского мнения для изменения ранжирования списка объектов предоставляемых в ответ на запрос; и предоставление измененного ранжированного списка объектов клиенту.
    27. Совместимое с компьютером средство передачи информации, описанное в пункте 26 далее включающее в себя: определение для каждой поисковой темы в группе поисковых тем, одно или более правил для определения удовлетворяет ли поисковый запрос поисковой теме.
    28. Совместимое с компьютером средство передачи информации, описанное в пункте 26 далее включающее в себя: определение для каждой поисковой темы в группе поисковых тем, одной или более тем для определения удовлетворяет ли поисковый запрос поисковой теме.
    29. Совместимое с компьютером средство передачи информации, описанное в пункте 28, где одна или более тема выбирается из минимум одной иерархической директории.
    30. Совместимое с компьютером средство передачи информации, описанное в пункте 26, где первым и вторым набором объектов являются веб сайты.
    31. Совместимое с компьютером средство передачи информации, описанное в пункте 30, где определение первого набора объектов включает в себя: идентификацию объектов из первого набора используя хосты.
    32. Совместимое с компьютером средство передачи информации, описанное в пункте 30, где определение первого набора объектов включает в себя: идентификацию объектов из первого набора используя один или более Uniform Resource Locator (URL).
    33. Совместимое с компьютером средство передачи информации, описанное в пункте 30, где определение первого набора объектов включает в себя: классификацию каждой поисковой темы в набор тем из иерархической директории, и идентификацию хостов входящих в набор тем как принадлежащих к первому набору объектов для этой поисковой темы.
    34. Совместимое с компьютером средство передачи информации, описанное в пункте 26, где параметр редакторского мнения увеличивает или уменьшает ранг объекта, в зависимости от того принадлежит он к первому набору объектов или нет.
    35. Система состоящая из: совместимое с компьютером физическое средство передачи информации состоящее из: поле поисковых тем, в котором хранится как минимум одна поисковая тема, поля предпочтительных и непредпочтительных источников, в которых хранится информация определяющая предпочтительные и непредпочтительные сайты для каждой поисковой темы в поле поисковой темы, и поле параметра редакторского мнения, в котором хранится информация редакторского параметра для каждого из предпочтительных и непредпочтительных сайтов определенных в поле предпочтительных и непредпочтительных источников; и как минимум один процессор настроенный использовать данные для ранжирования объектов возвращаемых в ответ на поисковый запрос клиента.
    36. Система, описанная в пункте 35, где как минимум одна поисковая тема включает как минимум одно правило поисковой темы и набор тем из одной или более иерархических директорий.
    37. Сервер, включающий в себя: память, хранящую множество поисковых тем, информацию, определяющую для каждого множества поисковых тем, как минимум один предпочтительный или непредпочтительный объект, ассоциируемый с этой поисковой темой, и параметр редакторского мнения, ассоциируемый с каждым предпочтительным и непредпочтительным объектом; и процессор настроенный чтобы: получать поисковый запрос состоящий из одного или более слов, предоставлять объекты используя одно или более слов, определять общую оценку для каждого из предоставляемых объектов, определение одного из множеств поисковых тем как соответствующую поисковому запросу, определение для каждого из предоставляемых объектов, ассоциируется ли он с одним из объектов из списка предпочтительных или непредпочтительных объектов ассоциированных с этой поисковой темой, корректировать, общую оценку каждого из представленных объектов, если он был определен как один из предпочтительных или непредпочтительных объектов, и предоставлять ранжированный список объектов клиенту основываясь на этой корректировке.
    Описание
    ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
    А. Область изобретения
    Настоящее изобретение в основном касается систем поиска информации, более конкретно, системы и метода поддержки редакторского мнения при ранжировании поисковых результатов.
    В. Описание родственной технологи
    Интернет превратился в очень важную часть нашей повседневной жизни. Миллионы людей ежедневно используют интернет, для того чтобы приобрести продукты или услуги, получить интересующую их информацию (например, списки фильмов с участием:), для общения с друзьями, семьей, коллегами (например, через электронную почту).
    На сегодняшний день, когда кто-то желает что-то приобрести через Интернет, либо просто найти там нужную информацию, он вводит в адресную строку браузера Uniform Resource Locator (URL) интересующего его сайта, для того чтобы получить к нему доступ. Он после попадания туда определяет, доступна ли на этом сайте интересующая его информация.
    Например, предположим, потребитель желает приобрести принтер через интернет. Он подключается к сети интернет и в браузере вводит URL производителя. Потребитель далее попадает на страницу производителя и определяет, есть ли в наличии интересующий его продукт.
    Если потребитель не знает, кто продает принтеры, то в этом случае он может воспользоваться поисковой машиной. Потребитель вводит простое слово 'принтер', для того чтобы получить информацию о тех, кто занимается продажей принтеров. Такое использование коммерческой поисковой машины, часто оборачивается сотнями или даже тысячами 'хитов' (страниц, которые соответствуют такому поисковому запросу).
    Потребитель далее должен определить, какую именно страницу ему стоит посетить. Посещение каждой страницы, с целью выяснения занимается ли владелец продажей принтеров или нет - занимает очень много времени. Как результат, в сфере предоставления услуг по поиску информации сейчас принято предоставлять список ранжированных документов соответствующих запросу. Для того чтобы сформировать такой список необходимо проверить на полное или частичное совпадение поискового запроса с фразой или словом в документе или воспользоваться историческими данными о том какие страницы были посещены по такому запросу.

    Другие поисковые службы попытались улучшить качество поисковых услуг, сформировав статические списки страниц по определенным темам. Примерами директорий, является Yahoo! (www yahoo.com) и Open Directory (www.dmoz.org). Такие поисковые службы в ответ на запрос предоставляют список страниц, которые были просмотрены и одобрены редакторами этой службы. Сфера таких слуг, однако, ограничена теми документами, которые были просмотрены редакторами.
    AskJeeves (www.ask.com) обобщает применение редакторского мнения к коллекции страниц. Их редакторы идентифицируют набор страниц как посвященные одной теме (например, страницы аэропортов) и ассоциируют этот набор страниц со специфическими словами (например, слово 'аэропорт'). Когда одно из таких слов появляется в запросе, они предоставляют пользователю наборы страниц, которые ассоциируются с этим словом, позволяя ему выбирать дальнейшее направление. И снова, такой метод ограничен теми страницами, которые были просмотрены редакторами, и количество которых на несколько порядков ниже, чем количество полезных страниц во всемирной сети.
    Таким образом, есть необходимость в методе и системе, которая бы помогла улучшить поиск в интернете.
    КРАТКОЕ ИЗЛОЖЕНИЕ ИЗОБРЕТЕНИЯ
    Система и метод, входящие данное изобретение, вызваны необходимостью механизма улучшения ранжирования результатов поиска с помощью интеграции редакторского мнения.
    В соответствии с целью изобретения, которое здесь описывается, метод по которому предоставляются результаты поиска не будет разглашен. Метод включает в себя получение поискового запроса, предоставление одного или более объектов в ответ на запрос, определение соответствует ли поисковый запрос хотя бы одной поисковой теме из группы поисковых тем, ранжирование одного или более объектов основываясь на результатах определения, и предоставление ранжированных объектов пользователю.
    Метод определения параметра редакторского мнения также не будет разглашен. Метод включает в себя разработку одной или более поисковых тем, определение для каждой из поисковых тем первого набора объектов как предпочтительных, определение для каждой поисковой темы второго набора страниц как непредпочтительных, и определение параметра редакторского мнения для каждого из объектов в первом и втором наборе.
    КРАТКОЕ ОПИСАНИЕ РИСУНКОВ
    Прилагаемые рисунки, которые входят и являются частью этого документа, иллюстрируют вариант конструкции изображения, и вместе с описаниями объясняют изобретение.
    РИС. 1 иллюстрирует примерную сеть, в которой могут быть использованы система и метод, являющиеся предметов этого изобретения;
    РИС. 2 иллюстрирует примерное устройство клиента, согласующееся с данным изобретением;
    РИС. 3 иллюстрирует примерный сервер, согласующийся с данным изобретением;
    РИС. 4 иллюстрирует примерную базу данных, согласующуюся с данным изобретением, и которая может быть ассоциирована с сервером на РИС. 3;
    РИС. 5 иллюстрирует примерный процесс, согласующийся с данным изобретением для определения параметров редакторского мнения; и
    РИС. 6 иллюстрирует примерный процесс, согласующийся с данным изобретением для интеграции редакторского мнения в ранжирование результатов поиска.
    ДЕТАЛЬНОЕ ОПИСАНИЕ
    Последующее детальное описание относится к прилагаемым рисункам. Номера элементов рисунков являются одинаковыми для всех изображений. Также, последующее детальное описание ни в коей мере не ограничивает изобретение. Напротив, суть изобретения излагается в прилагаемых пунктах.
    Система и метод, согласующиеся с данным изобретением улучшают услуги поиска информации, интегрируя в себя редакторское мнение, которое учитывается при ранжировании документов.
    Примерная сеть
    РИС. 1 иллюстрирует примерную сеть 100, в которой система и метод, согласующиеся с данным изобретением, могут быть применены. Сеть 100 может включать в себя множество клиентских устройств 110 соединенных с множеством серверов 120 130 через сеть 140. Сеть 140 может включать в себя локальную сеть (LAN), широкую сеть (WAN), телефонную сеть (PSTN), интранет, интернет, или комбинации сетей. Два клиентских устройства 110 и три сервера 120 130 на иллюстрации связанны с сетью 140 для простоты понимания. На практике, может быть гораздо больше (или меньше) клиентских устройств и серверов. Также в некоторых случаях, клиентское устройство может выполнять функции сервера, а сервер может выполнять функции клиентского устройства.
    Клиентские устройства 110 могут включать устройства, мини компьютеры, ПК, КПК и другие, которые могут быть подсоединены к сети140. Клиентские устройства 110 могут передавать данные через сеть 140 или получать данные через сеть 140 через проводную, беспроводную или оптическую связь.
    Сервера 120 130 могут включать одно или более типов компьютерных устройств, таких как мейн-фреймы, мини компьютеры, ПК, с возможностью подсоединения к сети 140, для того чтобы сервера 120 130 могли связаться с клиентскими устройствами 110. В альтернативных вариантах, сервера 120 130 могут включать в себя механизмы для прямого соединения с одним или более клиентскими устройствами 110. Сервера 120 130 могут передавать данные через сеть 140 или получать данные через сеть 140 через проводную, беспроводную или оптическую связь.
    При реализации совместимой с данным изобретением, сервер 120 может включать в себя поисковую машину 125 используемую устройством клиента 110. Сервер 130 может хранить данные (или веб страницы) доступные для клиентского устройства 110.
    Примерная архитектура клиентского устройства
    РИС. 2 иллюстрирует примерное клиентское устройство 110 совместимое с данным изобретением. Клиентское устройство 110 может включать в себя шину 210, процессор 220, основную память 230, ПЗУ 240, устройства для хранения 250, устройство ввода 260, устройство вывода 270, интерфейс для коммуникации 280. Шина 110 может включать одну или более стандартных шин, которые позволяют взаимодействовать компонентам, входящим в клиентское устройство 110.
    Процессор 220 может быть процессором любого типа или микропроцессором, который интерпретирует и выполняет инструкции. Основная память 230 может включать ОЗУ или другой тип устройства для оперативного хранения информации и инструкций для применения процессором 220. ПЗУ 240 может быть стандартного типа или другого для хранения информации и инструкций для процессора 240. Запоминающее устройство может включать 250 может быть магнитным или оптическим средством с соответствующими драйверами.
    Устройство ввода 260 может включать одно или более совместимых устройств, которые позволяют пользователю вводить информацию в клиентское устройство 110, такие как клавиатура, мышь, планшет, голосораспознавательные и биометрические механизмы, и т.д. Устройство вывода 270 может включать один или более совместимых механизмов, которые выдают информацию пользователю, включая дисплей, принтер и т. д. интерфейс коммуникации 280 может быть любым принимающее-передающим устройством, которое позволяет клиентскому устройству 110 взаимодействовать с другими устройствами и/или системами. Например, интерфейс коммуникации может быть механизмами, позволяющими сообщение с другим устройством через сеть, как например сеть 140.
    Как будет описано более детально ниже, клиентское устройство 110, совместимое с настоящим изобретением, выполняет некоторые операции относящиеся к поиску. клиентское устройство 110 может выполнять эти операции через процессор 220 выполняя соответствующие инструкции какой-либо из программ, находящейся например в памяти 230.
    Инструкции могут быть записаны в памяти 230 с другого устройства, такого как устройство хранения данных 250, или с другого устройства через интерфейс коммуникации 280. Инструкции, содержащиеся в памяти 230, управляют процессором 220 для осуществления операций относящихся к поиску описанных ниже. Альтернативным вариантом может служить жестко смонтированная схема в комбинации с инструкциями для осуществления процесса соответствующего данному изобретению. Таким образом, настоящее изобретение не ограничено никакой специфической комбинацией аппаратуры и программного обеспечения.
    Примерный сервер
    РИС. 3 иллюстрирует примерный сервер 120 согласующийся с настоящим изобретением. Сервер 130 может быть настроен идентично. Сервер 120 включает в себя шину 310, память 330, устройство ввода 340, устройство вывода 350, и интерфейс коммуникации 360. Шина 310 может включать одну или несколько согласующихся шин, которые позволяют взаимодействовать компонентам сервера 120.
    Процессор 320 может быть процессором любого соответствующего типа или микропроцессором, который интерпретирует и выполняет инструкции. Память 330 может включать ОЗУ или другой тип устройства для оперативного хранения информации и инструкций для применения процессором 320; ПЗУ может быть стандартного типа или другого для хранения информации и инструкций для процессора 320. Запоминающее устройство может включать 250 может быть магнитным или оптическим средством с соответствующими драйверами.
    Устройство ввода 340 может быть совместимым одним или более устройством, которое позволяет оператору вводить информацию на сервер 120, такие как клавиатура, мышка, планшет и т. д. Устройство вывода 350 может включать один или более совместимых механизмов, которые выдают информацию оператору, включая дисплей, принтер и т. д. Интерфейс коммуникации 360 может быть любым принимающее-передающим устройством, которое позволяет серверу 120 взаимодействовать с другими устройствами и/или системами. Например, интерфейс коммуникации 360 может быть механизмами, позволяющими сообщение с другими серверами 130 или клиентскими устройствами 110 через сеть, как например сеть 140.
    Выполнение последовательности инструкций содержащихся в памяти 330, заставляет процессор 320 выполнять функции описанные ниже. В альтернативных конфигурациях, жесткая схема может быть использована вместо или совместно с программным обеспечением.
    Сервер 120, согласующийся с настоящим изобретением, может предоставлять информацию из одной или нескольких баз данных через графический интерфейс на клиентском устройстве 110. База данных может храниться на сервере 120 (например, в памяти 330) или на внешнем от сервера 120 устройстве.
    РИС. 4 иллюстрирует примерную базу данных 400, согласующуюся с настоящим изобретением, которая может быть ассоциирована с сервером 120. Хотя ниже описывается только одна база данных, сервер 120 может быть ассоциирован с одной или более дополнительными базами данных (не показанных) хранящихся локально на сервере 120 или представленную через сеть 140.
    Как показано на рисунке, база данных 400 может включать поле поисковой темы 410, поле критерия поисковой темы 420, поле предпочтительных и непредпочтительных источников 430 и поле параметра редакторского мнения 440. База данных 400 может включать дополнительные поля (не показанные), которые помогают при поиске и сортировке информации в базе данных 400 и/или информации получаемой из сети 140.
    Поле поисковой темы 410 может хранить информацию, идентифицирующую поисковые темы. Поисковые темы относятся к темам, которые часто встречаются в запросах пользователей сети 140. Редакторы могут, при реализации согласующейся с данным изобретением, могут формировать эти поисковые темы, основываясь на анализе логов поисковых запросов и определяя категории информации для которых пользователи вводят эти поисковые запросы. Примером поисковой темы может быть 'сайты, которые предлагают скачать бесплатное программное обеспечение' ("sites that provide free software downloads,") или 'сайт, которые помогают в поиске временного жилья' ("sites that help in finding an accommodation").
    Поле критерия поисковой темы 420, может хранить критерии для определения соответствия поискового запроса определенной поисковой теме в поле поисковой темы 410. Эти критерии могут быть установлены как минимум двумя различными способами. Первый способ - редакторы могут создать специальное правило для каждой поисковой темы, которое будет применяться к будущим запросам для проверки их на принадлежность к теме. Для поисковой темы "sites that provide free software downloads", правилом может служить требование к запросу содержать слова 'free' и 'download'. Для поисковой темы "sites that help in finding an accommodation" , правилом может служить требование к запросу содержать одно из слов {"accommodation," "lodging," "hotels," . . . } а также запрос должен содержать название местности (например, совпадать с одним объектом из списка названий местностей).
    При реализации согласующейся с настоящим изобретением, правило может быть представлено как булиновое выражение. На пример, правило для сайтов, которые предоставляют бесплатное программное обеспечение для скачивания может быть ('free' AND 'download'). Правило для сайтов которые занимаются помощью в поисках временного места жительства, может быть:
    (("accommodation" OR "lodging" OR "hotels" OR "motels")

    AND

    ("Alabama" OR "Alaska" OR . . . "Wyoming")).

    Второй способ, редакторы могут взять категории/темы из директории, которая сравнивается с поисковым запросом, для того чтобы проверить соответствует ли он теме. Например, набором тем могут служить темы из иерархической директории (например, Web Directory), такие как Open Directory, Yahoo!, или Google (www.google.com). Для определения сайтов, которые занимаются помощью в поисках временного места жительства, поисковая тема может быть определена как набор тем из Yahoo! как показано ниже:
    Recreation: Travel: Lodging;

    Regional: UK: Travel and Tourism: Accommodation;

    Regional: NZ: Business: Accommodation;

    Recreation: Travel: Backpacking: Budget Accommodation;

    Regional: NZ: Nelson: Accommodation;

    Regional: Australia: Queensland: Tourism: Accommodation;

    Regional: Europe: Italy: Tourism: Hotels;

    Regional: UK: England: London: Accommodation: Hotels;

    т. д.

    Было бы желательно, чтобы длинные списки таких тем, могли быть представлены и в короткой форме.
    Для определение тем директории, которые лучше всего соответствуют запросу, редакторам понадобиться идентифицировать набор запросов которые репрезентативны для данной поисковой темы. Например, редактор может выбрать следующие запросы:
    accommodation in New York;

    Florida hotels; and

    Best Western Inns in Nebraska

    как три примера для поисковой темы "sites that help in finding accommodation." Эти примерные запросы могут быть классифицированы в соответствии с тематической иерархией как например в Yahoo!. Для классификации множества запросов, результаты всех запросов могут быть скомбинированы, и комбинированный набор результатов можно будет сравнить со страницами, ассоциируемыми с каждой из тем. Далее можно будет отобрать темы, с наибольшим количеством совпавших страниц.
    Для последующего улучшения, для классификации можно использовать множество тематических иерархий. Более того, различные техники для классификации запросов можно использовать совместно, для того чтобы улучшить уровень доверия.
    Поле предпочтительных и непредпочтительных источников 430 может включать информацию, которая определяет наборы веб страниц/сайтов либо как 'предпочтительные источники' (источники с полезной и нужной информацией по интересующей теме) либо как 'непредпочтительные источники' (источники с информацией не соответствующей теме или перегруженные (рекламой, раскруткой) по интересующей теме) для определенной поисковой темы. Например, для поисковой темы "sites that provide free downloads", сайты, которые предлагают скачать бесплатное программное обеспечение будут считаться как 'предпочтительные источники', а сайты, которые обманывают поисковики используя слова 'free' и 'download' (известные приемы спаммеров), но на самом деле не предоставляют такой возможности, будут расценены как 'непредпочтительные источники'.
    Классификация сайтов на 'предпочтительные' может быть основана на названиях хостов. Например, сайт World Wildlife Fund ('Всемирный фонд дикой природы') хостится на www.wwf.org. Этот сайт будет предпочтительным источником для запросов о дикой природе или животных. Хост может содержать более одной веб странички. Так как части сайта могут соответствовать теме, а другие - нет, соответствующие части можно определить через набор префиксов URL (например, www.geocities.com/A/B/C).

    В реализации согласующейся с этим изобретением, набор предпочтительных и непредпочтительных источников может быть определен автоматически. Для достижения этого, примерные запросы в поисковой теме могут быть классифицированы как набор тем (например, Yahoo!, Open Directory, или Google) используя подход к классификации описанный выше. Хосты URL которых ассоциируются с темой могут быть приняты за предпочтительные источники. Например, если поисковая тема "sites that help in finding accommodation", тогда хосты входящие в список Open Directory категории "http://dmoz.org/Recreation/Travel/Lodging" могут быть расценены как предпочтительные источники.
    Поле параметра редакторского мнения 440 может включать параметры, которые определяют количество редакторского мнения для специфических предпочтительных или непредпочтительных источников для запросов, которые совпадают со специфическими темами запросов. Как будет описано ниже, более подробно, параметр редакторского мнения может быть использован для изменения ранжирования веб страниц в результатах поиска.
    Примерный процесс
    РИС. 5 иллюстрирует примерный процесс, согласующийся с настоящим изобретением, для определения параметров редакторского мнения. Процесс может начаться с разработки редактором или группой редакторов, например, через клиентское устройство 110, набора поисковых тем [акт 510]. Редакторы могут разрабатывать эти поисковые темы, например, просматривая логи поисковых запросов пользователей, экспериментируя с тестовыми запросами, и проверяя результаты выдачи. Как описано выше, примерной поисковой темой может служить "sites that provide free software downloads".
    Для каждой темы запроса, редакторы могут определить критерий темы запроса для идентификации удовлетворяет ли этот запрос определенной поисковой теме [акт 520]. Как описано выше, критерии поисковой темы могут быть выражены через правило, одно или несколько, и/или набором категорий или тем из директории. Для темы запросов, о которой говорится выше, примерным правилом может быть требование к запросу содержать в себе слова 'free' и 'download' , а примерной темой в директории может быть "Computer: Software: Shareware".
    Как только темы запросов и ассоциированные критерии будут разработаны, редакторы смогут определить, для каждой поисковой темы, набор веб сайтов как принадлежащих 'предпочтительным источникам' и 'непредпочтительным источникам' [акт 530]. Как описано выше, 'предпочтительные источники' относятся к тем страницам, которые размещают полезную и релевантную информацию, а к 'непредпочтительным источникам' относятся те, которые были идентифицированы как источники предоставляющие неверную информацию или слишком оптимизированы. Эта идентификация сайтов как предпочтительных и непредпочтительных может быть осуществлена вручную редакторами (например, вводя тестовые запросы и обнаруживая сайты которые вводят в заблуждение) или автоматически с помощью клиентского устройства 110 или сервера 120 или 130 (например, через определение хостов, которые есть в списках иерархических директорий как 'предпочтительные' или 'непредпочтительные').
    Для каждого сайта, который был определен как предпочтительный источник или непредпочтительный, редакторы могут определить параметр редакторского мнения для этого сайта [акт 540]. Как будет описано ниже, более детально, сервер, как например, сервер 120, может использовать параметр редакторского мнения для изменения положения страницы (в результатах: выше или ниже), в зависимости от того является ли сайт в списке предпочтительных или непредпочтительных. Редакторы могут сохранять поисковые темы, критерии поисковых тем, наборы предпочтительных или непредпочтительных страниц/сайтов для каждой поисковой темы, и параметр редакторского мнения для каждого предпочтительного или непредпочтительного страницы/сайта в памяти, например в памяти 330, сервера 120 [акт 550].
    РИС. 6 иллюстрирует примерный процесс, согласующийся настоящим изобретением, для интеграции редакторского мнения при ранжировании результатов поиска. Процесс может начаться на сервере, например, сервере 120, с получения поискового запроса от пользователя [акт 560], содержащего одно или более слов. Пользователь может передать свой запрос на сервер 120 через клиентское устройство 110. Основываясь на запросе, сервер 120 отыскивает релевантные веб страницы и оценивает эти страницы используя стандартные техники [акт 620]. Сервер 120 может, например, дать оценку странице основываясь на количестве ключевых слов на странице. Те страницы, на которых ключевых слов встречается больше могут получить более высокую оценку, чем те, у которых ключевые слова встречаются меньше. Другие традиционные техники, как связанность и общая популярность, также могут быть использованы для определения общих оценок.
    Сервер 120 может определить существует ли редакторское мнение для этого запроса [акт 630]. Для того, чтобы сделать такое заключение, сервер 120 может определить соответствует ли поисковый запрос поисковой теме в базе данных 400. Для того чтобы проверить, соответствует ли поисковый запрос поисковой теме, сервер 120 определяет, соответствует ли поисковый запрос критериям поисковой темы, ассоциируемым с этой поисковой темой. Делая такое определение, сервер 120 определяет есть ли в поисковом запросе одно или более слов ассоциированном с правилом. Например, если поисковый запрос содержит слово 'free' и 'download', сервер 120 определяет, что этот поисковый запрос относится к поисковой теме "sites that provide free software downloads".
    Сервер 120 определяет, соответствует ли поисковый запрос категориям/темам ассоциированным с этой поисковой темой. Для того чтобы это сделать, сервер 120 классифицирует запрос как тот же набор категорий/тем, к которому принадлежит поисковая тема, используя, например, традиционные текст-ориентированные техники. Если сервер 120 отнесет запрос к теме ассоциированной с поисковой темой, поисковый запрос может быть отнесен к этой теме.
    В другой реализации согласующейся с этим изобретением, для классификации запроса, сервер 120 сравнивает страницы выданные по результатам этого запроса со страницами ассоциированными с этой темой. Иерархические директории, такие как Yahoo!, Opne Directory, Google обычно содержат списки страниц по каждой из тем в директории. Эти страницы могут быть использованы для классификации поискового запроса. Сервер 120 сравнивает страницы соответствующие запросу и страницы, по теме определяя (i) текстуальные совпадения, (ii) близость страниц результатов выдачи к страницам по теме в директории. Запрос может быть отнесен к той теме, с которой найдется больше всего совпадений.
    Если сервер 120 определяет, что запрос соответствует поисковой теме, и далее, если для этого запроса существует редакторское мнение, сервер 120 определяет набор сайтов затронутых поисковой темой [акт 640]. Сервер 120 определяет набор затронутых сайтов определяя ассоциируется ли хоть один сайт из полученных результатов с 'предпочтительными' или 'непредпочтительными' источниками ассоциируемыми с этой поисковой темой. Для каждой страницы в наборе результатов положение может измениться в зависимости от того, находится ли она в и в другом наборе, сервер 120 определяет обновленную оценку используя параметр редакторского мнения для этого сайта [акт 650].
    Параметр редакторского мнения для предпочтительных источников, например, повышает оценку веб страницы на процент от ее предыдущей оценки или от абсолютной оценки. Примерно так же процесс происходит и для сайтов из непредпочтительного списка, параметр редакторского мнения может снизить оценку страницы на процент или в абсолютном значении. В исключительных случаях, соответствующий параметр редакторского мнения может поднять страницу на первое место или вообще убрать из результатов выдачи. В другом случае, параметр редакторского мнения может повлиять всего лишь на одну из оценок сайта (например, совпадение текста, родственность страниц, и пр.)
    Как только обновление оценок состоится, сервер 120 предоставляет обновленный список результатов выдачи пользователю [акт 660]. Обновленный список может быть предоставлен пользователю через устройство вывода 270. Если при [акт 630], поисковый запрос не совпадет ни с одной поисковой темой хранящейся в базе данных 400, сервер 120 предоставляет оригинальный (не обновленный) список ранжированных результатов поиска пользователю [акт 660].
    Реализации, согласующиеся с данным изобретением применять редакторское мнение ко всему сайту. Техники, описываемые здесь также предоставляют возможность интеграции с другими техниками оценки сайтов. Например, редакторское мнение можно рассматривать как дополнительный входящий параметр совместно с другими параметрами (совпадение текста, родственность страниц, и пр.), для определения общих позиций. Это приносит лучшие результаты, чем традиционные формы поиска, которые основываются на присутствии ключевого слова в текст на странице. В частности, отдельная страница сайта, может быть оценена как предпочтительный источник (хотя сам сайт таковым и не является), и она получит лучшие позиции по сравнению со страницей с сайта, который является предпочтительным источников (но именно эта страница в список предпочтительных источников не входит).
    Реализация, согласующаяся с этим изобретением также позволяет учитывать и отрицательное мнение. Если страница относится к списку непредпочтительных источников, сервер 120 может понизить ее позиции или убрать из результатов выдачи вообще.
    ЗАКЛЮЧЕНИЕ
    Система и метод, согласующиеся с данным изобретением, улучшают ранжирование результатов поисковой выдачи. Интегрируя редакторское мнение в процесс ранжирования, настоящее изобретение обеспечивает более высокое качество поиска.
    Данное описание и приведенные примеры не претендуют на исчерпывающее представление изобретения, более того, дополнения и модификации не только возможны, но ожидаемы и желательны, если это позитивно повлияет на качество поиска.
    Русский перевод под ред. И.Гурова
    SEO Blog [dot] biz

    КАК СТАТЬ ЛИДЕРОМ ПОИСКА 9-10 ноября состоится семинар

    "Как стать лидером в результатах поиска
    и получить от сайта максимальную прибыль"
    .
    Ведущий - генеральный директор компании VIPRO Олег Сковородников.
    Темы.
    • Немного теории о работе поисковых систем
    • Много практики продвижения сайтов
    • Опыт получения прибыли с помощью сайта
    • Обсуждение сайтов участников семинара
    • Новая тема "Блоги - как их использовать для бизнеса"
    Стоимость участия 7900 рублей.
    Регистрация на сайте http://seminar.vipro.ru/

    ИНТЕРЕСНЫЕ ТЕМЫ ФОРУМА
    Полные посты в RSS или только аннотации? Вопрос, собственно, у меня следующий: каким образом конфигурировать движки блогов, чтобы экспортировали посты полностью или только начало текста?
    Поведение потенциальных покупателей в поиске Благодаря Евгению Трофименко нам уже известны стадии поиска пользователя... я поделил всех потенциальных покупателей на три класса: 1. Ленивые - те, кто вообще ничего не изучают и не спрашивают. 2. Неосведомленные. Этим ясна проблема, но не ясна цена вопроса. 3. Осведомленные...
    Мелкие и неизвестные факторы ранжирования Вот такой вопрос... Возник в ходе проведения группы экспериментов. Общая схема эксперимента следующая... Вопрос, собственно, следующий - по какому фактору прошло первоначальное ранжирование?
    Обсуждения в форумах - "живые". Новые сообщения могут появляться уже после просмотра вами заинтересовавшей темы. Маленький совет: если Вы хотите получать информацию о новых сообщениях в интересующих темах, сделайте две вещи.
    • Зарегистрируйтесь на форуме - http://seochase.com/profile.php?mode=register
    • Авторизуйтесь при входе и на странице с интересующей вас темой кликните по ссылке "Следить за ответами в теме". Извещения о новых ответах станут приходить вам на адрес, указанный при регистрации.
    Увидимся на форуме.

    SEONEWS.RU: Интервью с Виктором Лавренко ""Не нужно делать не хуже, нужно делать лучше!""

    Виктор Лавренко,
    руководитель проекта Nigma.ru


    Алексей Гурешов (Вебальта) утверждал, что для создания поисковой системы нужно 5-6 человек. По опыту Виктора Лавренко, этими людьми могут быть простые студенты. О том, почему "американский пирог" для Nigma слаще, об AJAX технологиях и совместимости научного и коммерческого в интернет-технологиях, Анна Макарова беседовала с одним из создателей интеллектуального поисковика Nigma.ru
    Этой осенью вами обещан запуск нового поискового проекта. Как долго осталось ждать?
    Есть несколько совершенно глупых проблем. Вот коробки, в них серверы, о покупке которых мы заявили. Проблема состоит в том, что нам их просто некуда ставить, пока занимаемся проблемой их хостинга. Не хочется раньше времени говорить о подробностях. Думаю, что в октябре проект будет запущен.
    Расскажите, пожалуйста, что это за проект?
    Проект рассчитан на Штаты, и запускать его мы будем там. Почему не Россия? Просто российский Интернет по своей информационной наполняемости и по своей структуре еще не совсем к этому готов. А в Штатах все уже готово. Это будет новый поисковик, который будет работать совсем по-другому. В ближайшее время мы об этом подробно расскажем. Как и все новое, эта идея - хорошо забытое старое, просто применительно к Интернету ее еще не использовали.
    Новые поисковые системы появляются не каждый день. Вот Вебальта ставит жесткие цели - 30 процентов рынка, а Вы?
    В первую очередь, Nigma - это научный проект. Главное, что нас интересует - это разработка нового, полезного продукта. Поэтому цель и политика у нас немного другие. Но что касается доли рынка, американский рынок настолько большой, что на нем любая доля - уже хорошо. Поэтому наша "жесткая цель" - это создание принципиально новых алгоритмов, что, как мне кажется, у нас вполне неплохо получается...
    Об отношениях Nigma с оптимизаторами, Яндексом и своими пользователями читайте в полной версии интервью на http://www.seonews.ru/interview/25/
    * * * Еще одно интервью с руководителями метапоискового проекта - Metabot - опубликовано на сайте "Балкон", см. http://www.bal-con.ru/cat/metabot_ru/

    ВЕСЕЛАЯ РЕТРОСПЕКТИВА Новая иллюстрация студии Naive - к статье Откуда берутся советы по оптимизации
    * * * "На протяжении недолгой, но бурной эволюции Интернета исторически сложился некоторый зазор между аналитикой поисковых систем как наукой, и оптимизацией сайтов как искусством.

    Большинство представителей оптимизаторского цеха черпают свои профессиональные знания из всевозможных информационно-познавательных ресурсов, очень часто не вдаваясь в подробности - а откуда, собственно, ресурс получил публикуемую информацию. Порою на очередном форуме, посвященном вопросам оптимизации, можно стать свидетелем горячих споров о ключевых моментах работы алгоритмов поисковых систем, однако не всегда в этих спорах рождается истина..."


    КАК ЗАДАТЬ ВОПРОС ЭКСПЕРТАМ?
    Cтатьи, исследования, экспертные ответы и оценки рассылки "Продвижение сайта с опытом экспертов" будут посвящены, прежде всего, тому, что больше интересует вас, наших подписчиков.
    Присылайте свои вопросы и пожелания по адресу subscribe@ashmanov.com. Ждем!
    Успехов Вам!
    Выпуск подготовил Андрей Иванов
    "Ашманов и Партнеры"
     
  2. Rodik

    Rodik Прохожие

Статус темы:
Закрыта.