1. Задавайте здесь вопросы о коде, которые не подходят в другие разделы, такие как:
    Дизайн > Верстка
    PHP > Как сделать на PHP
    Скрыть объявление

Как достать ключевики из текста?

Тема в разделе "Web Coding", создана пользователем roddik, 27 авг 2007.

Статус темы:
Закрыта.
Модераторы: latteo
  1. roddik

    roddik Колбаска

    Регистр.:
    26 янв 2007
    Сообщения:
    351
    Симпатии:
    285
    ПРивет! Есть такая хрень https://adwords.google.com/select/KeywordToolExternal
    В нее можно ввести текст и получить присутствующие в нем ключевики. Есть ли какой-то алгоритм, чтобы выдавал схожие результаты?
     
  2. nnmkayf

    nnmkayf

    Регистр.:
    25 июл 2007
    Сообщения:
    153
    Симпатии:
    98
    Не совсем ясно в чем именно проблема, я вижу ряд потенциальных проблем:
    1) на странице капча, причем помоему автоматической распознавалки для нее нет.
    2) Запрос делается с помощью AJAX, соответственно, нужно эмулировать запрос аналогично
    3) Возможно серверная часть к AJAX смотрит на реферер или какие то специфические поля. Чтобы уточнить нужно для FireFox поставить плагин Live http Headers и запрашивать серверную часть полностью, досконально скопировав запрос.

    p.s. Тема интересная, предлагаю тебе выложить скрипт с которым возникли проблемы, мы коллективно доработаем его и будем иметь очередную SEO тулзу.
     
    roddik нравится это.
  3. akhkharu

    akhkharu Постоялец

    Регистр.:
    26 июн 2007
    Сообщения:
    111
    Симпатии:
    12
    Я думаю такая парсилка рано или поздно будет все равно написана в связи с трагической гибелью овертюры
     
  4. webjema

    webjema Создатель

    Регистр.:
    1 сен 2007
    Сообщения:
    46
    Симпатии:
    6
    Помоему человек просто спрашивал есть ли что-то подобное с подобным алгоритмом. А не как выковырять результат с гугла =)
     
  5. vopr

    vopr Создатель

    Регистр.:
    14 сен 2007
    Сообщения:
    10
    Симпатии:
    5
    +1, если бы была парсилка, то овертюре пришел бы конец.
    а проблемма как раз таки в капче.
    если вы напишете распознователь к ней - у вас есть все предпосылки к тому чтобы стать если не миллионером - то достаточно богатым человеком.
     
  6. akhkharu

    akhkharu Постоялец

    Регистр.:
    26 июн 2007
    Сообщения:
    111
    Симпатии:
    12
    Каптчи разные бывают и к некоторым типам уже есть распознаватель (тот же Хрумер, например)
     
  7. terkin

    terkin

    Регистр.:
    9 дек 2006
    Сообщения:
    513
    Симпатии:
    162
    Там как раз такая капча как и в гугле, ботмастер сейчас работает над её распознаванием но пока вродебы безрезультатно
     
  8. censored!

    censored!

    Регистр.:
    3 авг 2007
    Сообщения:
    293
    Симпатии:
    106
    Они там грамотно все сделали. Капча, хрен пакет перехватишь (из-за https), и т.п. Кто-нить там долго ковырялся? Через сколько запросов капча выводится?
     
  9. lobzik

    lobzik

    Регистр.:
    8 авг 2006
    Сообщения:
    311
    Симпатии:
    49
    Как я понял ТС ищет алгоритм... Берешь текст фильтруешь html и стоп слова, затем получившейся текст разбиваешь на слова. Я правда незнаю как правильно реализовать сортировку используя словоформы - это уже другой вопрос. Готовые классы для работы с ключевиками видел на www.phpclasses.org в разделе SEO.
     
  10. Jeurey

    Jeurey

    Регистр.:
    13 сен 2006
    Сообщения:
    419
    Симпатии:
    576
    Для 1-го словных ключей:
    PHP:
    $string strtolower($content);
                
    $string strip_tags($string);
                
    $string    str_replace('.',     '',     $string);
                
    $string    str_replace('>',     '',     $string);
                
    $string    str_replace('!',     '',     $string);
                
    $string    str_replace('?',     '',     $string);
                
    $string    str_replace(',',     '',     $string);
                
    $string    str_replace(':',     '',     $string);
                
    $string    str_replace(';',     '',     $string);
                
    $string    str_replace('-',     '',     $string);
                
    $string    str_replace('"',     '',     $string);
                
    $string    str_replace('(',     '',     $string);
                
    $string    str_replace(')',     '',     $string);
                
    $string    str_replace('@',     '',     $string);
                
    $string    str_replace('\'',    '',     $string);
                
    $string    str_replace('\\',    '',     $string);
                
    $string    str_replace('\/',    '',     $string);
                
    $string    str_replace('%',    '',     $string);
                
    $string    str_replace('`',    '',     $string);
                
    $string    str_replace('~',    '',     $string);
                
    $string    str_replace('+',    '',     $string);
                
    $string    str_replace('=',    '',     $string);
                
    $string    str_replace('_',    '',     $string);
                
    $string    str_replace('1',    '',     $string);
                
    $string    str_replace('2',    '',     $string);
                
    $string    str_replace('3',    '',     $string);
                
    $string    str_replace('4',    '',     $string);
                
    $string    str_replace('5',    '',     $string);
                
    $string    str_replace('6',    '',     $string);
                
    $string    str_replace('7',    '',     $string);
                
    $string    str_replace('8',    '',     $string);
                
    $string    str_replace('9',    '',     $string);
                
    $string    str_replace('0',    '',     $string);
                
    $string    str_replace('\n',    '',     $string);
                
    $string    str_replace('\t',    '',     $string);
                
    $string    str_replace('\b',    '',     $string);
                
    $string    str_replace('\0',    '',     $string);
                
    $string    str_replace('\x0B',    ''$string);
                
    $string    str_replace('  '' ',     $string);
                
    $keywords    explode(' ', &$string);
                foreach (
    $keywords as $key=>$word)
                {    if (
    strlen($word) > 2// простейший фильтр стоп слов
                    
    {    $words[]=$word;
                    }
                }
    Попросите Dogmat - он дорабатывал данный алгоритм (вернее - переписывал на регулярку :D ) генерации meta-keywords, ибо это кривой вариант. Но, для того чтобы понять, как ключи вытаскиваются - понятно. :)
     
Статус темы:
Закрыта.