У Googl'a проблемs с логикой? или почему не сходятся результаты запросов ...

Тема в разделе "Вопросы новичков", создана пользователем Juror, 3 ноя 2009.

Статус темы:
Закрыта.
  1. Juror

    Juror Постоялец

    Регистр.:
    3 сен 2009
    Сообщения:
    76
    Симпатии:
    35
    Собственно на ночь глядя решил немного подправить (доработать под себя)скрипт поиска количесва проиндексированых страниц (для определения трастовых фрих) а заодно и поупражнятся в кодинге ПХП. Стоит простая задача - имея список фрих (около 150 шт), проверить количество проиндексированых с них Гуглом страниц:
    1. всего (запрос типа - "http://www.google.com/search?num=10&hl=us&q=site%3AИМЬЯСАЙТА.ДОМЕН"),
    2. за месяц (запрос типа - "http://www.google.com/search?num=10&hl=us&as_qdr=m&q=site%3A[/COLOR]ИМЬЯСАЙТА.ДОМЕН"),
    3. за неделю (запрос типа - "http://www.google.com/search?num=10&hl=us&as_qdr=w&q=site%3A[/COLOR]ИМЬЯСАЙТА.ДОМЕН"),
    4. за сутки (запрос типа - "http://www.google.com/search?num=10&hl=us&as_qdr=d&q=site%3A[/COLOR]ИМЬЯСАЙТА.ДОМЕН")Ю

    Но быть дописаным скрипту сегодня видимо не судилось. Для отладки как назло взял сайт самого Гугла - www.google.com/
    И что мне выдал Гугля?? Что в свой индекс своих же страниц он забросил:
    1. всего - 169,0 млн. стр.;
    2. за последний месяц, - 33,2 млн. стр.;
    3. за последнюю неделю, - 36,2 млн. стр.;
    4. за последних 24 ч. (сутки) - 30,4 млн. стр.;
    Выходит, что за последнюю неделю он проиндексировал больше чем в целом за месяц. (Немного утрируя и выражаясь на другом примере выходит что дитя выросло за месяц на 33,2 мм. в.т.ч (при этом) только за последнюю неделю на 36,2 мм.) :eek:

    Поломав пару часиков над конструкцией запросов голову, я так и не нашел ответа на вопрос - кто из нас (я или Гугл) больше тупит?

    Надо отметить что подобные нестыковки я конечно наблюдал и раньше, но не придавал им особого значения (да и надобности большой не было). Но поскольку стоит задача написать скрип для проверки трастовости фрих и дабы не били по роже за несоотвествие результатов его работы действительности (когда выложу в паблик),
    прошу всех осведомленных выразить свои мысли по поводу причин нестыковки выдачи серпа в зависимости от временнОго диапазона запроса.

    Другими словами как строить запрос гуглу, что б он отвечал правдиво, сколько он проидексировал за тот или иной период времени страниц того или иного сайта/домена?
     
  2. IgVan

    IgVan

    Регистр.:
    8 май 2008
    Сообщения:
    212
    Симпатии:
    54
    Правильно все выдает гугль. Не будет же он при каждом запросе пересчитывать количество проиндексированных страниц с точностью до одного.
    А почему выросло? Нигде не сказано что он добавил в индекс это количество НОВЫХ страниц, просто было проиндексировано такое количество страниц. Порядок чисел показал и хорошо, видно закралась небольшая ошибка в его расчеты, а может из-за того, что "последний месяц" - это октябрь, а "последняя неделя" закончилась 1 ноября. Если определять для своего сайта, где количество страниц не исчисляется миллионами, то значения будут намного точнее. Если чекать фрихи на бонусность, то такая точность тоже не нужна, тут примерный порядок чисел знать вполне достаточно. ИМХО, забей и пользуй то что гугль выдает.
     
  3. Juror

    Juror Постоялец

    Регистр.:
    3 сен 2009
    Сообщения:
    76
    Симпатии:
    35
    :D Ясно что не персчитывает. Да никто и не говорил. Вопрос в другом стоял.
    Даже отбросив разницу "добавил новых" или "проиндексировал", стоит вопрос как так может быть:
    Часть от целого больше чем целое??
    Коллега, сложилось впечатление что Ваш пост создан чисто ради набивания количества постов.
    Или между строк Ваш ответ необходимо читать "Гугл иногда тупит. Это для него нормально?" ;)
     
Статус темы:
Закрыта.