Узнать whois данные для >10000000 доменов

Juri

Мой дом здесь!
Заблокирован
Регистрация
5 Окт 2007
Сообщения
1.064
Реакции
200
  • Автор темы
  • Заблокирован
  • #1
Здравствуйте, в общем задача такая есть порядка 10000000 доменов, в основном ру нужно прочекать их whois данные и положить это все в базу. У кого есть какие предложения как это можно сделать?
 
Заказать у кого-то :)
А так распараллеливание скриптами как самих запросов так и парсеров ответов, отпимизированая ОС, долгоживущие скрипты. БД, которая будет работать только с этим заданием, если таблица типа MyISAM, то разбивка на разные таблицы, ну или если файловая система для хранения ответов, то хранить ответы в разных подпапках, а то будет затормаживаться обращение к файлам, когда в одной папке файлов много.
Недавно парсил 500к доменов в зоне .com, под виндой на пхп, при этом на фоне крутилось еще кучка всего, вроде за часок все было готово. Но учти, что скорей всего обработка такого кол-во данных, возможно займет часов 6+, и плюс подготовка данных тоже займет времени прилично.
 
  • Автор темы
  • Заблокирован
  • #3
Заказать у кого-то :)
А так распараллеливание скриптами как самих запросов так и парсеров ответов, отпимизированая ОС, долгоживущие скрипты. БД, которая будет работать только с этим заданием, если таблица типа MyISAM, то разбивка на разные таблицы, ну или если файловая система для хранения ответов, то хранить ответы в разных подпапках, а то будет затормаживаться обращение к файлам, когда в одной папке файлов много.
Недавно парсил 500к доменов в зоне .com, под виндой на пхп, при этом на фоне крутилось еще кучка всего, вроде за часок все было готово. Но учти, что скорей всего обработка такого кол-во данных, возможно займет часов 6+, и плюс подготовка данных тоже займет времени прилично.

А инструментом которым парсили свои домены не поделитесь?
 
А инструментом которым парсили свои домены не поделитесь?
Ну ведь вопрос был как реализовать ;)
А так сам писал сей инструмент, и он особо не предназначен для передачи в другие руки.
 
Такие вещи лучше писать на компилируемом языке (С++, Delphi...), т.к. тут необходима скорость и долгоживучесть.

Можем договориться, сделаю.
PS. Киберсквотинг - нехорошо:smmne:
 
  • Автор темы
  • Заблокирован
  • #6
Такие вещи лучше писать на компилируемом языке (С++, Delphi...), т.к. тут необходима скорость и долгоживучесть.
Можем договориться, сделаю.
PS. Киберсквотинг - нехорошо:smmne:
Ситуация такова, что для меня оптимальный вариант сделать это в связке php и mysql просто хотел узнать какой именно whois лучше парсить, что б не побанили сразу за большое количество запросов
 
Я делал Perl POE и чекало за 5 минут 1к (одновременно чекает) на пхп пока что нет событийных машин.
Напишите в жабер если интересно nagual@xmpp.jp
 
Назад
Сверху