Как напарсить больше кеев ?

Статус
В этой теме нельзя размещать новые ответы.

ZavodiJIo

Постоялец
Регистрация
26 Авг 2008
Сообщения
123
Реакции
2
Парсю кеи магаданом с вордстата яши. Всё вродебы хорошо, но парсит он довольно мало кеев. с 17к кеев после чистки остаёться 2-2.5к кеев. Собстна вопрос, можно ли спарсить больше кеев (может каким сторонним софтом). Ну или прошу выложить базу эдулт кеев русских (побольше). Заранее благодарю. :thenks:
 
Дак вбивай больше запросов на парсинг
И еще, в нем же можно в отдельный файлик сохранять то, что ищут вместе с ним, из этого тоже потом можно навыбирать высокочастотников, по которым потом попарсить...
 
swed прав

а сторонним методом, лезь в выдачу ищи чужие доры и дергай из них через сайт мап ключевики...можно довольнотаки большую базу собрать с учетом того что некоторые выкладывают доры с пагами более 5к...
 
Парсю кеи магаданом с вордстата яши. Всё вродебы хорошо, но парсит он довольно мало кеев. с 17к кеев после чистки остаёться 2-2.5к кеев. Собстна вопрос, можно ли спарсить больше кеев (может каким сторонним софтом). Ну или прошу выложить базу эдулт кеев русских (побольше). Заранее благодарю. :thenks:

парсишь магаданом по эротике, порно, сексу и т.п., а потом что все что напарсилось чистишь и добавляешь в очередь для парсинга, еще стоит посмотреть что спарсилось в "Что еще искали люди, искавшие это слово:"

вот ссылка на видео как парсить Магаданом:
 
Раньше можно было по 5к кеев загружать в парсилку. Магадан прога простецкая как бревно, и оч удобная, Вобщем если ставить таймаут 10 сек, то за неделю парсинга, можно пол ляма напарсить, стабильно, и без бана, удобно еще то, что можно парсить сохраняя частотность запросов.

я загружал и 10к и 30к кеев в парсилку, а таймаут ставил 7-8 секунд нормально парсилось без банов, а вот если меньше поставить то быстро бан получишь, так что 8 сек нормальный таймаут.
 
ещё один неплохой способ, тоже для магадана:
*** скрытое содержание ***

дык если из этой базы сделать выборку, почистить, все дела, то и в магадан не надо будет засовывать ? :)
 
*** скрытое содержание ***

э? простите но при чём тут секатор ? он же дупликаты удаляет, так его функцию прекрасно выполняет KWK и excel. Дупликаты это вообще само собой разумееться. Скачал большую базу с newox сделал выборку, но ничего хорошего не увидел. Слишком много слов типа "канал" и прочего мусора. Парсить самому выходит намного эфективнее.
 
э? простите но при чём тут секатор ? он же дупликаты удаляет, так его функцию прекрасно выполняет KWK и excel. Дупликаты это вообще само собой разумееться. Скачал большую базу с newox сделал выборку, но ничего хорошего не увидел. Слишком много слов типа "канал" и прочего мусора. Парсить самому выходит намного эфективнее.

 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху