скрипт порезки базы по уникальным урлам

Статус
В этой теме нельзя размещать новые ответы.

deling2

Мой дом здесь!
Регистрация
27 Янв 2008
Сообщения
327
Реакции
307
Народ, надо скрипт для порезки базы по уникальным урлам.
Допустим есть база в 1к, в ней намешано 20 урлов одного домена, 10 другого и т.д.
Надо чтоб скрипт разбил эту базу по доменам. Тойсть в каждый текстовый файл вкладывал урл одного домена только лишь один раз. Очень надо :confused:
 
ну так это же парсер О_о
Там есть конечно пару инструментов для обработки базы, но даже близко нет того, что мне надо :(
 
Формат базы? Размер базы (в мегабайтах, если это файл и тысячах записей если SQL)
вообще это не "ищу скрипт" скорее всего, а помогите написать/напишите :)
Расскажи про базу поподробнее..
 
База небольшая, до мегабайта даже, в среднем ~700кб
Формат txt.

вообще это не "ищу скрипт" скорее всего, а помогите написать/напишите
скорее напишите :D

Шучу конечно, думаю все же есть подобная программа, просто я о ней не знаю :) Большинство прог и скриптов которые я искал, на самом деле уже были давно написаны, а некоторые даже на форуме имелись.
 

ох уж эти мне пользователи :)
Отсутствие четкого ТЗ это просто ужас :)
Просил же - подробнее.
В примерах пожалуйста.
Например: Скрипт вызывается из командной строки (или наоборот через браузер) и берет из фиксированного места файл (или получает его из формы в браузере, или получает через параметры командной строки путь где лежит исходный файл). Этот файл содержит строки вида:
Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
и т.п. (или например без префикса http:// а сразу "домен/страница.html" также надо сказать бывают ли варианты что домен пишется и с www и без него, и считать ли это разными доменами..)

на выходе скрипт выдает файл в фиксированном месте (сливает браузером, сохраняет в месте переданном в параметрах, выводит на стандартный вывод) файл в котором в начале идут все ссылки первого домена, потом второго, потом третьего и так далее... (или сохраняются в отдельные файлы, но тогда описать как формируется название файла.. например название файла это название домена..)

Вот чтото типа такого напиши, тогда уж 10-15 минут можно буде твыделить на написание :)
 
Ладно сформулирую четко:


Скрипт вызывается из браузера, лежит на сервере. Текстовый файл лежит в том же каталоге, например base.txt.
В файле строки разных видов

Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся

Где колличество строк 5-10к, а уникальных доменов(сабдоменов) от 5 до 100
На выходе получаются файлы base1.txt, base2.txt, base-n.txt
Разбивается base.txt таки образом на файлы, чтобы в каждом конечном файле домен или сабдомен повторялся один лиш раз.
Например
base1.txt
Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся

base2.txt
Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся


Первый раз ТЗ пишу :)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху