Выдрать ссылки из страницы

Статус
В этой теме нельзя размещать новые ответы.

dig555

Постоялец
Регистрация
22 Июн 2007
Сообщения
365
Реакции
160
Ребята, подскажите тулзу или способ. Нужно посмотреть все ссылки на указанной странице. И нужные из них сохранить в файл. Вручную, блокнотом не прдлагать ибо их там дофуя.
 
Попробуй DownloadMaster, импортирует все ссылки с предложенной страницы и делает тебе список из которого ты сам выбираешь что надо что не надо. Просто и вроде достаточно оптимально.
 
зайди оперой на нужную страницу и нажми ctrl+j
 
Ребята, подскажите тулзу или способ. Нужно посмотреть все ссылки на указанной странице. И нужные из них сохранить в файл. Вручную, блокнотом не прдлагать ибо их там дофуя.
Простым скриптом на перл:
Код:
#!/usr/bin/perl

use HTML::Parser;

my $file = shift;
chomp $file;

open F, "<$file" or die "Cannot open $file: $!\n";
@lines = <F>;
close F;

my $parser = new HTML::Parser;

$parser->handler (start => \&print_link, 'tagname,attr');
$parser->parse($_) for @lines;
$parser->eof;

sub print_link {

        my ($tagname, $attr) = @_;

        if ($tagname eq 'a') {
                print "link: " . $attr->{href} . "\n";
        } elsif ($tagname eq 'img') {
                print "img: " . $attr->{src} . "\n";
        }
}

[wiltner@desktop] /home/wiltner/scripts/links-parser> ./geturl.pl linuxforum_topic31841.html | head -5
link: Для просмотра ссылки Войди или Зарегистрируйся
link: Для просмотра ссылки Войди или Зарегистрируйся
link: Для просмотра ссылки Войди или Зарегистрируйся
link: Для просмотра ссылки Войди или Зарегистрируйся
link: Для просмотра ссылки Войди или Зарегистрируйся
Скрипт покажет как атрибут "href" тега <a>, так и "src" <img>. При желании, разумеется, ненужное можно отключить. А также настроить под свои нужды.
 
1

я выдираю если по быстрому то сохранив страничку по F3 Total commander - сохранить ссылки, а если не удобно,то через Flashget: File- Import Html там можно сразу и скачать эти ссылки...
 
Качалкой ReGet правый клик мыши по странице сайта, из пункта выпадающего меню выбираем "Скачать все" и видим все ссылки...
 
Firefox->Tools->Page info (Ctrl-Shift-P)->Links
далее select all, copy etc
 
Links Extractor 1.2 – ищет и извлекает линки (URL или Email) со страниц или файлов.
Программа может: просмотреть линк в виде собственно линка, html кода или кода bb code. Вы сможете отсортировать извлеченные линки, автоматически удалить http:// и сохранить итоговый файл в HTML или текстовом формате.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху