Скрипт парсинга текста?

Тема в разделе "Как сделать...", создана пользователем trembita, 30 сен 2009.

Статус темы:
Закрыта.
  1. trembita

    trembita Постоялец

    Регистр.:
    29 мар 2007
    Сообщения:
    124
    Симпатии:
    8
    есть простая задача, сграбить с сайта цены, все они представлены в таком виде:

    <th colspan="2" align="right">Артикул:111</th>
    <span class="productPrice">460руб</span>

    идеальным вариатном было бы экспортировать, их в 2колонки в excel.

    как такое можно сделать?
     
  2. Tretiy

    Tretiy Постоялец

    Заблокирован
    Регистр.:
    10 дек 2007
    Сообщения:
    81
    Симпатии:
    9
    Регулярными выражениями.
    Пишите в раздел Regex
     
  3. tostrss

    tostrss

    Регистр.:
    16 окт 2007
    Сообщения:
    771
    Симпатии:
    217
    2Tretiy харош флудить


    если тема еще актуальна, то можно сделать так:

    Парсим все значения в файл, через табуляцию, потом в экселе импортируем файл этот и там автоматически даннные разобьются на две колонки.

    Второй вариант сложнее, использоть COM объект для работы с экселем.

    PHP:
    $file fopen('log.txt''w');
    preg_match_all('%<th[^>]+>(.*?)</th>\s*<span class="productPrice">(.*?)</span>%is',  $text$ret); 

    for (
    $i =0$size sizeof($ret[1]); $i $size; ++$i) {
        
    fwrite($file$ret[1][$i]."\t".$ret[2][$i]."\r\n");
    }
    fclose($file);
    echo(
    'done');
     
Статус темы:
Закрыта.