База кеев, отсеить

Тема в разделе "PHP", создана пользователем phillip, 3 май 2010.

Статус темы:
Закрыта.
Модераторы: latteo
  1. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    В файле набор строк. база кеев вообщем

    #1 DVD Audio Ripper v1.0.48
    #1 DVD Audio Ripper v1.0.7
    #1 DVD Audio Ripper v1.0.9
    #1 DVD Audio Ripper v1.1.3
    #1 DVD Ripper SE v1.3.28
    #1 DVD Ripper SE v1.3.30
    #1 DVD Ripper v1.1
    #1 DVD Ripper v1.2.07
    #1 DVD Ripper v1.3.
    #1 DVD Ripper v1.3.11
    #1 DVD Ripper v1.3.13
    Задача- отсеить так, чтобы остались только названия прог, без версий. Хм... Как-то думаю надо сравнивать степень похожести строк, и если сильно похожи- то вторую которая похожа, удаляем. Вот только как это организовать :bc:
     
  2. FlashBlack

    FlashBlack Постоялец

    Регистр.:
    19 сен 2006
    Сообщения:
    77
    Симпатии:
    45
    м.. если учесть, что идёт нумерация кеев с #N, а версия начинается с vВЕРСИЯ, то легко можно составить регулярку вида:
    PHP:
    preg_match_all('|\#[0-9^\s]+(.*)\sv[0-9\.]|isU'$content$output);
     
    phillip нравится это.
  3. phillip

    phillip

    Регистр.:
    4 сен 2007
    Сообщения:
    413
    Симпатии:
    15
    мм... там это не всегда совпадает. надо как-то чтобы не учитывая этого)
     
  4. Belial

    Belial

    Регистр.:
    1 фев 2010
    Сообщения:
    236
    Симпатии:
    113
    PHP:
    preg_match_all('.*? (.*) .*|'$content$output);  
    Может тогда так? Основная мысль - отбросить то, что до первого пробела и то, что после последнего.
     
    phillip нравится это.
Статус темы:
Закрыта.