Редактирование списка

Тема в разделе "Мегафлуд", создана пользователем Surprise, 28 сен 2015.

  1. Surprise

    Surprise

    Регистр.:
    13 мар 2012
    Сообщения:
    331
    Симпатии:
    125
    Вообщем у меня есть база номеров телефонов, количество - порядка 400 000. Записаны все в разных форматах:
    +Х(ХХХ)1234567 / (ХХХ)1234567 / (ХХ)1234567 , а так же присутствует мусор типа 77777777 и.т.д

    Что нужно:
    1. Редактировать список по определенной маске, чтобы номер получится в формате ХХ1234567
    2. Удалить дубли

    Как реализовать?
     
  2. ykpon

    ykpon

    Регистр.:
    8 дек 2012
    Сообщения:
    249
    Симпатии:
    143
    Сперва в файле, например через notepad++, удаляешь все +Х.
    Там должны они быть либо все +7 либо максимум 9 вариантов, думаю. +8, +6 и т.п. Так ведь?
    Потом можно с помощью php и говнокода заменить в каждой строке первые 3 цифры на нужные 2.
    Код:
    $file = file_get_contents('baza.txt');
    foreach($file as $line):
    if(strlen($line) == 10):
    echo mb_substr($line, 1)."<br>";
    else:
    echo $line;
    endif;
    endforeach;
    Выведет на страницу нужный тебе результат из первого пункта.
    Можно в файл записать результат:
    Код:
    $file = file_get_contents('baza.txt');
    foreach($file as $line):
    if(strlen($line) == 10):
    file_put_contents("result.txt", mb_substr($line, 1), FILE_APPEND);
    else:
    file_put_contents("result.txt", $line, FILE_APPEND);
    endif;
    endforeach;
    А для удаления дубликатов есть онлайн сервисы. Ну и готовые скрипты на пыхе тоже есть.
     
    Surprise нравится это.