Очистка контента от ссылок

Тема в разделе "Вопросы новичков", создана пользователем renegad, 24 май 2009.

Статус темы:
Закрыта.
  1. renegad

    renegad Постоялец

    Регистр.:
    16 авг 2008
    Сообщения:
    84
    Симпатии:
    28
    Есть тексты для доров, но в них содержится много ссылок и вставлять их вместе с текстом в дор не хотелось бы, чем можно автоматически очистить текст от всех "http://..." ссылок?
     
  2. ne0zx

    ne0zx

    Регистр.:
    1 ноя 2008
    Сообщения:
    212
    Симпатии:
    74
    Search and Replace есть софтина, заменяет все что хочешь в куче файлов.
     
  3. renegad

    renegad Постоялец

    Регистр.:
    16 авг 2008
    Сообщения:
    84
    Симпатии:
    28
    Эту софтину я активно использую :) Но видимо не знаю всего ее потенциала и использую только для того чтобы просто заменить одну строчку на другую, каким образом можно с помощью нее удалить все ссылки (а они все разные: может быть Перейти по ссылке
     
  4. bikan

    bikan Постоялец

    Регистр.:
    28 мар 2008
    Сообщения:
    55
    Симпатии:
    1
    С помощью её ссылки все не удалиш, если текст англоязычный, можно лиш удалить к примеру префикс http:// Вставляеш его в поле замены, а замещающее поле оставляеш пустым. Так же можно удалить .ru, .html и тд.

    Если же тексты у вас русские, то можно попробовать удаление по каждой латинской букве, к примеру сначало "a" удалил из всего текста, потом "b" и тд, долго конечно, но должно получиться.
     
    renegad нравится это.
  5. renegad

    renegad Постоялец

    Регистр.:
    16 авг 2008
    Сообщения:
    84
    Симпатии:
    28
    Текст у меня русский, спасибо за предложенный вариант решения этой проблемы, буду пробовать заменять по одной букве, других вариантов я пока не вижу.
     
  6. SolutionFix

    SolutionFix 17 лет програмлю ;)

    Регистр.:
    20 ноя 2006
    Сообщения:
    272
    Симпатии:
    318
    О ужас.... Любой редактор с функцией замены куска текста по regexp или маске.
    Например notepad++ (поддерживает тока стандарт POSIX, поэтому регексп несколько неизящный) с регуляркой <a +href=([^>]+)>[^<]+</a> удалит все ссылки.

    Если редактор поддерживает PRCE ((более родвинутый стандарт регулярных выражений) - то регулярка вообще записывается вот так <a.*?/a>
     
    renegad и ne0zx нравится это.
  7. Piranha

    Piranha

    Регистр.:
    1 дек 2008
    Сообщения:
    534
    Симпатии:
    69
    а есть полный мануал по таким вот манипуляциям в блокноте ?
    сорри за отфтоп...
     
  8. Rastafan

    Rastafan

    Регистр.:
    1 фев 2008
    Сообщения:
    649
    Симпатии:
    169
    гугли на тему регулярные выражения ;)
     
  9. renegad

    renegad Постоялец

    Регистр.:
    16 авг 2008
    Сообщения:
    84
    Симпатии:
    28
    Дело в том, что все ссылки в тексте идут обычным текстом без тегов "<a href=></a>" как их тогда удалить регэкспом?
     
  10. White Knight

    White Knight Создатель

    Регистр.:
    12 май 2009
    Сообщения:
    38
    Симпатии:
    9
    В урлах пробелов нет? Тогда удаляй кусок от http до следующего пробела. Можно, скажем, в "Словогрызе" (на мой взгляд удобная программка) масками, примерно вот так:
    Код:
    http\*\_
     
    renegad нравится это.
Статус темы:
Закрыта.