Регулярка для поиска не буквенных символов "непонятного происхождения"

Тема в разделе "Регулярные выражения", создана пользователем Q_BASIC, 17 апр 2015.

Модераторы: xpert13
  1. Q_BASIC

    Q_BASIC

    Регистр.:
    30 ноя 2013
    Сообщения:
    352
    Симпатии:
    223
    Здравствуйте! :)

    Есть ли какая-то регулярка для поиска таких символов:
    ۩ ✳✳ ♦ ☑
    И так далее...

    Что-бы регулярка не реагировала на любые буквы (англ/рус), знаки препинания и прочие символы употребляемые в обычной жизни.

    И не реагировала на символы на подобие этих: !@#$%^&*(){}[]\|/
     
  2. lag

    lag

    Регистр.:
    13 окт 2014
    Сообщения:
    188
    Симпатии:
    227
    Для юникода есть конструкции:
    \p{атрибут} - символ, обладающий указанным атрибутом.
    \P{атрибут} - символ, не обладающий атрибутом.

    \p{S} - различные декоративные элементы и знаки, но туда попадают и знаки +$|^=`~<>.
    Решить можно так
    Код:
    ([^\P{S}+<>$|^=`~]+)
    
    Хотя возможно будет лучше такой атрибут
    \p{So} - различные декоративные символы, псевдографика, азбука Брайля и т.д.
    Код:
    (\p{So})
     
    Последнее редактирование: 18 апр 2015
    xpert13, Q_BASIC и latteo нравится это.
  3. CAPAXA

    CAPAXA

    Регистр.:
    7 июн 2007
    Сообщения:
    896
    Симпатии:
    535
    Q_BASIC и latteo нравится это.