Вопросы с тегом «character-properties»

217
JavaScript + Юникод регулярные выражения

Как я могу использовать регулярные выражения с поддержкой Юникода в JavaScript? Например, должно быть что-то похожее на \wто, что может соответствовать любой кодовой точке в категории «Буквы или метки» (не только ASCII), и, надеюсь, иметь фильтры типа [[P *]] для пунктуации и т....

126
Эквиваленты Unicode для \ w и \ b в регулярных выражениях Java?

Многие современные реализации регулярных выражений интерпретируют \wсокращение класса символов как «любую букву, цифру или соединительную пунктуацию» (обычно: подчеркивание). Таким образом, регулярное выражение , как \w+спички слова , как hello, élève, GOÄ_432или gefräßig. К сожалению, в Java нет....

83
Python и регулярное выражение с Unicode

Мне нужно удалить некоторые символы Юникода из строки 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Я точно знаю, что они здесь есть. Я старался: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ') но это не работает. Строка остается прежней. Что я...