Я много искал, но нигде не написано, как удалить не-ASCII символы из Notepad ++.
Мне нужно знать, какую команду написать в find и заменить (с картинкой было бы здорово).
Если я хочу создать белый список и добавить в закладки все слова / строки ASCII, чтобы не-ASCII строки были отмечены
Если файл довольно большой и не может выбрать все строки ASCII, а просто выбрать строки, содержащие символы, не входящие в ASCII ...
Encoding->Encode in ANSI
. Не смог найти ничего другого.В Notepad ++, если вы перейдете в меню « Поиск» → « Найти символы в диапазоне» → « Не-ASCII-символы» (128–255), вы можете перейти к документу до каждого не-ASCII-символа.
Обязательно отметьте галочкой « Обтекание », если хотите зациклить документ для всех символов, не относящихся к ASCII.
источник
В дополнение к ответу ProGM, если вы видите символы в полях типа NUL или ACK и хотите от них избавиться, это контрольные символы ASCII (от 0 до 31), вы можете найти их с помощью следующего выражения и удалить их:
Чтобы удалить все не-ASCII И ASCII управляющие символы, вы должны удалить все символы, соответствующие этому регулярному выражению:
источник
\x00
и\x1F
уже совпадают в ответе ProGM.mgsub("[^\x1F-\x7F]+", "", text_vector, fixed = FALSE)
Чтобы удалить все символы не ASCII, вы можете использовать следующую замену:
[^\x00-\x7F]+
Чтобы выделить символы, я рекомендую использовать функцию « Отметить» в окне поиска: она выделяет не-ASCII символы и ставит закладку в строках, содержащих один из них.
Если вы хотите выделить и поставить закладку на символы ASCII, вы можете использовать регулярное выражение
[\x00-\x7F]
для этого.ура
источник
Чтобы сохранить новые строки:
Следующий:
Теперь выберите «Заменить» и «Заменить» на «\ n».
:) теперь у вас есть чистый файл ASCII;)
источник
Еще один хороший трюк - перейти в режим UTF8 в редакторе, чтобы вы могли увидеть этих забавных персонажей и удалить их самостоятельно.
источник
По-другому...
Это хорошо, если вы не можете вспомнить регулярное выражение или не хотите его искать. Но регулярное выражение, упомянутое другими, также является хорошим решением.
источник