Что означают STX, SOH и GS в выходных данных Notepad ++?

20

После просмотра источника MIME для электронной почты (предположительно, содержащего международные символы), я вижу такие вещи в Notepad ++

введите описание изображения здесь

Я понимаю, что CRLFэто перевод строки, но как насчет других? Что SOH, GSи STXсреднее значение?

Майк Б
источник

Ответы:

19

Notepad ++ использует эти символы для представления управляющих символов или непечатных символов.

Управляющий персонаж - Википедия

Управляющий символ или непечатный символ - это кодовая точка (число) в наборе символов, которая не представляет собой письменный символ.

C0 и C1 контрольные коды - Википедия

STX - начало текста - первый символ текста сообщения, и может использоваться для завершения заголовка сообщения.

SOH - Start of Header - Первый символ заголовка сообщения.

GS - Разделитель групп - Может использоваться в качестве разделителей для маркировки полей структур данных. Если используется для иерархических уровней, US является самым низким уровнем (для разделения элементов данных в виде простого текста), в то время как RS, GS и FS имеют повышающийся уровень для разделения групп, состоящих из элементов уровня ниже этого.

Стивен
источник
Хм ... Я запутался, почему заголовки письма могут содержать непечатный символ. Было бы правильно интерпретировать это предыдущее описание как «управляющий символ или непечатаемый символ - это кодовая точка (число) в наборе символов, которая не представляет письменный символ ASCII».
Майк Б,
Я не знаком ни со спецификациями для заголовков почты, ни с тем, почему они могут содержать непечатаемые символы. Однако Notepad ++ использует свои собственные символы (как вы показали) для отображения этих управляющих символов.
Стивен
Непечатные символы отображаются в заголовке X-Example внутри кавычек. Этот заголовок не является частью какого-либо стандарта электронной почты (см. Stackoverflow.com/questions/14469110/… ). Он будет установлен либо клиентом, который создал электронную почту, либо, возможно, одним из транспортов по пути. В любом случае, что касается обработки электронной почты, это фактически комментарий, и это может быть что угодно. Как будто кто-то нарисовал маленькое сердечко на конверте - это не часть почтового стандарта и не влияет на доставку вообще.
Рэнди Оррисон
... ну, конечно, до тех пор, пока это не сломает вещи. Заголовок X с очень длинными строками UNICODE может вызвать ошибку переполнения буфера в транспортной программе, и сердце, записанное по адресу, может запутать почтальона. Но в разумных пределах это просто игнорируется.
Рэнди Оррисон
6

SOH является Start Of Header

STX является Start of teXt

GS является Group Seperator

td512
источник