Формат UUID: 8-4-4-4-12 - Почему?

85

Почему UUID представлены в формате «8-4-4-4-12» (цифры)? Я искал причину, но не могу найти решения, которое ее требует.

Пример UUID в формате шестнадцатеричной строки: 58D5E212-165B-4CA0-909B-C86B9CEE0111

Фидель
источник
12
На самом деле этот пример шестнадцатеричной строки неверен. UUID спецификации требует , чтобы шестнадцатеричная строка , представляющая значение UUID должно быть в нижнем регистре . Спецификация также требует, чтобы реализация была способна анализировать строку в верхнем или смешанном регистре, но могут быть сгенерированы только строчные буквы. К сожалению, распространенные реализации нарушают это правило, в том числе Apple, Microsoft и другие.
Basil Bourque
1
Интересно Василий, спасибо
Фидель

Ответы:

66

Он разделен time, version, clock_seq_hi, clock_seq_lo, nodeсимволом, как указано в следующем RFC.

Из IETF RFC4122:

4.1.2.  Layout and Byte Order

   To minimize confusion about bit assignments within octets, the UUID
   record definition is defined only in terms of fields that are
   integral numbers of octets.  The fields are presented with the most
   significant one first.

   Field                  Data Type     Octet  Note
                                        #

   time_low               unsigned 32   0-3    The low field of the
                          bit integer          timestamp

   time_mid               unsigned 16   4-5    The middle field of the
                          bit integer          timestamp

   time_hi_and_version    unsigned 16   6-7    The high field of the
                          bit integer          timestamp multiplexed
                                               with the version number  

   clock_seq_hi_and_rese  unsigned 8    8      The high field of the
   rved                   bit integer          clock sequence
                                               multiplexed with the
                                               variant

   clock_seq_low          unsigned 8    9      The low field of the
                          bit integer          clock sequence

   node                   unsigned 48   10-15  The spatially unique
                          bit integer          node identifier

   In the absence of explicit application or presentation protocol
   specification to the contrary, a UUID is encoded as a 128-bit object,
   as follows:

   The fields are encoded as 16 octets, with the sizes and order of the
   fields defined above, and with each field encoded with the Most
   Significant Byte first (known as network byte order).  Note that the
   field names, particularly for multiplexed fields, follow historical
   practice.

   0                   1                   2                   3
    0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                          time_low                             |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |       time_mid                |         time_hi_and_version   |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |clk_seq_hi_res |  clk_seq_low  |         node (0-1)            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                         node (2-5)                            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Маттен
источник
11
Почему метка времени была разделена на три части?
user253751
4
Как создаются поля, зависит от версии UUID. В предпочтительном методе время не используется, поскольку оно показывает время создания идентификатора (потенциальная проблема безопасности). en.wikipedia.org/wiki/…
pmont
1
@pmont «Предпочитаемый»?
Basil
2
@brocoli Я не согласен. V4 зависит от криптостойкого генератора случайных чисел, который гораздо сложнее построить, чем просто захват MAC-адреса , текущего момента и увеличивающегося произвольного числа, как видно в UUID V1. Более того, реализации V1, как правило, имеют открытый исходный код и созданы много лет назад и широко используются в отрасли, а теперь уже давно изношены. Утверждать, что V1 «склонен к частичному отказу», просто глупо. UUID V1 - это последняя часть вашей системы, где вам нужно беспокоиться о сбое.
Basil Bourque
2
@BasilBourque Одна из проблем, которую вы можете увидеть сейчас с распространением контейнеров и сетей контейнеров, - это конфликт MAC-адресов. Обычно контейнеры и виртуальные машины используют ограниченный диапазон возможных MAC-адресов. IIRC Hyper-V по умолчанию извлекает только из пула 256 возможных MAC-адресов.
Натан Клейтон,
12

Формат определен в IETF RFC4122 в разделе 3. Формат вывода определяется там, где указано «UUID = ...»

3.- Шаблон регистрации пространства имен

ID пространства имен: UUID Информация о регистрации: Дата регистрации: 01.10.2003

Заявленный регистрант пространства имен: JTC 1 / SC6 (группа докладчиков ASN.1)

Объявление синтаксической структуры: UUID - это идентификатор, который уникален как в пространстве, так и во времени по отношению к пространству всех UUID. Поскольку UUID имеет фиксированный размер и содержит поле времени, значения могут меняться (около 3400 г. н.э., в зависимости от конкретного используемого алгоритма). UUID может использоваться для нескольких целей, от маркировки объектов с чрезвычайно коротким временем жизни до надежной идентификации очень постоянных объектов в сети.

  The internal representation of a UUID is a specific sequence of
  bits in memory, as described in Section 4.  To accurately
  represent a UUID as a URN, it is necessary to convert the bit
  sequence to a string representation.

  Each field is treated as an integer and has its value printed as a
  zero-filled hexadecimal digit string with the most significant
  digit first.  The hexadecimal values "a" through "f" are output as
  lower case characters and are case insensitive on input.

  The formal definition of the UUID string representation is
  provided by the following ABNF [7]:

  UUID                   = time-low "-" time-mid "-"
                           time-high-and-version "-"
                           clock-seq-and-reserved
                           clock-seq-low "-" node
  time-low               = 4hexOctet
  time-mid               = 2hexOctet
  time-high-and-version  = 2hexOctet
  clock-seq-and-reserved = hexOctet
  clock-seq-low          = hexOctet
  node                   = 6hexOctet
  hexOctet               = hexDigit hexDigit
  hexDigit =
        "0" / "1" / "2" / "3" / "4" / "5" / "6" / "7" / "8" / "9" /
        "a" / "b" / "c" / "d" / "e" / "f" /
        "A" / "B" / "C" / "D" / "E" / "F"
Поль-Жозеф де Верк
источник
4

128 бит

Формат «8-4-4-4-12» предназначен только для чтения людьми. UUID действительно 128-битное число.

Учтите, что строковый формат требует удвоения байтов, чем 128-битное число при хранении или в памяти. Я бы посоветовал использовать номер для внутреннего использования, а когда его нужно отобразить в пользовательском интерфейсе или экспортировать в файл, используйте строковый формат.

Пабло Пасос
источник