На ум приходят два примера:
Одна из причин, по которой программистам .Net рекомендуется использовать файлы .config вместо реестра Windows, заключается в том, что файлы .config являются XML и, следовательно, удобочитаемыми.
Точно так же JSON иногда считают читаемым человеком по сравнению с проприетарным форматом.
Читаемые человеком форматы действительно читаемы людьми? В примере данных конфигурации:
- Формат не меняет основной смысл информации - в обоих случаях данные представляют одно и то же.
- И реестр, и файл .config хранятся внутри как серии 0 и 1. В этом смысле основное представление одинаково нечитаемо людьми.
- И в реестре, и в файле .config требуется инструмент для чтения, форматирования и отображения этих нулей и единиц и их преобразования в формат, который могут прочитать люди. В случае конфигурации, хранящейся в реестре Windows, это редактор реестра. В случае XML это может быть текстовый редактор или программа чтения XML. В любом случае, инструмент делает данные читаемыми, а не формат данных.
Итак, в чем разница между читаемыми человеком форматами данных и нечитаемыми форматами?
terminology
Kramii
источник
источник
Ответы:
Удобочитаемость человеком в основном означает, что если контент отображается программой, в которой отсутствует прямая, конкретная осведомленность о формате этого файла, то есть хотя бы разумный шанс, что человек сможет прочитать и понять хотя бы часть из этого.
Ваш основной вывод об отсутствии четкой линии разграничения абсолютно верен - хотя когда-то я знал парня, который мог бы диагностировать проблемы с программами (в основном написанными на фортране) часто за пять минут или меньше - исходя только из восьмеричного числа дамп ядра, вообще не глядя на исходный код. Для большинства людей этот формат вряд ли можно назвать «читабельным», но, очевидно, он был исключением ...
источник
Удобный для чтения означает, что я могу открыть эту вещь в Блокноте, если захочу, и изменить «пароль = foo» на «пароль = бар», если я этого захочу. Мне не нужно использовать проприетарный инструмент для просмотра или редактирования контента.
В отличие от PDF, который вы не можете редактировать с помощью простого текстового редактора - вам нужен специальный инструмент, который знает формат. Или бинарный файл .dat, который появился в приложении 25 лет назад и который вы не можете читать, редактировать или понимать.
источник
В ответ на ваш вопрос «Являются ли читаемые человеком форматы действительно читаемыми людьми», по определению да, это то, что означает читаемое человеком.
Технического определения читабельного человека нет, оно субъективно, и могут возникнуть вопросы о том, какой уровень знаний может понадобиться человеку для квалификации (например, нужно ли им понимать самые базовые принципы XML, такие как теги и иерархии) Если они понимают сферу бизнеса, в которой существуют данные - лично я бы сказал «да» обоим), но ваш базовый тест должен состоять в том, чтобы я показал его кому-то с базовыми техническими навыками, которые понимали основы того, что данные должны были представлять Могут ли они это прочитать.
На практическом уровне это обычно будет означать следующее:
1) Данные хранятся в виде текста ASCII или в другом аналогично распространенном и легко узнаваемом формате.
2) Что существует разумная структура, которая самоочевидна из базового экзамена. Например, вам не нужно знать, что первые X символов относятся к Y, а затем следующие X относятся к Z
3) что и данные, и метаданные, как правило, представлены на английском языке (или на любом другом языке) и требуют только ограниченного знания проблемной области, чтобы номер счета-фактуры был бы в теге invoiceNumber, а не в uDef_Inbr»
4) Для нетекстовых данных используются разумные, предсказуемые соглашения (например, ИСТИНА, ЛОЖЬ, Y, N, 1, 0, а не что-то более открытое для интерпретации)
источник
Файлы .config гораздо проще редактировать (для большинства людей), чем реестр. Проще открыть специальный файл конфигурации, найти соответствующие данные и внести изменения, не открывая возможность редактирования чего-либо, что повлияет на другие программы.
источник
Это все о простоте понимания (и, вероятно, изменения). Так "X человек читается?" не следует отвечать «да» или «нет». Скорее, ответ должен быть по какой-то скользящей шкале.
Потенциальные примеры:
Вне контекста, который объясняет, что на самом деле означает «читаемый человеком», эта фраза не очень помогает. (Кто-то где-то может, вероятно, прочитать любой из форматов, если не считать попытки взглянуть на магнитную полярность самих аппаратных битов ...)
источник
Одно большое различие между удобочитаемыми форматами и нечитаемыми форматами - это надежность. В системе Linux вся информация будет разбросана по разным текстовым файлам. Вам нужно узнать, где они находятся, но вы всегда можете найти информацию, прочитать и изменить ее с помощью текстового редактора. Если файл исчезает, вы можете заменить его. Если файл поврежден, вы часто можете определить, каким он должен быть, и исправить это.
В системе MS Windows большая часть этого будет в реестре, который, с точки зрения пользователей, представляет собой одну большую непрозрачную систему, доступную частично через различные инструменты (во многом как некоторые файлы конфигурации в системах Linux), и в целом с редактором реестра. Пока все идет хорошо, это нормально. Если он сломается, ничего не поделаешь без специальных знаний.
источник
Самыми простыми проверками, которые я могу представить как «читабельные», является:
JohnSmith|34|T|F
менее дружественный, чем<User><Name>JohnSmith</Name><id>34</id><isActive>T</isActive><isAdmin>F</isAdmin></User>
, как знать, что поля (по крайней мере, в целом) во 2-й.источник
Я думаю, что вы, возможно, спрашиваете, неправильно ли применяется термин «читабельный» как термин, и, без сомнения, это так. В примере записей реестра против файлов .config, я думаю, это помогает, что вы можете расположить XML по-разному в зависимости от данных, вкрапления комментариев и так далее.
Коллекции в файлах .config обычно обрабатываются как несколько элементов, в то время как в реестре это сложнее, часто как в MULTI_SZ.
Вы также можете увидеть больше данных конфигурации для приложения одновременно - с помощью regedit, чтобы увидеть что-то, находящееся в другом ключе, вам нужно перейти к этому ключу, что означает, что вы больше не можете видеть записи, которые ранее просматривали. С файлами .config вы можете увидеть весь файл одновременно, даже если этот файл может содержать иерархические данные.
источник
Сравните «читабельный» с двоичным. Например, вы не можете вообще открыть исполняемый файл или индекс базы данных в ванильном текстовом редакторе и понять, что такое содержимое. Байты ниже десятичного числа 32 даже не имеют глобально стандартных представлений в виде видимых символов.
источник
Краткий ответ: это означает, что информация вводится в виде текста, а не двоичного или шестнадцатеричного, и т. Д. Что-то, что приравнивается к читаемому «языку», а не «машинному языку» компьютера. Помимо этого, определение становится темным.
источник
Это также относится и к коду - вы структурируете свою программу логичным и продуманным образом, так что работа любого, кто смотрит на нее впервые, становится немного проще.
источник