Какой персонаж подходит для апострофа?

56

Много раз я сталкивался с так называемым « апострофом пишущей машинки » (символ Unicode U+0027и символ HTML ') для обозначения апострофа:

печатная машинка апостроф

Но с другой стороны, вместо этого также используется « правая одинарная кавычка » (символ Unicode U+2019и символ HTML ’):

правая одинарная кавычка

Интересно теперь, какой из них является правильным и должен использоваться в типографии?

Примечание: в обоих примерах использовался шрифт Srial -Serif Arial .

Elegent
источник
Если вы намереваетесь написать на французском языке по-французски, тогда обязательно используйте второй с узким неразрывным пробелом перед знаком вопроса.
user2284570 12.02.16
узкое неразрывное пространство U + 202F и 1 / 3em - еще более «визуально правильным» было бы 1 / 8em «тонкое пространство» U + 2009, но «тонкое пространство» не помечено как неразрывное (слышу что InDesign делает это автоматически, как
непробиваемый

Ответы:

69

Началось изогнуто

Апостроф впервые появился в печатной вселенной в Италии, 16-го века, в виде изогнутой формы, обозначающей исключение, скопированное из рукописной классической итальянской поэзии. Апостроф был эквивалентен нашим "Gotchas" или "Wannas" в том смысле, что это был способ убрать жесткость текста, сделав его более похожим на человека.

Вот пример одного из первых случаев, когда апостроф был напечатан. Это из "Le cose volgari di messer Francesco" - итальянской классики, написанной Петраркой, изданной Aldus Manutius в Италии около 1501 года.

введите описание изображения здесь

Альд Мануций предположительно скопировал эту книгу из оригинальной рукописи Петрарки, принадлежавшей его другу. У него был специальный шрифт, разработанный на основе почерка поэта, создавая наклонный стиль, который мы теперь знаем как «курсив». Он должен был ввести глиф апостроф, чтобы иметь возможность копировать текст точно так, как его написал поэт. Обратите внимание на апостроф в слове "l'honorata". Обратите внимание, что он имел изогнутую форму.

Это стало модным

Этот инновационный тип «Курсив» и разговорный стильный способ обозначить выбор в качестве симпатичного маленького знака получили немедленную известность. Даже когда шрифт был защищен самим папой, он начал незаконно копироваться контрафактными художниками. Копии книги были напечатаны в Лионе с использованием пиратской копии шрифта с апострофом и прочим.

В 1501 году Джеффрой Тори издал Campoflori, книгу, которая произвела революцию во французской грамматике и книгоиздании. Помимо прочего, она ввела апостроф, копирующий новый модный итальянский способ считать элегантность элегантной. Это выдержка из книги. Обратите внимание на изогнутый апостроф.

введите описание изображения здесь

В том же веке и по тем же причинам английский язык импортировал апостроф из французского языка.

Это получил прямо

Апостроф перестал быть новинкой и стал частью обычной грамматики. Он сохранил свою изогнутую форму в печатных текстах. Прямой апострофоподобный глиф, с другой стороны, выполнял разные функции, например, обозначал «простое». В рукописных документах, однако, иногда это стилизовалось под прямую галочку (см. Комментарий Йорика ниже).

С изобретением пишущих машинок и клавиатур (1860-е годы) инженеры столкнулись с проблемой размещения множества символов (клавиш) в небольшом пространстве. Им пришла в голову идея объединения похожих персонажей для экономии места. Вместо того, чтобы иметь левый, правый и прямой «апострофы», они решили включить только прямой. Аналогичные решения были приняты в отношении других символов, часто встречающихся в наборе текста, таких как em dash и en dash.

https://en.wikipedia.org/wiki/Typewriter#Typewriter_conventions

Этот сокращенный набор символов был кодифицирован в первом в мире двоичном наборе символов, 5-битном коде Бодо (1870). В набор также включена прямая двойная кавычка в виде одного символа. 7-битный ASCII унаследовал тот же набор символов.

С тех пор весь напечатанный (и телеграфированный) текст задавался с использованием только прямых кавычек. Вьющиеся использовались только в традиционном набранном тексте.

Это стало неоднозначным

Только с популяризацией систем текстового процессора эти апострофы были вновь введены в цифровой мир. Системы, подобные Word, предлагали функцию автоматической замены прямого апострофа фигурными кавычками в зависимости от контекста. Это был пользовательский выбор, и не все текстовые процессоры имели такую ​​возможность. Чтобы добавить к путанице, стандартные клавиатуры не включали фигурные кавычки, поэтому обычному пользователю было очень сложно их набирать намеренно.

Когда был создан Unicode, одним из принципов дизайна было «объединение» персонажей. Символы из разных сценариев или языков, которые выглядели одинаково, должны были быть объединены и упрощены как один. Вы могли бы подумать, что они вернулись бы к происхождению и избавились бы от прямого апострофа. Теперь, к этому моменту, путаница и либеральное использование прямых и вьющихся апострофов и кавычек было настолько велико, что Unicode решил включить оба.

Апостроф сегодня

Итак, как и сегодня, оба (вьющийся и прямой апостроф) принимаются как апостроф и кавычка, но есть некоторые соображения:

  • Если цель текста состоит в том, чтобы он выглядел так, как будто он был традиционно набран, то всегда используйте фигурные, как это было изначально. Оставьте прямой, чтобы обозначить простое число.

  • Использование прямого апострофа и цитаты может быть способом создания цифрового настроения для вашего документа, точно так же, как символы одинаковой ширины означают, что текст был напечатан на пишущей машинке или на консоли.

  • Если текст является цифровым и должен быть воспринят человеческим глазом, то оба (вьющийся и прямой апостроф) принимаются как апостроф и кавычка. Здесь школы различаются и правила раскола. Мы продолжаем с выразительным беспорядком. Просто будьте последовательны в одном документе.

  • Если смысл текста должен быть семантически правильным (как если бы вы хотели, чтобы компьютер мог анализировать семантику текста), вам следует обратить пристальное внимание на определение символов в Юникоде. U + 0027(тот, который может быть набран с клавиатуры) называется "APOSTROPHE". Хотя это намекает на то, что он может быть хорошим кандидатом для представления апострофов, обратите внимание, что Unicode является своего рода двусмысленностью в отношении этого символа, указывающей на то, что, по крайней мере в английском языке, U + 2019 является предпочтительным для апострофов. Я лично думаю, что это противоречит их принципу объединения. Можно ожидать, что апостроф будет таким же независимо от языка, на котором он используется. Добавьте к этому тот факт, что они классифицируют апостроф как «пунктуацию», что на французском языке может быть неловко принято, но на английском языке не имеет никакого смысла. Вы оставили, то, с дилеммой : либо с использованием различного апострофа для различных языков или с использованием спорных один для английского языка. Обсуждениео том, какой из них правильный, может стать очень страстным. С другой стороны, кажется совершенно ясным, что U + 2019 (и никогда не прямой) следует использовать в качестве правильной кавычки. Точно так же U + 2032 следует использовать для обозначения простого числа, а U + 02BC следует использовать для обозначения апострофной буквы-модификатора (например, в глоттальной остановке произношения Кокни «bu'er» или транскрипции «uh'oh»). «).

  • Обратите внимание, что даже если вы выберете или введете правильный символ, используемый вами шрифт может отобразить его вьющимися или прямыми способами.

cockypup
источник
7
Примечание: реверс U + 02BC - это U + 02BB, гавайская ʻOkina , как и в самом названии “Hawaiʻi”.
usr2564301
6
«Когда был создан Unicode, одним из принципов дизайна было« объединение »символов. Символы из разных сценариев или языков, которые выглядели одинаково, должны были быть объединены и упрощены как один». - у вас есть источник для этого? Существует множество примеров использования Unicode с несколькими символами, которые выглядят одинаково, но я не знаю ни одного примера, где Unicode брал похожие символы и делал их одним.
user2357112
6
Имя символа Unicode НЕ является его определением! Текущая политика заключается в том, что имена не могут быть изменены; следовательно, есть много символов Unicode, которые вводят в заблуждение или выводят неправильные имена. Вместо этого вы должны посмотреть на комментарии, чтобы увидеть, как их следует использовать. И в комментариях недвусмысленно утверждается, что U + 2019 является более семантически правильным для представления апострофа, чем U + 0027.
Sumelic
3
Вы можете не согласиться с комитетом по Unicode, но это недопустимый аргумент для ссылки на имя; вместо этого используйте аргументы, как в этом посте здесь: Какой символ Unicode должен представлять английский апостроф? (И почему комитет по
Юникоду
4
Прямые апострофы 'отличаются от простых ʹ.
Эндрю Лич
26

Сделал небольшое исследование, чтобы убедиться, но в целом «правильная» типография не использует прямые кавычки, одинарные или двойные. Вот удобное руководство для команд и сущностей HTML для одинарных / двойных фигурных кавычек .

Пишущие машинки также несут ответственность за введение «прямых кавычек», неспецифических кавычек, предназначенных для экономии места на клавиатуре, позволяя избежать необходимости использовать отдельные открывающие и закрывающие кавычки. Прямые кавычки обычно используются вместо правильных кавычек или «фигурных кавычек». Многие дизайнеры скажут вам, что прямые кавычки используются для обозначения футов и дюймов, но в действительности, футы и дюймы должны быть представлены с помощью простых чисел. Прямые кавычки устарели и не должны использоваться.

Из типографской грамотности: часть вторая (KA + A)

Тупые цитаты

johnkeese
источник
1
Ну, апостроф - это только один знак, одна кавычка означает два знака, один начальный и один закрывающий. Какой глиф используется для этих знаков, зависит от используемого шрифта и глифов, которые шрифт дает вам для типографских знаков ...
Mensch
5
Красиво положил. Но ФП спрашивал об апострофе, а не о кавычках.
cockypup
17

В Unicode Стандартные комментарии на U + 2019 ( ') :

это предпочтительный символ для апострофа

Что касается правильного кодирования, я не могу думать о более высоком авторитете.

Кроме того, типографские соглашения большинства языков не используют U + 2019 для других целей или только в качестве вторичных кавычек. Фактически, британский английский является единственным основным языком, использующим этот символ в качестве основной кавычки. Таким образом, нет большой необходимости использовать U + 0027 (или любой другой символ) для различий.


Как правило, существует три подхода к определению того, что является «правильным»:

  1. К чему привыкли люди - В то время как в классическом и профессиональном наборе текста люди в основном подвержены кудрявому апострофу, апостроф печатной машинки доминирует над цифровыми текстами. Здесь нет хорошего ответа.

  2. Что соответствует общему характеру шрифта без существенного ухудшения читаемости - это в некоторой степени зависит от шрифта. Давайте посмотрим на некоторые примеры:

    введите описание изображения здесь

    Во всех примерах апостроф в Do не является U + 2019 и апостроф в amn't является U + 0027. Сначала обратите внимание, как оба символа различаются по гарнитурам.

    • Первый пример - легкий шрифт без засечек. Это далеко от декоративных и вьющихся апостроф будет неуместно. Следовательно, U + 2019 только слегка наклонен. Прямой U + 0027 также хорошо подходит для простого символа гарнитуры.

    • Круглые формы, очевидно, являются основной парадигмой шрифта во втором примере. Следовательно, U + 2019 является вьющимся. U + 0027 разработан для того, чтобы избежать какого-либо ощущения направления (предположительно, чтобы его можно было использовать в качестве открывающей кавычки) и, следовательно, изгибать. Кроме того, это довольно маленький, предположительно, компромисс между попыткой нарушить характер шрифта крупным шрифтом и ухудшением читабельности маленьким символом. Если вы спросите меня, компромисс слишком мал, но это только симптом - реальная проблема - компромисс, которого можно избежать, используя фигурный апостроф, который намного лучше подходит для гарнитуры.

    • В классических шрифтах с засечками, как в третьем примере, ширина обводки в основном зависит от угла (который берет свое начало в каллиграфии). Прямые вертикальные линии обычно заканчиваются засечками. Это не вариант для апострофа, и, следовательно, U + 0027 использует каплеобразную форму и таким образом нарушает характер шрифта (на мой взгляд). Следует признать, что то же самое относится и к восклицательному знаку, но, по крайней мере, этот символ должен мешать в любом случае. Кудрявый U + 2019, по моему мнению, намного лучше соответствует характеру шрифта.

    • Последний шрифт еще более каллиграфичен, но его характер предлагает другой способ создания чисто вертикальных элементов. Таким образом, U + 0027 не так мешает и не так сильно отличается от U + 2019.

    Подводя итог, можно сказать: это зависит от шрифта, но правильно спроектированный U + 2019 никогда не должен быть хуже U + 0027, даже если последний хорошо спроектирован. Это неудивительно, потому что конструктор шрифтов более гибок в формировании U + 2019, чтобы соответствовать остальной части гарнитуры, поскольку симметрия не требуется.

  3. Что лучше для удобочитаемости в долгосрочной перспективе - использование одного и того же символа для многих целей, возможно, не очень хорошо для удобочитаемости. Таким образом, если мы предположим, что британские соглашения о наборе текста остаются неизменными, прямой апостроф имеет то преимущество, что его можно отличить от фигурной закрывающей кавычки. Однако это соглашение (используйте U + 0027 для апострофа и U + 2019 для одиночной закрывающей кавычки) еще сложнее установить, чем установление использования фигурных кавычек и апострофов в цифровом мире.

    Во многих других языках это не имеет большого смысла, так как U + 2019 в любом случае не используется в качестве кавычки. В таких языках, как немецкий, в которых в качестве кавычки используется повернутый U + 2018 (', английская одинарная открывающая кавычка), наличие двух противоположных завитков или наклонов (в зависимости от шрифта) часто способствует лучшему различению - по крайней мере, на мой взгляд ,

Wrzlprmft
источник
Хороший ответ! : D Вы правы, U+2019кавычки на немецком языке не используются: „...“ С другой стороны, я до сих пор удивляюсь, почему U+2019на немецкой / австрийской клавиатуре нет клавиши.
Elegent
9

Сначала немного истории .

Кудрявые цитаты и апострофы были оригинальным стилем. Их также называют цитатами и апострофами Принтера .

Прямые цитаты и апострофы пришли вместе с пишущей машинкой. Пишущая машинка, являющаяся механическим устройством с ограничениями, решила, что имеет больше смысла использовать один набор прямых отметок вместо двух отдельных наборов фигурных отметок (для открытых и закрытых одинарных и двойных кавычек).

Чтобы добавить еще больше путаницы, Primes также персонаж, который выглядит как прямой апостроф под углом. Простые числа используются для пометки минут / секунд (а также для других научных, математических и музыкальных обозначений). Опять же, прямые апострофы пишущей машинки также могли быть использованы для них.

Тем не менее, некоторые шрифты разработаны только с прямыми апострофами и кавычками по стилистическим соображениям.

Подводя итог: всегда используйте фигурную версию для фактических кавычек и апострофных знаков, если вы а) не пользуетесь пишущей машинкой 1954 года или б) у вас есть стилистические причины для использования прямых

DA01
источник
Очень хороший обзор :) Я не слышал о термине «Цитаты принтера» раньше ... И я готов поспорить, что 99 процентов будут использовать (неправильный) прямой апостроф для написания «s»: D
Elegent
5

Есть один пункт, который до сих пор не был упомянут во всех ответах. В интерфейсе командной строки или на языке программирования апостроф (символ 27 UTF-8) является единственным допустимым выбором.

Использование U + 2019 с причиной синтаксических ошибок при выполнении вырезания и вставки. С автоматическим переводом символа 27 в U + 2019 теперь это означает, что копирование командных строк из документов Word (или некоторых вики / веб-страниц) приведет к ошибкам, которые могут вызвать замешательство у многих людей, пока эта проблема не будет указана. Это также может вызвать ошибки компилятора / интерпретатора, которые не имеют смысла.

При написании технических документов с примерами кода и / или командной строки, убедитесь, что во всех созданных образцах используется символ 27, а не более высокое значение.

Вальтер
источник
1
Из любопытства ... есть ли необходимость в апострофах в коде или командной строке? Я не знаю многих языков кодирования, но я не могу вспомнить ни одного случая, когда нужен апостроф.
DA01
4
@ DA01 C-подобные языки (такие как C, C ++, Java, C #) используют U + 0027 для обозначения односимвольных литералов: 'a'это односимвольный литерал «a». (Это в отличие от строки, содержащей только букву a, которая использует U + 0022: "a"это строка, содержащая только букву «а».) Некоторые языки, такие как Javascript, позволяют использовать одинарные и двойные кавычки взаимозаменяемо (но у вас есть выбрать любой из них для конкретной строки). Другие языки (такие как Pascal, Ada, SQL) используют U + 0027 для обозначения строковых литералов: в SQL 'a'это строка, содержащая только букву «a».
CVn
4
Как видите, многие языки делают различие между односимвольными литералами и строками, состоящими только из одного символа. Оба имеют действительное использование, и оба регулярно используются во многих ситуациях. Теперь, очевидно ли это, что существует необходимость в апострофе, очевидно, можно обсудить, но какой-то способ указать разницу для компилятора или интерпретатора необходим в любом языке, который делает различие, и многие языки остановились на паре "и 'одном так или иначе.
CVn
1
Автоматические цитаты типографов могут быть адом в уроках.
Joojaa
1
@ MichaelKjörling ах, возможно, семантика, но мы говорим здесь не к апостофу, а в кавычках.
DA01
3

Я работаю в исследовательском центре, и мы обычно используем довольно большие французские и немецкие корпуса (довольно недавние). Во французском корпусе прямой апостроф «появляется примерно в 4 раза больше, чем вьющийся апостроф». В немецком можно найти прямое «не существует и только вьющееся». Различия во французском корпусе могут быть связаны с тем, что в текстах обычно используются обычные слова, а в тексте - в основном тексты, копируемые и вставляемые в Интернет. С другой стороны, немецкие источники, похоже, используют только фигурные ». Некоторое внимание следует также обратить на тот факт, что апостроф гораздо чаще встречается на французском языке, чем на немецком.

user92497
источник
Вопрос был о том, что является «правильным». Теперь ваш вклад в реально существующие тексты интересен. Я люблю Францию ​​и тот факт, что они так или иначе используют больше прямой, чем фигурная, косвенно подтверждает, что фигурные будут «правильными» (подмигивание) ... Вчера я заказал две настоящие бумажные печатные Книги о правилах типографики для французского (как рекомендовано в другой ветке), поэтому скоро я узнаю еще больше.
Мартин Заске
0

Правильный символ для вставки в опубликованный текст как апостроф - это символ UTF-8 U + 2019 , правая одинарная кавычка. Это единственный персонаж, который даст вам желаемый результат, который представляет собой типографский апостроф на уровне книги. Когда вы используете пишущий инструмент, который выполняет «умные кавычки», и вы нажимаете клавишу апострофа, инструмент вставит символ UTF-8 2019.

Апостроф буквы модификатора U + 02BC символа UTF-8 - крошечный апостроф для произношения. Это не будет выглядеть правильно в контексте написания «не могу».

Апостроф U + 0027 в UTF-8 - это «апостроф программиста». Он остался на заре компьютерных технологий, когда в компьютерах было всего 127 символов и они были предназначены для написания компьютерных программ, а не для книгопечатания на уровне книг. Первые 127 символов UTF-8 - это те же самые оригинальные 127 символов, и клавиатура компьютера практически не изменилась, так что эта плохая типографика живет и продолжается, и продолжается.

Причина этой ошибки заключается в том, что люди, пришедшие из компьютерного наследия, не обязательно считают программистов апострофами ошибками. Люди, которые происходят из издательского наследия. Но это компьютерные люди, которые проектируют компьютеры. Это не оправдание для того, чтобы не использовать правильную типографику в опубликованном тексте. У нас есть замены текста сегодня, у нас есть много способов обойти это.

В идеале, писатели должны использовать инструменты, которые не позволяют им набирать апострофы программиста, потому что они просто помещают ошибку в свою рукопись UTF-8. Конечно, редакторы это исправят, но отношение «исправь позже» много раз приводит к публикации ошибок.

Так что если у вас есть рукопись любого типа - книга, рассказ, статья - и в ней есть апострофы программиста, вы должны заменить их на UTF-8 символ 2019 перед публикацией.

То же самое касается цитат программиста. Хорошие инструменты письма не должны позволять автору печатать их, они должны печатать правильные кавычки, особенно потому, что их труднее исправить при редактировании, и они могут ухудшить читаемость, если они не исправлены, по сравнению с апострофами.

В качестве примера пишущего инструмента вы можете взглянуть на BBEdit, текстовый редактор, который десятилетиями работал на Mac. Если вы создадите программный документ (HTML или другой язык) и нажмете клавишу апострофа, вы получите апостроф программиста. Если вы создаете письменный документ (простой текст или Markdown) и нажимаете клавишу апострофа, вы получаете символ UTF-8 2019. То же самое относится к кавычкам. При программировании документов вы получаете цитаты программиста. При написании документов вы получаете настоящие кавычки, как вводные, так и закрывающие предложения при вводе. Это лучший способ поставить кавычки, потому что инструмент может делать правильные открытые и закрытые кавычки, когда автор пишет. Во-первых, нет никакой двусмысленности, поэтому она должна быть исправлена ​​позже (или нет).

Саймон Уайт
источник
4
Есть исключение из вашего правила. При написании кода или примеров командной строки в письменных документах апостроф программиста является правильным значением (другие вызовут синтаксические ошибки). Запреты или замены пододеяльников сломают команды / образцы. Поэтому символ должен быть разрешен для технической публикации, которая отображает примеры кода или командной строки.
Уолтер
1
BBEdit говорит, что я не должен использовать U + 0027, потому что я пишу в Markdown. Многие люди в Stack Overflow могут почувствовать, что нечто подобное, скажем так, не оптимально.
CVn
5
Мне потребовалось некоторое время, чтобы понять, какого черта вы говорили о U + 8217: унифицированный магазин идеографов CJK, магазин. Пожалуйста, используйте шестнадцатеричное для символов Unicode, то есть U + 2019 в вашем случае или, по крайней мере, сообщите читателю о вашей нестандартной записи.
Wrzlprmft
2
Кроме того, это не символы UTF-8, а символы Unicode или UCS. UTF-8 - это просто способ преобразования кодовой точки в байты. Так, например, U + 2019 становится тремя байтами UTF-8, которые в шестнадцатеричном виде записываются как e2 80 99, а в десятичном виде 226 128 153.
deltab