Ответы на этот вопрос по SO вернули набор из примерно 125 одно- или двухбуквенных имен: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-объекты
[1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C"
[14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs" "Cs" "cv"
[27] "d" "D" "dc" "dd" "de" "df" "dg" "dn" "do" "ds" "dt" "e" "E"
[40] "el" "ES" "F" "FF" "fn" "gc" "gl" "go" "H" "Hi" "hm" "I" "ic"
[53] "id" "ID" "if" "IJ" "Im" "In" "ip" "is" "J" "lh" "ll" "lm" "lo"
[66] "Lo" "ls" "lu" "m" "MH" "mn" "ms" "N" "nc" "nd" "nn" "ns" "on"
[79] "Op" "P" "pa" "pf" "pi" "Pi" "pm" "pp" "ps" "pt" "q" "qf" "qq"
[92] "qr" "qt" "r" "Re" "rf" "rk" "rl" "rm" "rt" "s" "sc" "sd" "SJ"
[105] "sn" "sp" "ss" "t" "T" "te" "tr" "ts" "tt" "tz" "ug" "UG" "UN"
[118] "V" "VA" "Vd" "vi" "Vo" "w" "W" "y"
И R код импорта:
nms <- c("Ad","am","ar","as","bc","bd","bp","br","BR","bs","by","c","C","cc","cd","ch","ci","CJ","ck","Cl","cm","cn","cq","cs","Cs","cv","d","D","dc","dd","de","df","dg","dn","do","ds","dt","e","E","el","ES","F","FF","fn","gc","gl","go","H","Hi","hm","I","ic","id","ID","if","IJ","Im","In","ip","is","J","lh","ll","lm","lo","Lo","ls","lu","m","MH","mn","ms","N","nc","nd","nn","ns","on","Op","P","pa","pf","pi","Pi","pm","pp","ps","pt","q","qf","qq","qr","qt","r","Re","rf","rk","rl","rm","rt","s","sc","sd","SJ","sn","sp","ss","t","T","te","tr","ts","tt","tz","ug","UG","UN","V","VA","Vd","vi","Vo","w","W","y")
Поскольку суть вопроса заключалась в том, чтобы придумать запоминающийся список имен объектов, которых следует избегать, и большинство людей не очень хорошо разбираются в прочном блоке текста, я хотел бы представить это.
К сожалению, я не совсем уверен, что лучший способ сделать это. Я думал о чем-то похожем на сюжет со стволом и листом, только поскольку повторяющихся значений нет, каждый «лист» был помещен в соответствующий столбец, а не выровнен по левому краю. Или адаптация в стиле wordcloud, в которой буквы измеряются в соответствии с их распространенностью.
Как это может быть наиболее четко и эффективно визуализировано?
Визуализации, которые выполняют одно из следующих действий, соответствуют духу этого вопроса:
Основная цель: улучшить запоминаемость набора имен путем выявления закономерностей в данных
Альтернативная цель: выделите интересные особенности набора имен (например, которые помогают визуализировать распределение, наиболее распространенные буквы и т. Д.)
Ответы на R предпочтительны, но все интересные идеи приветствуются.
Допускается игнорирование однобуквенных имен, так как их проще всего представить в виде отдельного списка.
источник
Хорошо, вот мой очень быстрый взгляд на визуализацию, подобную «периодической таблице», основанную на вопросе SO и комментариях других. Основная проблема заключается в большой разнице в количестве переменных между пакетами, что мешает визуализации ... Я понимаю, что это очень грубо, поэтому, пожалуйста, не стесняйтесь менять ее по своему желанию.
Вот текущий вывод (из моего списка пакетов)
И код
Теперь у нас есть фрейм данных:
Теперь мы можем разделить данные по пакетам
Мы видим, что большинство переменных происходят из пакета base и stats
Наконец, процедура рисования
источник
Вот гистограмма на основе букв. Рассматривал изменение размера первых букв по номерам, но решил отказаться, поскольку он уже закодирован в вертикальном компоненте.
источник
Периодическая таблица на 100, Алекс. У меня нет кода для этого, хотя. :(
Можно подумать, что пакет «периодической таблицы» уже может существовать в CRAN. Идея схемы раскраски и размещения таких данных может быть интересной и полезной.
Они могут быть раскрашены по пакетам и отсортированы вертикально по частоте, например, в образце кода на CRAN или в том виде, в каком они появляются в локальной кодовой базе.
источник
На первых двух страницах второй главы ITILA Маккея есть красивые диаграммы, показывающие условные вероятности всех пар символов в английском языке. Вы можете найти это полезным.
Мне стыдно сказать, что я не помню, какая программа использовалась для их производства.
источник