Комбинации пиньинь

13

Создайте функцию, которая принимает строку слога пиньинь в качестве аргумента и возвращает true, если комбинация существует, в противном случае - false.

Используйте «V» для «ü».

Вот полный список комбинаций. http://www.pinyin.info/rules/initials_finals.html

Примеры

f("bu") == true
f("zheng") == true
f("nv") == true
f("ri") == true
f("cei") == false
f("ia") == false
f("kian") == false
f("qa") == false

Пожалуйста, не делайте таких вещей, как очистка веб-страниц или чтение файлов методов ввода, чтобы уменьшить количество символов. (Если вы это сделаете, длина данных будет учитываться при подсчете символов). Одна из целей этого кода состоит в том, чтобы увидеть, как можно упростить правила. Самый короткий код выигрывает.

Мин-Tang
источник
Как насчет чего-то вроде nar? : P
JiminP
1
Просто, как примечание, несмотря на то, что говорят примеры, я не верю, что nviэто когда-либо является допустимой комбинацией.
Ринтаун
Если на связанной странице уже написано »  er был исключен из этой таблицы« не следует ли также включить ее? (В конце концов, это был номер, если я правильно помню ;-))
Joey

Ответы:

4

JavaScript 1.6, 503 496 477 символов

function g(s){return/^([bfmpw]?o|[yjqx]ua?n|[ln]ve?|ei?|y[aio]ng|w?[ae]ng?|w?ai?|wei|y?ao|y?ou|y[ai]n?|yu?e|[^aeiou]+u)$/.test(s)|(((k=6*("ccsszzdflmnprtbghkjqx".indexOf(s[0])+(f=s[1]=='h')))|(r="a.e.ai.ei.ao.ou.an.ang.en.eng.ong.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f+1))))<0?0:k>84?r>17^k<108:parseInt("009m2f00b8jb009m2f00b7r3009m2n00b8jj1dwcfz0000rtfjba4f1xgbnjfj01rz1uyfb1009nn61b37cv1uyfa5".slice(k,k+6),36)>>r&1)}

Разметил немного более читабельно (за исключением ошибок при разбивке кода на несколько строк):

function _g(s)
{
  f = s[1] == 'h'
  k = "ccsszzdfghjklmnpqrtxb".indexOf(s[0]) * 6
  k += 6 * f
  return /^(weng|[bfmp]?o|[yjqx]ua?n|[ln]ve?|[ae]i?|y[aeiu]|y[aio]ng|[ae]ng?|wang?|wai?|we[in]|w[ou]|y?ao|y?ou?|y[ai]n|yue)$/.test(s) | 
         !!(k >= 0 && (1 << "a.e.ai.ei.ao.ou.an.ang.en.eng.ong.u.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f + 1)) & parseInt("00j85300mh2v00j85300mgan00j85b00mh332rsovz0002cp00b8jj00b8jjqmlts000b8jjv2mkfz3uwo3jv203jz3pwvelqmlts000jbaq2m6ewvqmlts03pwvdp".slice(k, k + 6), 36)))
}

Начальные с нуля плюс несколько раз проверяются с помощью регулярного выражения. После этого таблица кодируется в виде (каскадной) серии из 6 цифр, основанных на 36 чисел, по одному на каждый исходный звук. Затем поиск использует пару indexOfвызовов и сдвиг для выбора правильного бита.

Проверено на соответствие всем ячейкам таблицы комбинаций (заполненные ячейки проверены на истинность, пустые ячейки проверены на ложность).

Редактировать: Заменены некоторые из 36 символов поиска по основанию 36 сравнениями, поскольку g–, k–, h–, j–, q– и z– имеют плотные блоки true / false.

Изменить: Переставить битовый тест, чтобы избежать ненужного!! и сжал регулярное выражение больше.

DocMax
источник
Зачем тебе нужен !!? Я не уверен, что понимаю, зачем тебе нужен двойник, не ...
Питер Олсон,
При этом возвращаемое значение равно 0 или 1; без него «true» возвращается как ненулевое, но не обязательно 1. Мой тестовый скрипт проверяет, с помощью if (g(s) == (validList.indexOf(s) >= 0)которого возвращается false 16 == true; Я обсудил это с точки зрения «что значит« истинно »на самом деле» »и оставил это дело. В любом случае, у меня есть запланированное изменение на сегодня, которое покончит с !!заменой 1<<r&*parseIntна (более или менее), (parseInt>>r)&1чтобы возврат равен 1, и я сбрею два символа.
DocMax
1

PHP, 548 символов

Конечно, это, вероятно, не оптимально, но я написал регулярное выражение для сопоставления действительных комбинаций пиньинь. Сокращение символов путем замены повторяющихся подстрок переменными.

Код

<?php $a='?|e(i|ng?)';$b='|o(u|ng)|u';$c='|a?n)?|i(a[on]';$d='(a(ng?|o|i)';$e='|ng?)';$f='(i|ng)?';echo(preg_match("/^([bpm](a(i|o$e$a|u|o|i(e|a[on]$e?)|[pm]ou|m(e|iu)|f(a(ng?)?|ou$a|u)|d$d$a?$b(o|i$c?|e|u)?)|[dtnl]$d?|e$f$b(o$c|e)?)|[jqxy](i(a(o$e?|e|u|o?ng|n)|u(e|a?n))|([zcs]h?|r)i|[nl](ve?|i(n|ang?|u))|[dl]ia|[dt](ing|ui)|[dn]en|diu|([gkh]|[zcs]h?)(e(ng?)|a(o|ng?|i)?|ou|u(o|i|a?n)?)|r(e(ng?)?|a(o$e$b(a?n?|o|i)?)|[gkh](ei|ong|u(a$f))|[zcs]hua$f|([zcs]|[zc]h)ong|(z|[zs]h)ei|a(i|o$e?|ou$a?|w(u|a(i$e?|o|e(i$e))$/",$argv[1]))?"true":"false";

использование

> php pinyin.php bu
> true
> php pinyin.php cei
> false
rintaun
источник
1

F #, 681 символов

type l=Y|J|Q|X|W|F|B|P|M|N|L|T|D|Z|K|H|Zh|G|Sh|Ch|C|S|R|Iong|Vn|Van|Ia|Iu|In|Iang|Ve|V|Ian|Iao|Ie|Ing|I|Ei|A|Ai|An|Ang|Eng|U|Ao|E|Ou|Uo|Uan|Un|Ui|En|Ong|Ua|Uang|Uai|Ueng|O
let v x=x.GetHashCode()
let n x=J.GetType().GetNestedType("Tags").GetFields().GetValue(v x).ToString().Substring(6).ToLower();
let(^)a b=List.collect(fun x->List.map(fun z-> n x+ n z)b)a
let(-)a b=[v a..v b]
let(&)a b=a@b
let(!)a=[v a]
[<EntryPoint>]
let main a=
 printf"%b"(List.exists(fun x->x=a.[0])(Y-X^Iong-I& !W^Ei-Ui@Ua-O& !F^Ei-A@An-U@ !Ou&(F-N@D-Sh)^ !En&F-M^ !O&B-M^ !In&N-L^Iu-Un& !D^Ia-Iu&B-D^Ian-Ao& !M^E-Ou&Ch-S^A-Ong&T-Sh^Ei-Ui&N-G^ !Ong&K-Ch^Ua-Uai& !R^An-Ua&(Sh-R@ !Z@ !Zh)^ !I&["lia";"pou";"mui"]))
 0

Не совсем получаются слоги без правильного начального согласного (Y, W и т. Д.).

Марк Н
источник
1

APL (Dyalog Extended) , 475 байтов

s←⊢⊆⍨' '≠⊢
a b c2097144 131064 1957895
f←{(⊂⍵)∊(12v),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),(,⊤(a-8)1966080 393208 1966064 2096720 1966072 1048568a a 2056184a 131048a 7288b 7280 106488b 7280b 0 1958911 73735c c 352263c 24583 1859591c,57)/,('bpmfdtnlgkhzcs',s'zh ch sh r j q x')∘.,v'aoe',s'ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'}

Попробуйте онлайн!

Гольф в прогрессе.

Ungolfed

s←{⍵⊆⍨' '≠⍵}
cons'b p m f d t n l g k h z c s zh ch sh r j q x'
vwls'a o e ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'
tabcon∘.,vwl
bin←,⊤2097136 1966080 393208 1966064 2096720 1966072 1048568 2097144 2097144 2056184 2097144 131048 2097144 7288 131064 7280 106488 131064 7280 131064 0 1958911 73735 1957895 1957895 352263 1957895 24583 1859591 1957895 7 7 7 7 7
all'aoe',(12vwl),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),bin/,tab
f←{(⊂⍵)∊all}

Попробуйте онлайн!

Вспомогательная функция sраспаковывает строку, разделенную пробелом:

{⍵⊆⍨' '≠⍵}    monadic function taking a string
    ' '≠⍵       0s at spaces, 1s elsewhere
 ⍵⊆⍨            Partition (split at 0s)

Сначала я сохраняю возможные начальные и конечные строки в слоге, затем составляю таблицу tab содержащую конкатенацию каждой строки из первого списка с каждой строкой из второго списка.

Далее я храню двоичные данные в виде списка целых чисел. Некоторые из целых чисел повторяются и поэтому могут храниться в переменных, что также позволяет исключить некоторые пробелы.

Каждое целое число декодируется в двоичную форму и представляет одну строку таблицы. Каждый бит числа представляет, является ли определенный слог в этой строке действительным слогом, а MSB представляет первый столбец. Все недействительные слоги удаляются из таблицы.

Мы сведем таблицу в список, добавим формы без начального согласного в качестве особого случая и, наконец, проверим, есть ли наш вход в списке.

Возможный дальнейший потенциал игры в гольф:

  • Записать base64 или base255 кодировку
  • Переупорядочьте столбцы и строки, чтобы уменьшить числа.

Полезный скрипт на Python и генератор тест-кейсов: попробуйте онлайн!

lirtosiast
источник