Особый класс языков: «круговые» языки. Это известно?

20

Определите следующий класс «круговых» языков поверх конечного алфавита Sigma. На самом деле, название уже существует для обозначения другой вещи, которая, кажется, используется в области вычислений ДНК. AFAICT, это другой класс языков.

Язык L является круговым, если для всех слов ww в Σ Σ имеем:

шw принадлежит L тогда и только тогдакогда для всех целых к > 0k>0 , ш кwk которой принадлежит L.

Известен ли этот класс языков? Мне интересны циркулярные языки, которые также являются регулярными и, в частности:

  • имя для них, если они уже известны

  • разрешимость проблемы с учетом автомата (в частности: DFA), подчиняется ли принятый язык приведенному выше определению

vincenzoml
источник
1
Это очень интересный вопрос. Два связанных вопроса: 1) если у нас есть обычный язык L и связанный с ним DFA, можем ли мы сделать его циркулярным? 2) Для любого языка L верно ли, что circ (L) регулярный или имеет некоторые хорошие свойства?
Суреш Венкат
PS Возможно, это очевидно, но почему вы думаете, что циркулярные языки являются подклассом обычных языков?
Суреш Венкат
3
@ Суреш, я думаю, что он определяет язык как круговой, если он а) регулярный; б) удовлетворяет замкнутости W L , N N : W пLwL,nN:wnL .
Питер Тейлор
Кросспост в МО .
Сянь-Чи Чанг 之 之
1
Может быть, спасибо не следует публиковать, но это был мой первый вопрос, и я высоко оценил качество комментариев, ответов и обсуждения. Благодарю.
vincenzoml

Ответы:

19

В первой части мы показываем экспоненциальный алгоритм для определения округлости. Во второй части мы покажем, что эта проблема трудоемкая. В третьей части мы покажем, что каждый циркулярный язык является объединением языков вида r +r+ (здесь r может быть пустым регулярным выражением); союз не обязательно не пересекается. В четвертой части мы показываем круговой язык, который нельзя записать в виде непересекающейся суммы r + i .rr+i

Изменить: Внесены некоторые исправления после комментариев Марка. В частности, мои более ранние утверждения о том, что цикличность является coNP-полной или NP-сложной, исправлены.

Редактировать: Исправлена ​​нормальная форма из r iri до r + i . Выставлен «по своей сути неоднозначный» язык.r+i


Продолжая комментарий Питера Тейлора, вот как решить (крайне неэффективно), является ли язык круговым, учитывая его DFA. Построить новый DFA, чьи состояния являются n- корнями старых состояний. Этот новый DFA запускает n копий старого DFA параллельно.nn

Если язык не циклический, то есть слово w, такое, что если мы несколько раз пропустим его через DFA, начиная с начального состояния s 0 , то получим состояния s 1 , , s n такие, что s 1 принимает, кроме одного из других не принимает (если все они принимают, то последовательность s 0 , , s nws0s1,,sns1s0,,sn должна циклически изменяться, чтобы w всегда было в языке). Другими словами, у нас есть путь от s 0 , , s nw- от 1 до s 1 ,, s n, где s 1 принимает, но один из других не принимает. И наоборот, если язык круговой, то этого не может быть.s0,,sn1s1,,sns1

Таким образом, мы сократили проблему до простого теста направленной достижимости (просто отметьте все возможные «плохие» n- кортежи).n


Проблема округлости является трудоемкой. Предположим, нам дан экземпляр 3SAT с n переменными x и m предложениями C 1 , , C m . Можно предположить, что n = mnx⃗ mС1,,Cmn=m (добавить фиктивные переменные) и что n простое (иначе найти простое число между n и 2 n, используя тестирование простоты AKS, и добавить фиктивные переменные и предложения).nn2n

Рассмотрим следующий язык: «вход не имеет форму x 1x n, где x i - удовлетворительное присваивание для C i ». Для этого языка легко построить O ( n 2 ) DFA. Если язык не круговой, то в языке есть слово w , некоторая сила которого не в языке. Поскольку единственные слова, отсутствующие в языке, имеют длину nx⃗ 1x⃗ nx⃗ iCiO(n2)w 2 , w должно иметь длину 1 или n . Если это длиныn2w1n1 , рассмотрим w n (оно все еще на языке), так что w на языке, а w n на языке. Тот факт, что w n отсутствует в языке, означает, что w является удовлетворительным назначением.1wnwwnwnw

И наоборот, любое удовлетворительное присваивание переводится как слово, доказывающее некруглость языка: удовлетворяющее присваивание w принадлежит языку, а w n - нет. Таким образом, язык является круговым, если экземпляр 3SAT неудовлетворителен.wwn


В этой части мы обсудим нормальную форму для циркулярных языков. Рассмотрим некоторый DFA для кругового языка L . Последовательность C = C 0 , ... в реальном , если C 0 = s (начальное состояние), все остальные государства принимают и C я = C J означает C ILC=C0,C0=sCi=Cj + 1 = С J + 1 . Таким образом, каждая действительная последовательность в конечном итоге является периодической, и существует только конечное число действительных последовательностей (поскольку DFA имеет конечное число состояний).Ci+1=Cj+1

Мы говорим, что слово ведет себя согласно C,C если слово переводит DFA из состояния c i в состояние c i + 1 для всех i . Множество всех таких слов E ( C )cici+1iE(C) регулярно (аргумент аналогичен первой части этого ответа). Заметим , что Е ( С ) представляет собой подмножество L .E(C)L

Для реальной последовательности C определите C k как последовательность C k ( t ) = C ( k t ) . Последовательность C k также действительна. Поскольку существует только конечное число различных последовательностей C k , язык D ( C ), являющийся объединением всех E ( C k ) , также является регулярным.CCkCk(t)=C(kt)CkCkD(C)E(Ck)

Покажем, что D ( C ) обладает тем свойством, что если x , y D ( C ), то x y D ( C ) . Действительно, предположим, что x C k и y C l . Тогда x y C k + l . Таким образом, D ( C ) = D ( C ) + можно записать в виде rD(C)x,yD(C)xyD(C)xCkyClxyCk+lD(C)=D(C)++ для некоторого регулярного выражения r .r+r

Каждое слово ш в языке соответствует некоторой реальной последовательности C , то существует реальная последовательность C , что ж ведет себя в соответствии с. Таким образом , L является объединением D ( C ) в течение всего действительной последовательности C . Поэтому каждый циркулярный язык имеет представление вида r + i . И наоборот, каждый такой язык является круговым (тривиально).wCCwLD(C)Cr+i


Рассмотрим круговой язык L всех слов над a , b, которые содержат четное число или a 's или четное число b ' (или оба). Покажем, что она не может быть записана как непересекающаяся сумма r + i ; под «дизъюнктом» мы подразумеваем, что r + irLa,babr+i + j =.r+ir+j=

Пусть N i будет размером некоторого DFA для r + i , а N > max N i будет нечетным целым числом. Рассмотрим x = a N b N ! , Поскольку x L , x r + i для некоторого i . По насосным леммам, можно накачать префикс х длин не более N . Таким образом, r + i порождает z = a N !Nir+iN>maxNix=aNbN!xLxr+iixNr+iб N ! , Точно так же y = a N ! b N порождается некоторым r + j , что также порождает z . Обратите вниманиечто я J , так как х у L . Таким образом, представление не может быть дизъюнктивным.z=aN!bN!y=aN!bNr+jzijxyL

Юваль Фильмус
источник
Кажется, здесь есть ряд ошибок. Вы сокращаете с UNSAT, а не с SAT, поэтому вы показываете, что это тяжело. Какое свидетельство о полиномиальном времени для (не) членства?
Марк Рейтблатт
«Поскольку единственные слова не в языке имеют длину n 2 » Разве это не должно быть n m ? n2nm
Марк Рейтблатт
Я не думаю, что это "тривиально в coNP". По крайней мере, это не очевидно для меня. «Очевидным» сертификатом будет строка l в языке и степень k, такая что l k отсутствует в языке. Но для меня не сразу понятно, почему такое слово должно иметь полиномиальный размер. Возможно, из-за простого факта теории автоматов я упускаю из виду. lklk
Марк Рейтблатт
Еще более серьезный очевидный недостаток заключается в том, что вы переходите от каждого предложения, которое является удовлетворительным в отдельности, ко всей формуле, которая может быть удовлетворена. Если, конечно, я неправильно читаю.
Марк Рейтблатт
Я согласен с тем, что не ясно, что цикличность в coNP. С другой стороны, я не вижу проблем в остальной части аргумента (теперь, когда я поставил n = m ). Если каждое предложение удовлетворяется одним и тем же назначением, то это назначение удовлетворяет экземпляру 3SAT. n=m
Юваль Фильмус
17

Вот некоторые документы, которые обсуждают эти языки:

Тьерри Кашат, Сила однобуквенных рациональных языков, DLT 2001, Springer LNCS # 2295 (2002), 145-154.

S. Hovath, P. Leupold, G. Lischke, Корни и возможности регулярных языков, DLT 2002, Springer LNCS # 2450 (2003), 220-230.

H. Bordihn, «Контекстно-свободная сила власти контекстно-свободных языков неразрешима», TCS 314 (2004), 445-449.

Джеффри Шаллит
источник
6

@ Дэйв Кларк, L = a * | b * будет круглым, но L * будет (a | b) *.

С точки зрения разрешимости язык L является круговым, если существует L ′, такой что L является замыканием под + L , или если он является конечным объединением круговых языков.LLLL

(Мне не терпится переопределить «циклический», заменив ваш > на . Это многое упрощает. Затем мы можем охарактеризовать циклические языки как те, для которых существует NDFA, начальное состояние которого имеет только эпсилон-переходы в принимающие состояния и имеет эпсилон-переход к каждому принимающему состоянию).>

Питер Тейлор
источник
Вы правы. Я удалил свой неправильный пост.
Дэйв Кларк
Что касается адаптации с : я думаю, что минимальный DFA всегда должен иметь ровно одно принимающее состояние, а именно начальное состояние. Может быть, может случиться больше принимающих состояний, но тогда им нужен ε- переход в начальное состояние. ε
Рафаэль
1
@ Рафаэль, рассмотри еще раз L = a * | b *. DFA, начальное состояние которого является единственным принимающим состоянием и которое принимает a и b, должно принимать (a | b) *.
Питер Тейлор
По вопросу о разрешимости, опять же: предположим, у вас есть DFA с n состояниями, которые принимает n a . Предположим, что он принимает слово w , а также принимает w 2 , w 3 , ..., w n a + 1 . Тогда он принимает w x для x > 0 . (Доказательство - это прямое применение принципа голубя). Если возможно показать, что минимальный (минимизирующий | w | ) контрпример ( w , xnnaww2w3wna+1wxx>0|w|wx) если округлость языка, принятого DFA, имеет длину, ограниченную функцией n, то возможно тестирование методом грубой силы. Я подозреваю, что | ш | < = n + 1 , но я этого не доказал. n|w|<=n+1
Питер Тейлор
Чтобы продолжить идею @ Рафаэля выше. Идея начального состояния = только принять состояние неверна для этой проблемы, но она действительно отражает некоторые интересные свойства. Когда M является minDFA, начальное состояние является единственным допустимым состоянием, если и только если L (M) является звездой Клини без префиксного языка. Это один из моих любимых лакомых кусочков DFA, поэтому я быстро поделюсь им! ;)
mikero
5

Изменить: Полное (упрощенное) доказательство полноты PSPACE появляется ниже.

Два обновления. Во-первых, нормальная форма, описанная в моем другом ответе, появляется уже в статье Calbrix и Nivat под названием « Префикс и периодические языки рациональных ω- языков».ω , к сожалению, недоступной в Интернете.

Во-вторых, решение о том, является ли язык циклическим, учитывая, что его DFA является PSPACE-полным.

Круговая форма в PSPACE. Так как NPSPACE = PSPACE по теореме Савича, достаточно дать алгоритм NPSPACE для некруглости. Пусть A = ( Q , Σ , δ , q 0 , F ) DFA с | Q | = n государств. Тот факт, что синтаксический моноид L ( A ) имеет размер не более n n, подразумевает, что если L ( A ) не является круговым, то существует слово w длиной не более n nA=(Q,Σ,δ,q0,F)|Q|=nL(A)nnL(A)wnnтакой, что w L ( A ), но w kL ( A ) для некоторого k n . Алгоритм догадок ж и вычисляет & delta ; ш ( д ) = δ ( д , ш ) для всех д Q , используя O ( п войти п ) пространства (используется для подсчета до п п ). Затем он проверяет, что δ w (wL(A)wkL(A)knwδw(q)=δ(q,w)qQO(nlogn)nnq 0 ) F, но δ ( k ) wF для некоторого k n .δw(q0)Fδ(k)wFkn

Круглость PSPACE-сложная. Козен показал в своей классической работе 1977 г. « Нижние оценки для систем естественных доказательств», что с учетом списка DFA трудно решить, является ли пересечение принятых ими языков пустым. Мы сводим эту проблему к круглости. Для заданных двоичных DFA A 1 , , A n мы находим простое число p [ n , 2 n ] и строим троичную DFA A, принимающую язык L ( A ) = ¯ { 2 w 1 2 w 2A1,,Anp[n,2n]A2 w p : w iL ( A 1 + ( iмодификациян ) )}. (Приложив немного больше усилий, мы также можем сделатьдвоичный файлA). Нетрудно увидеть (используя тот факт, чтоpпростое), чтоL(A)является круговым тогда и только тогда, когда пересечениеL(A1)L(An)пусто.

L(A)={2w12w22wp:wiL(A1+(imodn))}¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯.
ApL(A)L(A1)L(An)
Юваль Фильмус
источник
0

Любое s L длины p > 0 можно записать в виде x y i z, где x = z = ϵ , y = w ϵ . Очевидно, что | х у | p и | у | = | ш | > 0 . Отсюда следует, что язык является регулярным для непустых входов по лемме накачки.sLp>0xyizx=z=ϵy=wϵ|xy|p|y|=|w|>0

Для w = ϵ определение выполняется, поскольку NDFA, который принимает пустую строку, также будет принимать любое количество пустых строк.w=ϵ

Объединение вышеуказанных языков - это язык L, и поскольку регулярные языки закрыты при объединении, из этого следует, что каждый циркулярный язык является регулярным.

По теореме Райс C I R C U L A R I T Y / T M неразрешима. Доказательство аналогично регулярности.CIRCULARITY/TM

chazisop
источник
1
Лемма накачки является необходимым, но не достаточным условием регулярности. В частности, существуют нерегулярные языки, удовлетворяющие условию накачки. Кроме того , Райс теорема будет сказать , что { M | L ( M )  круговая } неразрешима. Это вовсе не означает , что { D | L ( D )  круговая } неразрешима (где D - DFA, M a TM)! Например, тестирование пустоты для DFA является решающим, в то время как тестирование пустоты для TM - нет. {M|L(M) is circular}{D|L(D) is circular}DM
альпог
1
Here's a non-computable circular language. Let D={0x1:xR}D={0x1:xR}, where RR is some non-computable language (e.g. codes of halting TMs). Then D is circular but clearly non-computable (an oracle for D can be used to decide R).
Yuval Filmus
2
@Peter, have you read this answer? It was trying to prove that any circular language (without the condition of regularity) is regular.
Yuval Filmus
1
@Yuval, my mistake. @chazisop, the pumping lemma is useful for proving non-regularity of languages, but not regularity. (Besides, the assertion of your first sentence reduces to "Every sL of length p>0 can be written as yi where yϵ", which is clearly false).
Peter Taylor
1
Yes, I use CIRCULARITY/TM to refer to this. CIRCULARITY/DFA is probably decidable.
chazisop