Количество слов заданной длины на обычном языке

Существует ли алгебраическая характеристика числа слов заданной длины в обычном языке?

Википедия приводит результат несколько неточно:

Для любого регулярного языка существуют константы и многочлены таким образом, что для каждого числа из слова длины в удовлетворяют уравнению . $L$ $\lambda_1,\,\ldots,\,\lambda_k$ $p_1(x),\,\ldots,\,p_k(x)$ $n$ $s_L(n)$ $n$ $L$ $s_L(n)=p_1(n)\lambda_1^n+\dotsb+p_k(n)\lambda_k^n$

Не указано, в каком пространстве живут $\lambda$ ( я полагаю, $\mathbb{C}$ ) и требуется, чтобы функция имела неотрицательные целочисленные значения по всем $\mathbb{N}$ . Я хотел бы точное утверждение, и эскиз или ссылку для доказательства.

Дополнительный вопрос: верно ли обратное, то есть задана ли функция этой формы, всегда ли существует регулярный язык, число слов которого в длину равно этой функции?

_{Этот вопрос обобщает количество слов на обычном языке $(00)^*$}

formal-languages regular-languages word-combinatorics Жиль "ТАК - перестань быть злым"
источник

Эскиз доказательства здесь

Артем Казнатчеев

@ArtemKaznatcheev Интересно, спасибо. Не могли бы вы переместить свой ответ на этот вопрос, который подходит лучше?

Жиль "ТАК - перестань быть злым"

Я чувствую, что этот вопрос немного излишний (хотя и более общий). Обобщать мой подход к доказательству немного сложно, но я посмотрю после обеда.

Артем Казнатчеев

@ArtemKaznatcheev Спасибо. У меня были проблемы со второй частью вашего ответа, распространяющейся на сокращаемые DFA.

Жиль "ТАК - прекрати быть злым"

@vzn Классический факт, что производящая функция числа слов в регулярном языке рациональна, что сразу подразумевает формулу ОП (в ее правильном виде). Трудной частью является извлечение асимптотики. Для подробностей вы можете проверить (например) книгу Analytic Combinatorics, упомянутую в моем ответе.

Юваль Фильмус

Ответы:

Для регулярного языка рассмотрим некоторый DFA, принимающий , пусть будет его матрицей переноса ( - это число ребер, ведущих из состояния в состояние ), пусть будет характеристическим вектором начального состояния, и пусть будет характерным вектором принимающих состояний. Тогда $L$ $L$ $A$ $A_{ij}$ $i$ $j$ $x$ $y$

s_{L} (N) знак равно {Икс}^{T} A^{N} Y,

$s_L(n) = x^T A^n y.$

Теорема Джордана утверждает, что по комплексным числам подобна матрице с блоками одной из форм Если , то Силы этих блоков $A$

(\begin{matrix} λ \end{matrix}), (\begin{matrix} λ & 1 \\ 0 & λ \end{matrix}), (\begin{matrix} λ & 1 & 0 \\ 0 & λ & 1 \\ 0 & 0 & λ \end{matrix}), (\begin{matrix} λ & 1 & 0 & 0 \\ 0 & λ & 1 & 0 \\ 0 & 0 & λ & 1 \\ 0 & 0 & 0 & λ \end{matrix}), ...

$\begin{pmatrix} \lambda \end{pmatrix}, \begin{pmatrix} \lambda & 1 \\ 0 & \lambda \end{pmatrix}, \begin{pmatrix} \lambda & 1 & 0 \\ 0 & \lambda & 1 \\ 0 & 0 & \lambda \end{pmatrix}, \begin{pmatrix} \lambda & 1 & 0 & 0 \\ 0 & \lambda & 1 & 0 \\ 0 & 0 & \lambda & 1 \\ 0 & 0 & 0 & \lambda \end{pmatrix}, \ldots$

λ \neq 0

$\lambda \neq 0$

n

$n$

(\begin{matrix} λ^{N} \end{matrix}), (\begin{matrix} λ^{N} & N λ^{N - 1} \\ 0 & λ^{N} \end{matrix}), (\begin{matrix} λ^{N} & N λ^{N - 1} & (\binom{N}{2}) λ^{N - 2} \\ 0 & λ^{N} & N λ^{N - 1} \\ 0 & 0 & λ^{N} \end{matrix}), (\begin{matrix} λ^{N} & N λ^{N - 1} & (\binom{N}{2}) λ^{N - 2} & (\binom{N}{3}) λ^{N - 3} \\ 0 & λ^{N} & N λ^{N - 1} & (\binom{N}{2}) λ^{N - 2} \\ 0 & 0 & λ^{N} & N λ^{N - 1} \\ 0 & 0 & 0 & λ^{N} \end{matrix}), ...

$\begin{pmatrix} \lambda^n \end{pmatrix}, \begin{pmatrix} \lambda^n & n\lambda^{n-1} \\ 0 & \lambda^n \end{pmatrix}, \begin{pmatrix} \lambda^n & n\lambda^{n-1} & \binom{n}{2} \lambda^{n-2} \\ 0 & \lambda^n & n\lambda^{n-1} \\ 0 & 0 & \lambda^n \end{pmatrix}, \begin{pmatrix} \lambda^n & n\lambda^{n-1} & \binom{n}{2}\lambda^{n-2} & \binom{n}{3}\lambda^{n-3} \\ 0 & \lambda^n & n\lambda^{n-1} & \binom{n}{2}\lambda^{n-2} \\ 0 & 0 & \lambda^n & n\lambda^{n-1} \\ 0 & 0 & 0 & \lambda^n \end{pmatrix}, \ldots$ Вот как мы получили по этим формулам: записать блок как . Последовательные степени являются последовательными вторичными диагоналями матрицы.

B = λ + N

$B = \lambda + N$

N

$N$

λ

$\lambda$

N

$N$

В^{N} знак равно (λ + N)^{N} знак равно λ^{N} + N λ^{N - 1} N + (\binom{N}{2}) λ^{N - 2} N^{2} + \dots,

$B^n = (\lambda + n)^N = \lambda^n + n \lambda^{n-1} N + \binom{n}{2} \lambda^{n-2} N^2 + \cdots.$ Когда , блок является нильпотентным, и мы получаем следующие матрицы (запись равна если и противном случае):

λ = 0

$\lambda = 0$

[n = k]

$[n = k]$

1

$1$

n = k

$n=k$

0

$0$

(\begin{matrix} [N знак равно 0] \end{matrix}), (\begin{matrix} [N знак равно 0] & [N знак равно 1] \\ 0 & [N знак равно 0] \end{matrix}), (\begin{matrix} [N знак равно 0] & [N знак равно 1] & [N знак равно 2] \\ 0 & [N знак равно 0] & [N знак равно 1] \\ 0 & 0 & [N знак равно 0] \end{matrix}), (\begin{matrix} [N знак равно 0] & [N знак равно 1] & [N знак равно 2] & [N знак равно 3] \\ 0 & [N знак равно 0] & [N знак равно 1] & [N знак равно 2] \\ 0 & 0 & [N знак равно 0] & [N знак равно 1] \\ 0 & 0 & 0 & [N знак равно 0] \end{matrix})

$\begin{pmatrix} [n=0] \end{pmatrix}, \begin{pmatrix} [n=0] & [n=1] \\ 0 & [n=0] \end{pmatrix}, \begin{pmatrix} [n=0] & [n=1] & [n=2] \\ 0 & [n=0] & [n=1] \\ 0 & 0 & [n=0] \end{pmatrix}, \begin{pmatrix} [n=0] & [n=1] & [n=2] & [n=3] \\ 0 & [n=0] & [n=1] & [n=2] \\ 0 & 0 & [n=0] & [n=1] \\ 0 & 0 & 0 & [n=0] \end{pmatrix}$

Подводя итог, можно сказать, что каждая запись в имеет вид или форму , и мы что для некоторых комплексных и комплексных полиномов . В частности, при достаточно больших , Это точное утверждение результата. $A^n$ $\binom{n}{k} \lambda^{n-k}$ $[n=k]$

s_{L} (N) знак равно \underset{я}{Σ} п_{я} (N) λ_{я}^{N} + \underset{J}{Σ} с_{J} [N знак равно J],

$s_L(n) = \sum_i p_i(n) \lambda_i^n + \sum_j c_j [n=j],$

λ_{i}, c_{j}

$\lambda_i,c_j$

p_{i}

$p_i$ $n$

s_{L} (N) знак равно \underset{я}{Σ} п_{я} (N) λ_{я}^{N},

$s_L(n) = \sum_i p_i(n) \lambda_i^n.$

Мы можем продолжить и получить асимптотическую информацию о , но это удивительно нетривиально. Если существует уникальный наибольшей величины, скажем, , то Все становится сложнее, когда есть несколько с наибольшей величиной. Так получилось, что их угол должен быть рациональным (т.е. с точностью до величины они являются корнями единства). Если LCM знаменателей равен , то асимптотика будет очень соответствовать остатку от по модулю . Для некоторых из этих остатков все $s_L(n)$ $\lambda_i$ $\lambda_1$

s_{L} (N) знак равно п_{1} (N) λ_{1}^{N} (1 + о (1)),

$s_L(n) = p_1(n) \lambda_1^n (1 + o(1)).$

λ

$\lambda$

d

$d$

s_{L}

$s_L$

n

$n$

d

$d$

λ

$\lambda$ s наибольшей величины отменяются, и затем асимптотика «падает», и мы должны повторить эту процедуру. Заинтересованный читатель может проверить подробности в « Аналитической комбинаторике Флайолета и Седжвика» , теорема V.3. Они доказывают, что для некоторых целые числа и действительные числа ,

d

$d$

p_{0}, \dots, p_{d - 1}

$p_0,\ldots,p_{d-1}$

λ_{0}, \dots, λ_{d - 1}

$\lambda_0,\ldots,\lambda_{d-1}$

s_{L} (N) знак равно N^{п_{N (модификация d)}} λ_{N (модификация d)}^{N} (1 + о (1)),

$s_L(n) = n^{p_{n\pmod{d}}} \lambda_{n\pmod{d}}^n (1 + o(1)).$

Юваль Фильмус
источник

Пусть обычный язык и $L \subseteq \Sigma^*$

$\qquad \displaystyle L(z) = \sum\limits_{n \geq 0} |L_n|z^n$

его производящая функция , где и т. д. . $L_n = L \cap \Sigma^n$ $|L_n|=s_L(n)$

Известно , что является рациональным , т.е. $L(z)$

$\qquad \displaystyle \frac{P(z)}{Q(z)}$

с полиномами; это легче всего увидеть, переведя линейно-правую грамматику для в (линейную!) систему уравнений, решением которой является . $P,Q$ $L$ $L(z)$

Корни по существу ответственны за, что приводит к форме, указанной в Википедии. Это непосредственно связано с методом характеристических полиномов для решения повторений (через повторение, которое описывает ). $Q$ $|L_n|$ $(|L_n|)_{n \in \mathbb{N}}$

Рафаэль
источник

Не ясно, как ваш ответ отвечает на вопрос. Кроме того, что такое ?

L_{n}

$L_n$

Дейв Кларк

@Gilles Analytic Combinatorics , книги Эйленберга, книга Берстеля, Рейтенауэр

2012 г.

@ Жиль Теоретические аспекты формальных степенных рядов.

ул

@ Patrick87: 1) Верно, опечатка; Благодарность! 2) Для конечных языков порождающая функция является полиномом (и вместе с тем рациональным). Поскольку , этот подход не будет работать. Связанная теорема начинается с линейного однородного повторения; Я не думаю, что они могут описывать последовательности, которые являются нулевыми для всех (и ненулевыми для хотя бы одного значения). Не уверен, хотя. Если я прав, то утверждение, о котором мы говорим, действительно справедливо только для бесконечных регулярных языков; это не было бы совершенно удивительно, поскольку конечные языки не имеют никакой структуры.

Q (z) = 1

$Q(z)=1$

k \geq n_{0}

$k \geq n_0$

Рафаэль

@ Рафаэль Да, мое мышление было схожим ... это представляется довольно серьезным недостатком в изложении теоремы, если оно не выполняется для конечных языков, поскольку (а) конечные языки являются регулярными, (б) теорема подразумевает, что конечные языки не являются регулярными, и (c) определение того, является ли язык конечным, (вообще) неразрешимо ... Я имею в виду, что у Myhill-Nerode и леммы прокачки такой проблемы нет; они работают для конечных языков.

Patrick87