Правильное PAC обучение 2-DNF при равномерном распределении

Каков современный уровень сложности запросов для правильных формул PAC, изучающих 2-DNF с типовыми запросами и при равномерном распределении ? Или какие-нибудь нетривиальные ограничения на это?

Поскольку я совсем не знаком с теорией обучения, и этот вопрос мотивирован другой областью, ответ может быть очевидным. Я проверил книгу Кернса и Вазирани, но они явно не рассматривают эту настройку явно.

UPD. Хотя основной интересующий параметр - сложность запроса, время выполнения также важно. Если возможно, время выполнения должно быть примерно таким же, как сложность запроса, или не более чем полиномиальным.

UPD. В приложении B (вверху страницы 18) к статье «Изучение субмодульных функций» Балкана и Харви упоминается, что «Хорошо известно, что 2-DNF эффективно изучаются PAC». Тем не менее, они не упоминают, является ли этот результат для правильного обучения или дают какие-либо ссылки.

reference-request lg.learning boolean-functions Григорий Ярославцев
источник

Что за запросы?

Тимоти Сан

Просто образцы. Также, я думаю, мне следует четко указать, что вопрос касается сложности запроса, а не времени выполнения (отредактировано).

Григорий Ярославцев

Я ответил на ваш вопрос, предполагая, что примеры запросов - это просто случайные примеры (а не запросы членства).

Лев Рейзин

Да, запросы - это просто случайные примеры из равномерного распределения.

Григорий Ярославцев

Я не знаю, будете ли вы считать следующее нетривиальным ограничением, но здесь я иду.

Во-первых, чтобы быть ясно, чтобы мы не путали $c$ -DNF с $k$ срок DNF (который я часто делаю), $c$ -DNF формула над переменными $x_1, \ldots, x_n$ имеет форму $\vee_{i=1}^{k}(\ell_{i,1} \wedge \ell_{i,2} ... \ell_{i,c})$ где $\forall 1 \le i \le k$ а также $1 \le j \le c$ , $\ell_{i,j} \in \{x_1, \ldots, x_n, \bar{x}_1, \ldots, \bar{x}_n \}$ ,

Сначала мы можем спросить, сколько разных терминов может существовать в $c$ -DNF. Каждый член будет иметь $c$ из $n$ переменные, каждая из которых либо отрицается, либо нет - что делает для разные возможные термины. В экземпляре 2-DNF каждый термин будет появляться или не появляться, что делает для возможных «целей», где - пространство гипотез. $2^c\binom{n}{c}$ $|\mathcal{H}| = 2^{2^c\binom{n}{c}}$ $\mathcal{H}$

Представьте себе алгоритм, который берет выборок, а затем пробует всегипотезы, пока он не найдет тот, который идеально предсказывает на выборках. Теорема Оккама о бритве говорит, что вам нужно всего лишь взять для этого алгоритма, чтобы найти цель с ошибкой с вероятностью . $m$ $|\mathcal{H}|$ $m = O(\frac{1}{\epsilon}|(\mathcal{H}|+\frac{1}{\delta})$ $\le \epsilon$ $\ge 1-\delta$

В нашем случае, , , что означает, что вам потребуется выборки для (правильного) обучения. $c=2$ $\lg|\mathcal{H}| = O(n^2)$ $n^2$

Но вся игра в обучении - это не просто сложность образца (хотя это и есть часть игры, особенно в обучении с использованием атрибутов), а скорее попытка разработать алгоритмы за полиномиальное время. Если вы не заботитесь об эффективности, тогда - самый простой ответ для сложности образца PAC. $n^2$

ОБНОВЛЕНИЕ (учитывая измененный вопрос) :

Поскольку вы прямо заявили, что заботитесь только о сложности примеров, я представил алгоритм Occam с грубой силой, который, вероятно, является самым простым аргументом. Тем не менее, мой ответ был немного застенчивым. ДНФ действительно изучаемы за полиномиальное время! Это результат оригинальной статьи Валианта « Теория обучения ». На самом деле -DNF могут быть изучены для любого . $2$ $c$ $c = O(1)$

Аргумент заключается в следующем. Вы можете рассматривать -DNF как дизъюнкцию от «метапеременных» и пытаться изучить дизъюнкцию, удаляя метапеременные, несовместимые с примерами. Такое решение может быть легко переведено обратно в «правильное» решение и занимает времени. Как примечание, все еще открыто, есть ли алгоритм полиномиального времени для . $c$ $\approx n^c$ $O(n^c)$ $c = \omega(1)$

Что касается того, является ли сложность выборки также нижней границей, ответ в значительной степени да. Эта статья Ehrenfeucht et al. показывает, что граница Оккама почти жесткая. $n^2$

Лев Рейзин
источник

Спасибо! Это нетривиальный результат - я не осознавал, что показательное время работы будет полезным. Тем не менее, для приложения, которое я имею в виду, на самом деле полиномиальное время гораздо более желательно (обновленный вопрос). Является ли описанный вами подход наиболее известным для этой проблемы? Есть ли нижние границы сложности запросов (даже для неограниченного времени выполнения)?

Григорий Ярославцев

Обновил вопрос со ссылкой, которая мотивировала вопрос.

Григорий Ярославцев

обновил ответ с учетом вашего обновленного вопроса

Лев Рейзин

Кроме того - в этом случае я не думаю, что экспоненциальное время работы полезно. Но в целом похоже. Обучение (с оптимальной сложностью выборки) обычно легко, когда у вас экспоненциальное время.

Лев Рейзин

Большое спасибо! Мне понадобится некоторое время, чтобы проверить ссылки, но пока это кажется полным ответом.

Григорий Ярославцев

Правильное PAC обучение 2-DNF при равномерном распределении

Ответы: