Вычислительная сложность запросов SQ-обучения

12

Известно, что для обучения PAC существуют естественные классы понятий (например, подмножества списков решений), для которых существуют полиномиальные разрывы между сложностью выборки, необходимой для теоретического обучения информации неограниченным в вычислительном отношении учеником, и сложностью выборки, необходимой для полиномиального ученик времени (см., например, http://portal.acm.org/citation.cfm?id=267489&dl=GUIDE или http://portal.acm.org/citation.cfm?id=301437 )

Эти результаты, похоже, зависят от кодирования секрета в конкретных примерах, однако, и поэтому не переводятся естественным образом в SQ-модель обучения, где учащийся просто начинает запрашивать статистические свойства распределения.

Известно ли, существуют ли классы понятий, для которых теоретико-информационное обучение в модели SQ возможно с O (f (n)) запросами, но эффективное с точки зрения вычислений обучение возможно только с Omega (g (n)) запросами для g (n) ) >> f (n)?

Аарон Рот
источник

Ответы:

9

Я задал (сам) этот вопрос некоторое время назад. По крайней мере, для обучения в отношении конкретного распределения существует довольно простой пример концептуального класса, который теоретически может быть изучен на SQ, но труден для изучения SQ на NP. Пусть \ phi - двоичная кодировка экземпляра SAT, а y - его лексикографически первое удовлетворяющее присвоение (или 0 ^ n - это экземпляр неудовлетворительный). Пусть теперь функция f (\ phi) - это то, что над одной половиной домена является MAJ (\ phi), а над второй половиной домена равен PAR (y). Здесь MAJ - функция большинства над переменными, которые установлены в 1 в строке \ phi, а PAR (y) - функция контроля четности по переменным, которые установлены в 1 в строке y. Пусть F - класс функций, полученных таким образом. Чтобы SQ выучить F по равномерному распределению U, нужно только изучить большинство (что легко), чтобы найти \ phi, а затем найти y. С другой стороны, довольно просто уменьшить SAT до SQ обучения F (с любой точностью, заметно превышающей 3/4) по равномерному распределению. Причина этого, естественно, заключается в том, что четности по существу "невидимы" для SQ, и, следовательно, необходимо изучать SAT для изучения F.

Виталий
источник
5

Это хороший вопрос. Сила модели статистического запроса заключается именно в способности доказать безусловные нижние границы для обучения с SQ - например, четность не может быть изучена с помощью статистических запросов с полиномиальным числом.

Я не в курсе результатов формы, которую вы спрашиваете, но, возможно, мы упускаем что-то очевидное ...

Лев Рейзин
источник