Вопросы с тегом «machine-learning»

Для вопросов, связанных с машинным обучением (ML), который представляет собой набор методов, которые могут автоматически обнаруживать шаблоны в данных, а затем использовать непокрытые шаблоны для прогнозирования будущих данных или для выполнения других видов принятия решений в условиях неопределенности (например, планирование как собрать больше данных). ОД обычно делят на контролируемое, неконтролируемое и подкрепляющее обучение. Глубокое обучение - это подполе ML, в котором используются глубокие искусственные нейронные сети.

75
В чем разница между искусственным интеллектом и машинным обучением?

Эти два термина, кажется, связаны, особенно в их применении в компьютерных науках и разработке программного обеспечения. Является ли подмножество другого? Один инструмент используется для построения системы для другого? Каковы их различия и почему они...

48
Почему Python такой популярный язык в области ИИ?

Прежде всего, я новичок в изучении искусственного интеллекта, и это не вопрос, ориентированный на мнение или сравнение языков программирования. Я не имею в виду, что Python - лучший язык. Но дело в том, что большинство известных фреймворков ИИ имеют основную поддержку Python. Они могут даже...

43
Как нейронные сети могут работать с различными размерами входных данных?

Насколько я могу судить, нейронные сети имеют фиксированное количество нейронов во входном слое. Если нейронные сети используются в контексте, подобном NLP, предложения или блоки текста разных размеров подаются в сеть. Как варьируется размер входного сигнала с фиксированным размером входного слоя...

38
Нейронные сети склонны к катастрофическому забвению?

Представьте, что вы показываете нейронной сети изображение льва 100 раз и помечаете его как «опасный», чтобы узнать, что львы опасны. Теперь представьте, что ранее вы показали ему миллионы изображений львов и альтернативно пометили его как «опасный» и «не опасный», так что вероятность того, что лев...

30
Почему Лисп такой хороший язык для ИИ?

Ранее я слышал от компьютерных ученых и от исследователей в области ИИ, что этот Лисп - хороший язык для исследований и разработок в области искусственного интеллекта. Это все еще применимо, с распространением нейронных сетей и глубокого обучения? Каковы были их причины для этого? На каких языках в...

28
Как выбрать количество скрытых слоев и количество ячеек памяти в LSTM?

Я пытаюсь найти некоторые существующие исследования о том, как выбрать количество скрытых слоев и размер этих RNN на основе LSTM. Есть ли статья, в которой исследуется эта проблема, т. Е. Сколько ячеек памяти следует использовать? Я предполагаю, что это полностью зависит от приложения и в каком...

23
Можно ли постепенно обучать нейронную сеть?

Я хотел бы обучить нейронную сеть, где выходные классы не определены (все) с самого начала. Все больше и больше классов будут введены позже на основе входящих данных. Это означает, что каждый раз, когда я представляю новый класс, мне нужно будет переучивать NN. Как я могу обучать NN постепенно, то...

20
Как обрабатывать недопустимые движения в обучении подкреплению?

Я хочу создать ИИ, который может играть пять в ряд / гомоку. Как я уже упоминал в названии, я хочу использовать для этого обучение с подкреплением. Я использую метод градиента политики , а именно REINFORCE, с базовым уровнем. Для приближения значения и функции политики я использую нейронную сеть ....

18
Если цифровые значения являются просто оценками, почему бы не вернуться к аналоговым для ИИ?

Толчком к переходу двадцатого века с аналоговых на цифровые схемы послужило стремление к большей точности и снижению шума. Сейчас мы разрабатываем программное обеспечение, результаты которого приблизительны, а шум имеет положительное значение. В искусственных сетях мы используем градиенты (якобиан)...

17
Различия между методами обратного распространения

Ради интереса я пытаюсь разработать нейронную сеть. Теперь для обратного распространения я увидел две техники. Первый используется здесь и во многих других местах. Что это делает: Он вычисляет ошибку для каждого выходного нейрона. Он распространяет его обратно в сеть (вычисляя ошибку для каждого...

17
Какова сложность времени для обучения нейронной сети с использованием обратного распространения?

Предположим, что NN содержит nnn скрытых слоев, mmm обучающих примеров, xxx объектов и ninin_i узлов на каждом уровне. Какова сложность времени для обучения этой NN с использованием обратного распространения? У меня есть базовая идея о том, как они находят временную сложность алгоритмов, но здесь...

17
Понимание функции потери GAN

Я изо всех сил пытаюсь понять функцию потери GAN, как это предусмотрено в статье « Понимание порождающих противоборствующих сетей» (сообщение в блоге, написанное Дэниелом Сейта). В стандартной кросс-энтропийной потере мы имеем выход, который был пропущен через сигмовидную функцию и полученную...

16
Считаются ли поисковые системы искусственным интеллектом?

Считаются ли поисковые системы искусственным интеллектом из-за того, как они анализируют то, что вы ищете, и запоминаете это? Или как они отправляют вам объявления о том, что вы искали недавно? Это считается ИИ или просто...

15
Когда глубокое обучение излишне?

Например, для классификации электронных писем как спама, имеет ли смысл - с точки зрения времени / точности - применять глубокое обучение (если возможно) вместо другого алгоритма машинного обучения? Сделает ли глубокое обучение ненужными другие алгоритмы машинного обучения, такие как наивный...

15
Почему кросс-энтропия стала стандартной функцией потерь классификации, а не дивергенцией Кульбека-Лейблера?

Перекрестная энтропия идентична дивергенции KL плюс энтропия распределения цели. KL равняется нулю, когда два распределения одинаковы, что мне кажется более интуитивным, чем энтропия целевого распределения, то есть то, что перекрестная энтропия находится на совпадении. Я не говорю, что в одном...