Вопросы с тегом «machine-learning»

14
Перестановочные инвариантные нейронные сети

Дана нейронная сеть fff которая принимает в качестве входных данных nnn точек: x1,…,xnx1,…,xnx_1, \dots, x_n . Мы говорим, что fff является перестановкой, если f(x1...xn)=f(pi(x1...xn))f(x1...xn)=f(pi(x1...xn))f(x_1 ... x_n) = f(pi(x_1 ... x_n)) для любой перестановки р япяpi . Может ли кто-нибудь...

14
Правила обработки информации из гештальт-психологии все еще используются сегодня в компьютерном зрении?

Несколько десятилетий назад были и есть книги по машинному зрению, которые, внедрив различные правила обработки информации из гештальт-психологии, получили впечатляющие результаты с небольшим кодом или специальным оборудованием для идентификации изображений и визуальной обработки. Такие методы...

13
Почему вы не видите выпадающих слоев на примерах обучения подкреплению?

Я смотрел на обучение подкрепления и, в частности, пытался создавать свои собственные среды для использования с OpenAI Gym AI. Я использую агентов из проекта stable_baselines для тестирования с ним. Одна вещь, которую я заметил практически во всех примерах RL, заключается в том, что ни в одной из...

13
Какую функцию активации использует мозг человека?

Использует ли человеческий мозг определенную функцию активации? Я попытался провести какое-то исследование, и поскольку это порог для того, посылается ли сигнал через нейрон или нет, это звучит очень похоже на ReLU. Однако я не могу найти ни одной статьи, подтверждающей это. Или это больше похоже...

13
Как выбрать функцию активации?

Я выбираю функцию активации для выходного слоя в зависимости от того, какой вывод мне нужен, и от свойств функции активации, которые я знаю. Например, я выбираю сигмовидную функцию, когда я имею дело с вероятностями, ReLU, когда я имею дело с положительными значениями, и линейную функцию, когда я...

12
Какая тактика для распознавания искусственно созданных СМИ?

С растущей способностью дешево создавать поддельные картинки, поддельные звуковые фрагменты и поддельное видео становится все более актуальной проблема распознавания того, что реально, а что нет. Даже сейчас мы видим ряд примеров приложений, которые создают поддельные носители за небольшую плату...

12
Разработка AI для анализа файла журнала

Я разрабатываю инструмент ИИ, чтобы найти ошибки известного оборудования и найти новые схемы отказа. Этот файл журнала основан на времени и содержит известные сообщения (информация и ошибка). Я использую библиотеку JavaScript. Событие сбрасывается, чтобы мягко показывать данные, но моя настоящая...

12
Как работают генеративные состязательные сети?

Я читаю о порождающих состязательных сетях (GAN), и у меня есть некоторые сомнения относительно этого. До сих пор я понимаю, что в GAN существует два разных типа нейронных сетей: один является порождающим ( ), а другой - дискриминационным ( ). Генеративная нейронная сеть генерирует некоторые...

12
Должны ли глубокие остаточные сети рассматриваться как совокупность сетей?

Речь идет об архитектуре Deep Residual Networks ( ResNets ). Модель, занявшая 1-е место на «Large Scale Visual Recognition Challenge 2015» (ILSVRC2015) по всем пяти основным трекам: Классификация ImageNet: «Сверхглубокие» (цитата Янн) 152-слойные сетки Обнаружение ImageNet: 16% лучше, чем второе...

11
Как оставаться современным исследователем в сообществе ML / RL?

Как студент, который хочет работать над машинным обучением, я хотел бы знать, как можно начать учебу и как следовать ей, чтобы оставаться в курсе. Например, я готов работать над проблемами RL и MAB, но есть огромная литература по этим темам. Кроме того, эти темы изучаются исследователями из...

11
Каковы последние методы для обучения чат-бота?

Я хотел бы обучить бота, который использует ввод текста, запоминает несколько категорий и отвечает на вопросы соответственно. В дополнение к версии 2.0, я хочу, чтобы бот отвечал и на голосовой ввод. Какие последние алгоритмы машинного обучения / ИИ доступны для того же? Пожалуйста, дайте мне...

11
Каковы особенности узкого места?

В посте блога Создание мощных моделей классификации изображений с использованием очень небольшого количества данных упоминаются узкие места. Каковы особенности узкого места? Они меняются в зависимости от используемой архитектуры? Являются ли они окончательным выходом сверточных слоев перед...

11
Как AI будет изучать язык?

Я думал об ИИ и о том, как они будут работать, когда понял, что не могу придумать, как ИИ можно учить языку. Ребенок имеет тенденцию изучать язык через ассоциации языка и изображений с объектом (например, люди, говорящие слово «собака», когда они находятся рядом с собакой, а затем понимающие, что...

11
Для чего используются все виды нейронных сетей?

Я нашел следующую шпаргалку нейронной сети ( шпаргалки для ИИ, нейронных сетей, машинного обучения, глубокого обучения и больших данных ). Для чего используются все эти разные виды нейронных сетей? Например, какие нейронные сети можно использовать для регрессии или классификации, которые можно...

11
Потеря резко возрастает, когда я теряю скорость обучения с помощью оптимизатора Адама в PyTorch

Я тренирую auto-encoderсеть с Adamоптимизатором (с amsgrad=True) и MSE lossдля одноканальной задачи разделения аудиоисточников. Всякий раз, когда я уменьшаю скорость обучения на коэффициент, потери в сети резко скачут, а затем уменьшаются до следующего снижения скорости обучения. Я использую...

11
Каковы основные проблемы, мешающие развитию современного ИИ?

Я имею опыт работы в области компьютерной инженерии и работаю над созданием лучших алгоритмов, чтобы имитировать человеческое мышление. (Одним из моих любимых является Аналоговое моделирование применительно к языковой обработке и принятию решений.) Однако чем больше я исследую, тем больше понимаю,...

11
Как выбрать соответствующие характеристики данных?

Недавно я работал над проблемой, чтобы провести некоторый анализ затрат на определенный ресурс. Я обычно принимаю некоторые ручные решения из анализа и планирую соответственно. У меня есть большой набор данных в формате Excel и с сотнями столбцов, определяющих использование ресурса в различных...

10
Какое значение имеет теорема «Нет бесплатного обеда» для машинного обучения?

Теорема об отсутствии бесплатного обеда (НФЛ) (см. Статью «Коэволюционные бесплатные обеды » Дэвида Х. Вольперта и Уильяма Дж. Макриди) любые два алгоритма эквивалентны, когда их производительность усредняется по всем возможным проблемам Действительно ли теорема «Нет бесплатного обеда» верна? Что...