Вопросы с тегом «deep-learning»

12
Есть ли какой-либо научный / математический аргумент, который мешает глубокому обучению создавать сильный ИИ?

Я читаю книгу Иудеи Перл « Книга почему» , в которой он упоминает, что глубокое обучение - это просто прославленная технология подбора кривых, и она не сможет производить интеллект, подобный человеку. Из его книги приведена схема, иллюстрирующая три уровня когнитивных способностей: Идея состоит в...

12
Можно ли использовать BERT для создания предложений?

Я новый ученик в НЛП. Я заинтересован в задаче генерации предложений. Насколько мне известно, одним из современных методов является CharRNN , который использует RNN для генерации последовательности слов. Тем не менее, BERT вышел несколько недель назад и является очень мощным. Поэтому мне интересно,...

12
Как работают генеративные состязательные сети?

Я читаю о порождающих состязательных сетях (GAN), и у меня есть некоторые сомнения относительно этого. До сих пор я понимаю, что в GAN существует два разных типа нейронных сетей: один является порождающим ( ), а другой - дискриминационным ( ). Генеративная нейронная сеть генерирует некоторые...

12
Должны ли глубокие остаточные сети рассматриваться как совокупность сетей?

Речь идет об архитектуре Deep Residual Networks ( ResNets ). Модель, занявшая 1-е место на «Large Scale Visual Recognition Challenge 2015» (ILSVRC2015) по всем пяти основным трекам: Классификация ImageNet: «Сверхглубокие» (цитата Янн) 152-слойные сетки Обнаружение ImageNet: 16% лучше, чем второе...

12
Как будет масштабироваться новый «дифференцируемый нейронный компьютер» Deepmind?

Deepmind только что опубликовал статью о «дифференцируемом нейронном компьютере» , который в основном объединяет нейронную сеть с памятью . Идея состоит в том, чтобы научить нейронную сеть создавать и вызывать полезные явные воспоминания для определенной задачи. Это хорошо дополняет возможности...

11
Для чего используются все виды нейронных сетей?

Я нашел следующую шпаргалку нейронной сети ( шпаргалки для ИИ, нейронных сетей, машинного обучения, глубокого обучения и больших данных ). Для чего используются все эти разные виды нейронных сетей? Например, какие нейронные сети можно использовать для регрессии или классификации, которые можно...

11
Как можно применять градиенты политики в случае нескольких непрерывных действий?

Оптимизация политики в доверенных регионах (TRPO) и Proximal Policy Optimization (PPO) - это два передовых алгоритма градиента политики. При использовании одного непрерывного действия обычно вы используете некоторое распределение вероятностей (например, гауссово) для функции потерь. Черновая...

11
Потеря резко возрастает, когда я теряю скорость обучения с помощью оптимизатора Адама в PyTorch

Я тренирую auto-encoderсеть с Adamоптимизатором (с amsgrad=True) и MSE lossдля одноканальной задачи разделения аудиоисточников. Всякий раз, когда я уменьшаю скорость обучения на коэффициент, потери в сети резко скачут, а затем уменьшаются до следующего снижения скорости обучения. Я использую...

11
Почему глубоких нейронных сетей и глубокого обучения недостаточно для достижения общего интеллекта?

Все, что связано с Deep Learning (DL) и глубокими (er) сетями, кажется «успешным», по крайней мере, очень быстрым, развивая веру в то, что AGI достижим. Это популярное воображение. DL - это потрясающий инструмент для решения многих проблем, включая создание AGI. Однако этого недостаточно....

11
Какой слой занимает больше времени в обучении CNN? Сверточные слои против слоев FC

В Convolutional Neural Network какой слой потребляет максимальное время на тренировке? Сверточные слои или Полностью связанные слои? Мы можем взять архитектуру AlexNet, чтобы понять это. Я хочу видеть временную остановку тренировочного процесса. Мне нужно сравнение относительного времени, чтобы мы...

11
Могут ли слои глубоких нейронных сетей рассматриваться как сети Хопфилда?

Сети Хопфилда могут хранить вектор и извлекать его, начиная с шумной версии. Они делают это, устанавливая веса, чтобы минимизировать энергетическую функцию, когда все нейроны установлены равными векторным значениям, и извлекать вектор, используя его зашумленную версию в качестве входных данных и...

10
Алгоритм глубокого обучения для оптимизации результата

Я довольно плохо знаком с глубоким изучением, но я думаю, что нашел реальную реальную ситуацию, чтобы начать использовать ее. Проблема в том, что я использовал только такие алгоритмы для прогнозирования результатов. Для моего нового проекта мне нужна информация, чтобы кормить машину, чтобы...

10
ИИ, который может генерировать программы

Я смотрю в Вив искусственного интеллектуального агента в разработке. Основываясь на том, что я понимаю, этот AI может генерировать новый код и выполнять его на основе запроса от пользователя. Мне интересно узнать, как этот ИИ может научиться генерировать код на основе какого-либо запроса. Какие...

10
Каковы последние «горячие» темы исследований для глубокого обучения и искусственного интеллекта?

Я защитил кандидатскую диссертацию по глубоким генеративным моделям и сейчас ищу новый предмет. В: Какие самые «горячие» темы исследований привлекают к себе внимание сообщества глубоких знаний в последнее время? Несколько уточнений: Я просматривал похожие вопросы, и никто из них не ответил на мой...

10
Есть ли на самом деле отсутствие фундаментальной теории глубокого обучения?

Я несколько раз слышал, что одной из фундаментальных / открытых проблем глубокого обучения является отсутствие «общей теории», потому что на самом деле мы не знаем, почему глубокое обучение работает так хорошо. Даже на странице Википедии о глубоком обучении есть похожие комментарии . Являются ли...

10
Измерение размера объекта с помощью глубокой нейронной сети

У меня есть большой набор данных автомобилей с истинной длиной (более 100 тыс. Образцов). Можно ли обучить глубокую сеть для измерения / оценки длины транспортного средства? Я не видел никаких работ, связанных с оценкой размера объекта с помощью глубокой нейронной...

9
Было ли обучение игре DeepMind DQN Atari одновременно?

DeepMind заявляет, что их глубокая Q-сеть (DQN) была способна постоянно адаптировать свое поведение во время обучения игре в 49 игр Atari. Изучив все игры с одной и той же нейронной сетью, мог ли агент играть в них все одновременно на «сверхчеловеческих» уровнях (всякий раз, когда он случайно...

9
Представляют ли алгоритмы глубокого обучения ансамблевые методы?

Коротко о глубоком обучении (для справки) : Глубокое обучение - это раздел машинного обучения, основанный на наборе алгоритмов, которые пытаются моделировать абстракции высокого уровня в данных с использованием глубокого графа с несколькими уровнями обработки, состоящими из нескольких линейных и...

9
Какую часть работы Deep Mind можно воспроизвести на самом деле?

В последние годы Deep Mind опубликовал множество работ по глубокому обучению, большинство из которых посвящены современным задачам. Но сколько из этой работы было фактически воспроизведено сообществом ИИ? Например, по мнению других исследователей, бумагу Neural Turing Machine очень трудно...