Вопросы с тегом «neural-network»

Сетевая структура вдохновлена ​​упрощенными моделями биологических нейронов (клеток мозга). Нейронные сети обучаются «обучению» с помощью контролируемых и неконтролируемых методов и могут использоваться для решения задач оптимизации, задач аппроксимации, классификации шаблонов и их комбинаций.

807
Какова роль смещения в нейронных сетях?

Я знаю о градиентном спуске и алгоритме обратного распространения. Чего я не понимаю, так это когда важно использовать предвзятость и как вы ее используете? Например, при отображении ANDфункции, когда я использую 2 входа и 1 выход, она не дает правильных весов, однако, когда я использую 3 входа (1...

381
Каковы преимущества искусственных нейронных сетей перед машинами опорных векторов? [закрыто]

В настоящее время этот вопрос не очень подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, вызовет дебаты, споры, опрос или расширенное обсуждение. Если вы считаете, что этот вопрос можно улучшить и,...

262
Объяснение ввода Keras: input_shape, unit, batch_size, dim и т. Д.

Для любого слоя Keras ( Layerкласс), может кто - то объяснить , как понять разницу между input_shape, units, dimи т.д.? Например, в документе сказано unitsуказать форму вывода слоя. На изображении нейронной сети ниже hidden layer1имеется 4 единицы. Относится ли это непосредственно к unitsатрибуту...

250
Что означает слово logits в TensorFlow?

В следующей функции TensorFlow мы должны обеспечить активацию искусственных нейронов в последнем слое. Это я понимаю. Но я не понимаю, почему это называется логитс? Разве это не математическая функция? loss_function = tf.nn.softmax_cross_entropy_with_logits( logits = last_layer, labels =...

201
Как интерпретировать «потери» и «точность» для модели машинного обучения

Когда я тренировал свою нейронную сеть с помощью Theano или Tensorflow, они сообщали о переменной, называемой «потерями» за эпоху. Как я должен интерпретировать эту переменную? Чем выше потери, тем лучше или хуже, или что это значит для конечной производительности (точности) моей нейронной...

168
Где я могу вызвать функцию BatchNormalization в Keras?

Если я хочу использовать функцию BatchNormalization в Keras, то нужно ли вызывать ее один раз только в начале? Я прочитал эту документацию для этого: http://keras.io/layers/normalization/ Я не понимаю, где я должен это назвать. Ниже мой код пытается использовать его: model = Sequential()...

160
Почему двоичные_кросентропии и категориальные_кросентропии дают разные результаты для одной и той же проблемы?

Я пытаюсь обучить Си-Эн-Эн классифицировать текст по темам. Когда я использую двоичную кросс-энтропию, я получаю точность ~ 80%, с категориальной кросс-энтропией я получаю точность ~ 50%. Я не понимаю, почему это так. Это проблема мультикласса, не означает ли это, что я должен использовать...

160
Зачем использовать softmax вместо стандартной нормализации?

В выходном слое нейронной сети обычно используется функция softmax для аппроксимации распределения вероятностей: Это дорого вычислять из-за показателей. Почему бы просто не выполнить Z-преобразование, чтобы все выходы были положительными, а затем нормализовать, просто разделив все выходы на сумму...

155
В чем разница между поездом, валидацией и тестовым набором в нейронных сетях?

Я использую эту библиотеку для реализации учебного агента. Я создал учебные примеры, но я не знаю точно, что такое наборы валидации и тестирования. Учитель говорит: 70% должны быть обучающими случаями, 10% будут контрольными случаями, а остальные 20% должны быть проверочными. редактировать У меня...

151
Почему мы должны нормализовать ввод для искусственной нейронной сети?

Это принципиальный вопрос, касающийся теории нейронных сетей: Почему мы должны нормализовать вход для нейронной сети? Я понимаю, что иногда, когда, например, входные значения не числовые, необходимо выполнить определенное преобразование, но когда у нас есть числовой ввод? Почему числа должны быть в...

145
Как проверить установку CuDNN?

Я искал много мест, но ВСЕ, что я получаю, это КАК установить его, а не как проверить, что он установлен. Я могу убедиться, что мой драйвер NVIDIA установлен, и что CUDA установлен, но я не знаю, как проверить, установлен ли CuDNN. Помощь будет высоко ценится, спасибо! PS. Это для реализации кафе....

143
Почему необходимо использовать нелинейную функцию активации в нейронной сети обратного распространения? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 3 месяца назад . Уточните этот вопрос Я читал кое-что о нейронных сетях и понимаю...

140
Когда мне следует использовать генетические алгоритмы, а не нейронные сети? [закрыто]

В его нынешнем виде этот вопрос не подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, потребует дебатов, аргументов, опросов или расширенного обсуждения. Если вы считаете, что этот вопрос можно...

139
Как обучить искусственную нейронную сеть игре в Diablo 2 с помощью визуального ввода?

В настоящее время я пытаюсь получить ИНС для игры в видеоигру, и я надеялся получить некоторую помощь от замечательного сообщества здесь. Я остановился на Diablo 2. Таким образом, игра ведется в реальном времени с изометрической точки зрения, когда игрок управляет одним аватаром, на котором...

135
Что делает tf.nn.conv2d в тензорном потоке?

Я просматривал документы по тензорному потоку tf.nn.conv2d здесь . Но я не могу понять, что он делает или чего пытается достичь. На документах сказано: # 1: Выравнивает фильтр в 2-D матрицу с формой [filter_height * filter_width * in_channels, output_channels], Что это делает? Это поэлементное...

118
Заказ пакетной нормализации и отсева?

Первоначальный вопрос касался конкретно реализаций TensorFlow. Однако ответы относятся к реализации в целом. Этот общий ответ также является правильным для TensorFlow. При использовании пакетной нормализации и выпадения в TensorFlow (особенно с использованием contrib.layers) нужно ли мне...

115
Аргумент шага Tensorflow

Я пытаюсь понять махи аргумента в tf.nn.avg_pool, tf.nn.max_pool, tf.nn.conv2d. В документации неоднократно говорится шаги: список целых чисел, длина которого> = 4. Шаг скользящего окна для каждого измерения входного тензора. Мои вопросы: Что означает каждое из 4+ целых чисел? Почему у них...

112
Pytorch, каковы аргументы градиента

Я читал документацию PyTorch и нашел пример, в котором они пишут gradients = torch.FloatTensor([0.1, 1.0, 0.0001]) y.backward(gradients) print(x.grad) где x была начальной переменной, из которой был построен y (3-вектор). Вопрос в том, каковы аргументы 0,1, 1,0 и 0,0001 тензора градиентов?...