Вопросы с тегом «neural-network»

111
В чем разница между sparse_softmax_cross_entropy_with_logits и softmax_cross_entropy_with_logits?

Недавно я наткнулся на tf.nn.sparse_softmax_cross_entropy_with_logits, и я не могу понять, в чем разница по сравнению с tf.nn.softmax_cross_entropy_with_logits . Является единственным отличие , что обучающие векторы yдолжны быть один горячей закодированными при использовании...

109
Какие хорошие ресурсы для изучения искусственных нейронных сетей? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 6 лет назад . Уточните этот вопрос Меня действительно интересуют искусственные...

109
Какова роль Flatten в Керасе?

Я пытаюсь понять роль Flattenфункции в Керасе. Ниже мой код, который представляет собой простую двухуровневую сеть. Он принимает двумерные данные формы (3, 2) и выводит одномерные данные формы (1, 4): model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu'))...

108
Примеры от многих к одному и от многих ко многим LSTM в Керасе

Я пытаюсь понять LSTM и как их создавать с помощью Keras. Я обнаружил, что в основном есть 4 режима для запуска RNN (4 правые на картинке) Источник изображения: Андрей Карпаты Теперь мне интересно, как будет выглядеть минималистичный фрагмент кода для каждого из них в Keras. Так что-то вроде model...

105
Почему веса нейронных сетей должны быть инициализированы случайными числами? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 9 дней назад . Уточните этот вопрос Пытаюсь построить нейронную сеть с нуля. Во...

104
Архитектура многослойного персептрона (MLP): критерии выбора количества скрытых слоев и размера скрытого слоя?

Если у нас есть 10 собственных векторов, то у нас может быть 10 нейронных узлов во входном слое. Если у нас есть 5 выходных классов, то у нас может быть 5 узлов в выходном слое. Но каковы критерии выбора количества скрытых слоев в MLP и сколько нейронных узлы в 1 скрытом...

102
Загрузка обученной модели Keras и продолжение обучения

Мне было интересно, можно ли сохранить частично обученную модель Keras и продолжить обучение после повторной загрузки модели. Причина этого в том, что в будущем у меня будет больше обучающих данных, и я не хочу снова переобучать всю модель. Я использую следующие функции: #Partly train model...

100
Какие параметры следует использовать для ранней остановки?

Я тренирую нейронную сеть для своего проекта с помощью Keras. Керас предусмотрел функцию ранней остановки. Могу ли я узнать, какие параметры следует соблюдать, чтобы моя нейронная сеть не переобучалась с помощью ранней остановки?...

96
Как объединить два слоя в керасе?

У меня есть пример нейронной сети с двумя слоями. Первый уровень принимает два аргумента и имеет один выход. Второй должен принимать один аргумент как результат первого уровня и один дополнительный аргумент. Должно получиться так: x1 x2 x3 \ / / y1 / \ / y2 Итак, я создал модель с двумя слоями и...

94
Как добавить регуляризации в TensorFlow?

Я обнаружил, что во многих доступном коде нейронных сетей, реализованном с использованием TensorFlow, условия регуляризации часто реализуются путем добавления вручную дополнительного члена к значению потерь. Мои вопросы: Есть ли более элегантный или рекомендуемый способ регуляризации, чем это...

93
почему мы «упаковываем» последовательности в pytorch?

Я пытался воспроизвести, как использовать упаковку для входных данных последовательности переменной длины для rnn, но я думаю, что сначала мне нужно понять, почему нам нужно «упаковать» последовательность. Я понимаю, почему нам нужно их «прокладывать», но почему это pack_padded_sequenceнеобходимо?...

90
PyTorch - смежные ()

Я просматривал этот пример языковой модели LSTM на github (ссылка) . Что он делает в целом, мне довольно ясно. Но я все еще пытаюсь понять, что contiguous()делает вызов , что происходит несколько раз в коде. Например, в строке 74/75 создаются последовательности ввода кода и цели LSTM. Данные...

86
Распространенные причины нанов во время тренировок

Я заметил, что во время тренировок вводится частое явление NAN. Часто кажется, что это происходит из-за того, что веса во внутреннем продукте / полностью связанных или сверточных слоях взрываются. Это происходит потому, что вычисление градиента резко увеличивается? Или это из-за инициализации веса...

84
Как выбрать потерю кросс-энтропии в TensorFlow?

Проблемы классификации, такие как логистическая регрессия или полиномиальная логистическая регрессия, оптимизируют кросс-энтропийную потерю. Обычно слой кросс-энтропии следует за слоем softmax , который производит распределение вероятностей. В тензорном потоке есть как минимум дюжина различных...

83
Какова роль слоя TimeDistributed в Keras?

Я пытаюсь понять, что делает оболочка TimeDistributed в Керасе. Я понимаю, что TimeDistributed «применяет слой к каждому временному фрагменту ввода». Но я провел некоторый эксперимент и получил результаты, которых не могу понять. Короче говоря, применительно к слою LSTM, TimeDistributed и просто...

82
Как сообщить Керасу о прекращении тренировок на основе величины потерь?

В настоящее время я использую следующий код: callbacks = [ EarlyStopping(monitor='val_loss', patience=2, verbose=0), ModelCheckpoint(kfold_weights_path, monitor='val_loss', save_best_only=True, verbose=0), ] model.fit(X_train.astype('float32'), Y_train, batch_size=batch_size, nb_epoch=nb_epoch,...

17
Почему нейронная сеть предсказывает неверные данные о своих тренировках?

Эта награда закончилась . Ответы на этот вопрос имеют право на награду за репутацию +150 . Период отсрочки заканчивается через 10 часов . Сирджай ищет ответ из авторитетного источника . Я создал нейронную сеть LSTM (RNN) с контролируемым обучением для прогнозирования запасов данных. Проблема в...

11
Максимизируйте MSE модели keras

У меня есть генеративные состязательные сети, где дискриминатор сводится к минимуму с помощью MSE, а генератор должен максимизироваться. Потому что оба являются противниками, преследующими противоположную цель. generator = Sequential() generator.add(Dense(units=50, activation='sigmoid',...

10
Объект перечислим, но не индексируется?

Краткое изложение проблемы и вопрос Я пытаюсь посмотреть на некоторые данные внутри объекта, которые можно перечислить, но не проиндексировать. Я все еще новичок в Python, но я не понимаю, как это возможно. Если вы можете перечислить его, почему вы не можете получить доступ к индексу тем же...

10
Как можно иметь параметры в модели Pytorch, чтобы не быть листами и быть в графе вычислений?

Я пытаюсь обновить / изменить параметры модели нейронной сети, а затем сделать прямой проход обновленной нейронной сети в граф вычислений (независимо от того, сколько изменений / обновлений мы делаем). Я попробовал эту идею, но всякий раз, когда я делаю это, pytorch устанавливает мои обновленные...