Вопросы с тегом «keras»

Keras - это библиотека нейронной сети, предоставляющая высокоуровневый API на Python и R. Используйте этот тег для вопросов, касающихся того, как использовать этот API. Пожалуйста, также включите тег для языка / серверной части ([python], [r], [tenorflow], [theano], [cntk]), который вы используете. Если вы используете встроенные keras тензорного потока, используйте тег [tf.keras].

311
Понимание LSTM Keras

Я пытаюсь согласовать свое понимание LSTM и указал здесь в этом посте Кристофером Олахом, реализованным в Керасе. Я слежу за блогом, написанным Джейсоном Браунли для учебника Keras. То, что я в основном смущен о том, Преобразование ряда данных в [samples, time steps, features]и, LSTM с состоянием...

262
Объяснение ввода Keras: input_shape, unit, batch_size, dim и т. Д.

Для любого слоя Keras ( Layerкласс), может кто - то объяснить , как понять разницу между input_shape, units, dimи т.д.? Например, в документе сказано unitsуказать форму вывода слоя. На изображении нейронной сети ниже hidden layer1имеется 4 единицы. Относится ли это непосредственно к unitsатрибуту...

168
Где я могу вызвать функцию BatchNormalization в Keras?

Если я хочу использовать функцию BatchNormalization в Keras, то нужно ли вызывать ее один раз только в начале? Я прочитал эту документацию для этого: http://keras.io/layers/normalization/ Я не понимаю, где я должен это назвать. Ниже мой код пытается использовать его: model = Sequential()...

160
Почему двоичные_кросентропии и категориальные_кросентропии дают разные результаты для одной и той же проблемы?

Я пытаюсь обучить Си-Эн-Эн классифицировать текст по темам. Когда я использую двоичную кросс-энтропию, я получаю точность ~ 80%, с категориальной кросс-энтропией я получаю точность ~ 50%. Я не понимаю, почему это так. Это проблема мультикласса, не означает ли это, что я должен использовать...

144
Как использовать обратный вызов Tensorboard для Keras?

Я построил нейронную сеть с Керасом. Я бы визуализировал его данные с помощью Tensorboard, поэтому я использовал: keras.callbacks.TensorBoard(log_dir='/Graph', histogram_freq=0, write_graph=True, write_images=True) как объяснено в keras.io . Когда я запускаю обратный вызов, я получаю...

137
Почему TensorFlow 2 намного медленнее, чем TensorFlow 1?

Многие пользователи указали, что это причина перехода на Pytorch, но мне еще предстоит найти оправдание / объяснение для того, чтобы пожертвовать самым важным практическим качеством, скоростью и стремлением к исполнению. Ниже приведена производительность бенчмаркинга кода, TF1 по сравнению с TF2,...

125
Могу ли я запустить модель Keras на графическом процессоре?

Я использую модель Keras, с крайним сроком подачи 36 часов, если я обучу свою модель на процессоре, это займет около 50 часов, есть ли способ запустить Keras на gpu? Я использую бэкэнд Tensorflow и запускаю его на своем ноутбуке Jupyter без установленной...

114
Как исправить ошибку «Массивы объектов не загружаются, когда allow_pickle = False» для функции imdb.load_data ()?

Я пытаюсь реализовать пример двоичной классификации, используя набор данных IMDb в Google Colab . Я уже реализовал эту модель раньше. Но когда я попытался сделать это снова через несколько дней, он вернул ошибку значения: «Массивы объектов не могут быть загружены, когда allow_pickle = False» для...

109
Какова роль Flatten в Керасе?

Я пытаюсь понять роль Flattenфункции в Керасе. Ниже мой код, который представляет собой простую двухуровневую сеть. Он принимает двумерные данные формы (3, 2) и выводит одномерные данные формы (1, 4): model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu'))...

108
Примеры от многих к одному и от многих ко многим LSTM в Керасе

Я пытаюсь понять LSTM и как их создавать с помощью Keras. Я обнаружил, что в основном есть 4 режима для запуска RNN (4 правые на картинке) Источник изображения: Андрей Карпаты Теперь мне интересно, как будет выглядеть минималистичный фрагмент кода для каждого из них в Keras. Так что-то вроде model...

102
Загрузка обученной модели Keras и продолжение обучения

Мне было интересно, можно ли сохранить частично обученную модель Keras и продолжить обучение после повторной загрузки модели. Причина этого в том, что в будущем у меня будет больше обучающих данных, и я не хочу снова переобучать всю модель. Я использую следующие функции: #Partly train model...

100
Какие параметры следует использовать для ранней остановки?

Я тренирую нейронную сеть для своего проекта с помощью Keras. Керас предусмотрел функцию ранней остановки. Могу ли я узнать, какие параметры следует соблюдать, чтобы моя нейронная сеть не переобучалась с помощью ранней остановки?...

97
Можно ли заставить Keras с бэкэндом Tensorflow по желанию использовать CPU или GPU?

У меня установлен Keras с серверной частью Tensorflow и CUDA. Я бы хотел, чтобы иногда по требованию Keras использовал CPU. Можно ли это сделать без установки отдельного Tensorflow только для ЦП в виртуальной среде? Если да, то как? Если бы бэкэнд был Theano, флаги можно было бы установить, но я...

97
Что такое встраивание в Керас?

В документации Keras неясно, что это на самом деле. Я понимаю, что мы можем использовать это для сжатия входного пространства функций в меньшее. Но как это сделать с точки зрения нейронного дизайна? Это автоэнокдер, RBM?...

96
Как объединить два слоя в керасе?

У меня есть пример нейронной сети с двумя слоями. Первый уровень принимает два аргумента и имеет один выход. Второй должен принимать один аргумент как результат первого уровня и один дополнительный аргумент. Должно получиться так: x1 x2 x3 \ / / y1 / \ / y2 Итак, я создал модель с двумя слоями и...

87
Керас: разница между регуляризаторами ядра и активности

Я заметил, что weight_regularizer больше не доступен в Keras и что вместо него есть регуляризатор активности и ядра . Я бы хотел знать: В чем основные различия между регуляризаторами ядра и активности ? Могу ли я использовать activity_regularizer вместо weight_regularizer ?...

87
Керас, как мне предсказать после обучения модели?

Я играю с набором данных reuters-example, и он работает нормально (моя модель обучена). Я читал о том, как сохранить модель, чтобы потом загрузить ее и использовать снова. Но как мне использовать эту сохраненную модель для предсказания нового текста? Я использую models.predict()? Нужно ли мне...