Вопросы с тегом «conv-neural-network»

160
Почему двоичные_кросентропии и категориальные_кросентропии дают разные результаты для одной и той же проблемы?

Я пытаюсь обучить Си-Эн-Эн классифицировать текст по темам. Когда я использую двоичную кросс-энтропию, я получаю точность ~ 80%, с категориальной кросс-энтропией я получаю точность ~ 50%. Я не понимаю, почему это так. Это проблема мультикласса, не означает ли это, что я должен использовать...

145
Как проверить установку CuDNN?

Я искал много мест, но ВСЕ, что я получаю, это КАК установить его, а не как проверить, что он установлен. Я могу убедиться, что мой драйвер NVIDIA установлен, и что CUDA установлен, но я не знаю, как проверить, установлен ли CuDNN. Помощь будет высоко ценится, спасибо! PS. Это для реализации кафе....

118
Заказ пакетной нормализации и отсева?

Первоначальный вопрос касался конкретно реализаций TensorFlow. Однако ответы относятся к реализации в целом. Этот общий ответ также является правильным для TensorFlow. При использовании пакетной нормализации и выпадения в TensorFlow (особенно с использованием contrib.layers) нужно ли мне...

115
Аргумент шага Tensorflow

Я пытаюсь понять махи аргумента в tf.nn.avg_pool, tf.nn.max_pool, tf.nn.conv2d. В документации неоднократно говорится шаги: список целых чисел, длина которого> = 4. Шаг скользящего окна для каждого измерения входного тензора. Мои вопросы: Что означает каждое из 4+ целых чисел? Почему у них...

100
Какие параметры следует использовать для ранней остановки?

Я тренирую нейронную сеть для своего проекта с помощью Keras. Керас предусмотрел функцию ранней остановки. Могу ли я узнать, какие параметры следует соблюдать, чтобы моя нейронная сеть не переобучалась с помощью ранней остановки?...

82
Как сообщить Керасу о прекращении тренировок на основе величины потерь?

В настоящее время я использую следующий код: callbacks = [ EarlyStopping(monitor='val_loss', patience=2, verbose=0), ModelCheckpoint(kfold_weights_path, monitor='val_loss', save_best_only=True, verbose=0), ] model.fit(X_train.astype('float32'), Y_train, batch_size=batch_size, nb_epoch=nb_epoch,...