Вопросы с тегом «deep-learning»

90
PyTorch - смежные ()

Я просматривал этот пример языковой модели LSTM на github (ссылка) . Что он делает в целом, мне довольно ясно. Но я все еще пытаюсь понять, что contiguous()делает вызов , что происходит несколько раз в коде. Например, в строке 74/75 создаются последовательности ввода кода и цели LSTM. Данные...

88
Что означает global_step в Tensorflow?

Это учебный код с веб-сайта TensorFlow, может ли кто-нибудь помочь объяснить, что global_stepзначит? На веб-сайте Tensorflow я обнаружил, что глобальный шаг используется для подсчета шагов обучения , но я не совсем понимаю, что именно это означает. Кроме того, что означает цифра 0 при настройке...

88
как форматировать данные изображения для обучения / прогнозирования, когда изображения различаются по размеру?

Я пытаюсь обучить свою модель, которая классифицирует изображения. У меня проблема в том, что у них разные размеры. как мне отформатировать мои изображения / или архитектуру модели?...

87
Керас, как мне предсказать после обучения модели?

Я играю с набором данных reuters-example, и он работает нормально (моя модель обучена). Я читал о том, как сохранить модель, чтобы потом загрузить ее и использовать снова. Но как мне использовать эту сохраненную модель для предсказания нового текста? Я использую models.predict()? Нужно ли мне...

86
Распространенные причины нанов во время тренировок

Я заметил, что во время тренировок вводится частое явление NAN. Часто кажется, что это происходит из-за того, что веса во внутреннем продукте / полностью связанных или сверточных слоях взрываются. Это происходит потому, что вычисление градиента резко увеличивается? Или это из-за инициализации веса...

83
Какова роль слоя TimeDistributed в Keras?

Я пытаюсь понять, что делает оболочка TimeDistributed в Керасе. Я понимаю, что TimeDistributed «применяет слой к каждому временному фрагменту ввода». Но я провел некоторый эксперимент и получил результаты, которых не могу понять. Короче говоря, применительно к слою LSTM, TimeDistributed и просто...

30
Пользовательский оптимизатор TensorFlow Keras

Предположим, я хочу написать собственный класс оптимизатора, соответствующий tf.kerasAPI (используя версию TensorFlow> = 2.0). Я запутался в документированном способе сделать это по сравнению с тем, что сделано в реализациях. Документация для tf.keras.optimizers.Optimizer штатов , ### Write a...

19
Понимание получения градиентной политики

Я пытаюсь воссоздать очень простой пример Policy Gradient из исходного ресурса блога Andrej Karpathy . В этой статье вы найдете пример с CartPole и Policy Gradient со списком веса и активацией Softmax. Вот мой воссозданный и очень простой пример градиента политики CartPole, который отлично работает...

12
Использование YOLO или других методов распознавания изображений для идентификации всего буквенно-цифрового текста, присутствующего в изображениях

У меня есть схема с несколькими изображениями, каждая из которых содержит метки в виде буквенно-цифровых символов, а не только текстовую метку. Я хочу, чтобы моя модель YOLO идентифицировала все цифры и буквенно-цифровые символы, присутствующие в ней. Как я могу обучить свою модель YOLO делать то...

11
Получить местоположение всего текста, присутствующего в изображении, используя opencv

У меня есть это изображение, которое содержит текст (цифры и алфавиты) в нем. Я хочу получить местоположение всего текста и чисел, присутствующих на этом изображении. Также я хочу извлечь весь текст. Как я могу получить кординаты, а также весь текст (цифры и алфавиты) в моем изображении. Например,...

10
Сохраняйте модель каждые 10 эпох tenorflow.keras v2

Я использую керасы, определенные как подмодуль в tenorflow v2. Я тренирую свою модель, используя fit_generator()метод. Я хочу сохранять свою модель каждые 10 эпох. Как мне этого добиться? В керасе (не как подмодуль тф) могу дать ModelCheckpoint(model_savepath,period=10). Но в tf v2 они изменили это...

9
Используя модуль мозга Гекко, как определить, сколько слоев и какой тип слоя использовать для решения проблемы глубокого обучения?

Я учусь использовать модуль мозга Gekko для приложений глубокого обучения. Я настраивал нейронную сеть, чтобы изучить функцию numpy.cos () и затем получить схожие результаты. Я хорошо подхожу, когда границы моих тренировок: x = np.linspace(0,2*np.pi,100) Но модель разваливается, когда я пытаюсь...