Вопросы с тегом «pytorch»

195
Лучший способ сохранить обученную модель в PyTorch?

Я искал альтернативные способы сохранить обученную модель в PyTorch. Пока что я нашел две альтернативы. torch.save () для сохранения модели и torch.load () для загрузки модели. model.state_dict () для сохранения обученной модели и model.load_state_dict () для загрузки сохраненной модели. Я...

160
Как проверить, использует ли Pytorch графический процессор?

Я хотел бы знать, pytorchиспользует ли мой графический процессор. Можно определить, nvidia-smiесть ли какие-либо действия с графическим процессором во время процесса, но я хочу что-то записать в pythonсценарии. Есть ли способ сделать...

127
Сводка модели в pytorch

Есть ли способ распечатать сводку модели в PyTorch, как model.summary()метод в Keras, как показано ниже? Model Summary: ____________________________________________________________________________________________________ Layer (type) Output Shape Param # Connected to...

112
Pytorch, каковы аргументы градиента

Я читал документацию PyTorch и нашел пример, в котором они пишут gradients = torch.FloatTensor([0.1, 1.0, 0.0001]) y.backward(gradients) print(x.grad) где x была начальной переменной, из которой был построен y (3-вектор). Вопрос в том, каковы аргументы 0,1, 1,0 и 0,0001 тензора градиентов?...

93
В чем разница между изменением формы и просмотром в pytorch?

В numpy мы используем ndarray.reshape()для изменения формы массива. Я заметил, что в pytorch люди используют torch.view(...)с той же целью, но в то же время есть и torch.reshape(...)существующий. Поэтому мне интересно, в чем разница между ними и когда я должен использовать любой из них?...

93
почему мы «упаковываем» последовательности в pytorch?

Я пытался воспроизвести, как использовать упаковку для входных данных последовательности переменной длины для rnn, но я думаю, что сначала мне нужно понять, почему нам нужно «упаковать» последовательность. Я понимаю, почему нам нужно их «прокладывать», но почему это pack_padded_sequenceнеобходимо?...

90
PyTorch - смежные ()

Я просматривал этот пример языковой модели LSTM на github (ссылка) . Что он делает в целом, мне довольно ясно. Но я все еще пытаюсь понять, что contiguous()делает вызов , что происходит несколько раз в коде. Например, в строке 74/75 создаются последовательности ввода кода и цели LSTM. Данные...

10
Как можно иметь параметры в модели Pytorch, чтобы не быть листами и быть в графе вычислений?

Я пытаюсь обновить / изменить параметры модели нейронной сети, а затем сделать прямой проход обновленной нейронной сети в граф вычислений (независимо от того, сколько изменений / обновлений мы делаем). Я попробовал эту идею, но всякий раз, когда я делаю это, pytorch устанавливает мои обновленные...

9
RuntimeError: Тип ввода (torch.FloatTensor) и тип веса (torch.cuda.FloatTensor) должны совпадать

Я пытаюсь обучить следующий CNN следующим образом, но я продолжаю получать ту же ошибку относительно .cuda (), и я не уверен, как это исправить. Вот кусок моего кода до сих пор. import matplotlib.pyplot as plt import numpy as np import torch from torch import nn from torch import optim import...