Вопросы с тегом «deep-learning»

11
Машинное обучение против глубокого обучения

Меня немного смущает различие между терминами «машинное обучение» и «глубокое обучение». Я прогуглил это и прочитал много статей, но это все еще не очень ясно для меня. Известное определение машинного обучения Тома Митчелла: Компьютерная программа называется извлечь из опыта Е относительно...

11
Существуют ли хорошие готовые языковые модели для Python?

Я создаю прототип приложения и мне нужна языковая модель для вычисления недоумения в некоторых сгенерированных предложениях. Есть ли в Python обученная языковая модель, которую я могу легко использовать? Что-то простое, как model = LanguageModel('en') p1 = model.perplexity('This is a well...

11
В чем разница между дилатацией и деконволюцией?

Эти две операции свертки очень распространены в глубоком обучении прямо сейчас. Я читал о расширенном сверточном слое в этой статье: WAVENET: ОБЩАЯ МОДЕЛЬ ДЛЯ СЫРЬЕГО АУДИО и Деконволюция в этой статье: полностью сверточные сети для семантической сегментации Оба, кажется, улучшают изображение, но в...

11
Когда мы говорим, что набор данных не классифицируется?

Я много раз анализировал набор данных, по которому я не мог провести какую-либо классификацию. Чтобы увидеть, могу ли я получить классификатор, я обычно использовал следующие шаги: Создайте графические зависимости метки от числовых значений. Уменьшите размерность до 2 или 3, чтобы увидеть,...

11
Что такое LSTM, BiLSTM и когда их использовать?

Я очень новичок в области глубокого обучения, и мне особенно интересно знать, что такое LSTM и BiLSTM и когда их использовать (основные области применения). Почему LSTM и BILSTM более популярны, чем RNN? Можем ли мы использовать эти архитектуры глубокого обучения в неконтролируемых...

11
Используя предварительно обученный классификатор CNN и примените его к другому набору данных изображений

Как бы вы оптимизировать с заранее обученных neural network применять его в отдельную проблему? Вы бы просто добавили больше слоев в предварительно обученную модель и протестировали ее на своем наборе данных? Например, если задача состояла в том, чтобы использовать CNN для классификации групп обоев...

11
Что такое горячее кодирование в тензорном потоке?

В настоящее время я делаю курс по тензорному потоку, в котором они использовали tf.one_hot (индексы, глубина). Теперь я не понимаю, как эти индексы превращаются в эту двоичную последовательность. Может кто-нибудь, пожалуйста, объясните мне точный процесс...

10
Лучшие языки для научных вычислений [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 5 лет назад . Похоже, что большинство языков имеют некоторое...

10
Как рассчитать дельта-член сверточного слоя, учитывая дельта-члены и веса предыдущего сверточного слоя?

Я пытаюсь обучить искусственную нейронную сеть с двумя сверточными слоями (с1, с2) и двумя скрытыми слоями (с1, с2). Я использую стандартный подход обратного распространения. При обратном проходе я вычисляю член ошибки слоя (дельта) на основе ошибки предыдущего слоя, весов предыдущего слоя и...

10
Преобразование автоэнкодеров

Я только что прочитал статью Джеффа Хинтона о преобразовании автоэнкодеров Хинтон, Крижевский и Ван: Преобразование авто-кодировщиков . В искусственных нейронных сетях и машинном обучении, 2011. и очень хотел бы поиграть с чем-то вроде этого. Но, прочитав его, я не смог получить достаточно...

10
КАК: Инициализация веса глубоких нейронных сетей

Учитывая сложную задачу обучения (например, высокую размерность, сложность данных), глубокие нейронные сети становятся сложными для обучения. Чтобы облегчить многие из проблем, можно: Нормализовать && данные качества отобранных вручную выберите другой алгоритм обучения (например, RMSprop...

10
У Relu есть градиент 0 по определению, тогда почему исчезновение градиента не является проблемой для x <0?

По определению, Relu есть max(0,f(x)). Затем ее градиент определяется как: 1 if x > 0 and 0 if x < 0. Не означает ли это, что градиент всегда равен 0 (исчезает), когда x <0? Тогда почему мы говорим, что Relu не страдает от проблемы градиентного...

10
Изменение формы данных для глубокого обучения с использованием Keras

Я новичок в Keras, и я начал с примера MNIST, чтобы понять, как на самом деле работает библиотека. Фрагмент кода проблемы MNIST в папке примера Keras имеет вид: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from...

10
Почему TensorFlow не может соответствовать простой линейной модели, если я минимизирую абсолютную среднюю ошибку вместо среднеквадратичной ошибки?

Во введении я только что изменился loss = tf.reduce_mean(tf.square(y - y_data)) в loss = tf.reduce_mean(tf.abs(y - y_data)) и модель не в состоянии узнать, потеря только стала больше со временем....

10
Почему это ускоряет градиентный спуск, если функция плавная?

Сейчас я читаю книгу под названием «Практическое машинное обучение с Scikit-Learn и TensorFlow», а в главе 11 она содержит следующее описание объяснения ELU (Exponential ReLU). В-третьих, функция является гладкой везде, в том числе около z = 0, что помогает ускорить градиентный спуск, так как она...

10
Сортировка номеров, используя только 2 скрытых слоя

Я читаю основополагающую статью Илья Суцкевер и Куок Ле, « Последовательность к обучению последовательностей с использованием нейронных сетей ». На первой странице кратко упоминается, что: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers...

10
Что такое «новый алгоритм обучения подкреплению» в AlphaGo Zero?

По какой-то причине AlphaGo Zero не пользуется такой же популярностью, как оригинальный AlphaGo, несмотря на его невероятные результаты. Начиная с нуля, он уже побеждал AlphaGo Master и прошел множество других тестов. Еще более невероятно, что это сделано за 40 дней. Google называет его «возможно...

10
Keras LSTM с 1D временными рядами

Я изучаю, как использовать Keras, и я добился разумного успеха с моим помеченным набором данных, используя примеры в Chollet Deep Learning for Python . Набор данных ~ 1000 временных рядов с длиной 3125 с 3 потенциальными классами. Я хотел бы выйти за рамки базовых плотных слоев, которые дают мне...

10
Неуправляемая сегментация изображения

Я пытаюсь реализовать алгоритм, где дано изображение с несколькими объектами на плоской таблице, желательным является вывод масок сегментации для каждого объекта. В отличие от CNN, целью здесь является обнаружение объектов в незнакомой среде. Каковы лучшие подходы к этой проблеме? Кроме того, есть...

10
Использование RNN (LSTM) для системы распознавания жестов

Я пытаюсь создать систему распознавания жестов для классификации жестов ASL (американский язык жестов) , поэтому мой ввод должен представлять собой последовательность кадров либо из камеры, либо из видеофайла, затем он обнаруживает последовательность и сопоставляет ее с соответствующей занятия...