Вопросы с тегом «deep-learning»

30
Что такое наземная истина

В контексте машинного обучения я часто видел термин « Основополагающая истина» . Я много искал и нашел следующее определение в Википедии : В машинном обучении термин «наземная истина» относится к точности классификации учебного набора для контролируемых методов обучения. Это используется в...

30
Почему данные должны быть перетасованы для задач машинного обучения

В задачах машинного обучения обычно перетасовывать данные и нормализовать их. Цель нормализации ясна (для того же диапазона значений признаков). Но после долгих попыток я не нашел какой-либо ценной причины для перетасовки данных. Я прочитал этот пост здесь, обсуждая, когда мы должны перетасовать...

29
Почему xgboost намного быстрее, чем sklearn GradientBoostingClassifier?

Я пытаюсь обучить модели повышения градиента более чем на 50 тыс. Примеров с 100 числовыми функциями. XGBClassifierобрабатывает 500 деревьев в течение 43 секунд на моей машине, в то время как GradientBoostingClassifierобрабатывает только 10 деревьев (!) за 1 минуту и ​​2 секунды :( Я не стал...

29
Выбор между CPU и GPU для обучения нейронной сети

Я видел дискуссии о «накладных расходах» графического процессора и о том, что для «небольших» сетей обучение на процессоре (или сети процессоров) может быть быстрее, чем на графическом процессоре. Что означает «маленький»? Например, будет ли «однослойный» MLP со 100 скрытыми единицами «маленьким»?...

27
Существуют ли бесплатные облачные сервисы для обучения моделям машинного обучения?

Я хочу тренировать глубокую модель с большим количеством обучающих данных, но мой рабочий стол не имеет такой силы, чтобы тренировать такую ​​глубокую модель с этими обильными данными. Я хотел бы знать, существуют ли какие-либо бесплатные облачные сервисы, которые можно использовать для обучения...

26
Как Keras рассчитывает точность?

Как Keras рассчитывает точность по классовым вероятностям? Например, у нас есть 100 образцов в тестовом наборе, которые могут принадлежать одному из двух классов. У нас также есть список классовых вероятностей. Какой порог использует Keras, чтобы назначить выборку любому из двух...

26
Слияние двух разных моделей в Керасе

Я пытаюсь объединить две модели Keras в одну модель и не могу этого сделать. Например, на прилагаемом рисунке я хотел бы получить средний слой измерения 8 и использовать его в качестве входных данных для слоя (снова размера 8) в модели а затем объединить и модель и модель как один модель.А 2A2A2Б...

26
PyTorch против Tensorflow Fold

Как PyTorch, так и Tensorflow Fold являются средами глубокого обучения, предназначенными для работы в ситуациях, когда входные данные имеют неодинаковую длину или измерения (то есть ситуации, когда динамические графики полезны или необходимы). Я хотел бы знать, как они сравниваются, в смысле...

26
Как установить количество нейронов и слоев в нейронных сетях

Я новичок в нейронных сетях, и мне было трудно понять две концепции: Как определить количество средних слоев в данной нейронной сети? 1 против 10 или что-то еще. Как определить количество нейронов в каждом среднем слое? Рекомендуется ли иметь одинаковое количество нейронов в каждом среднем слое или...

26
Может ли машинное обучение выучить такую ​​функцию, как поиск максимума из списка?

У меня есть вход, который является списком, и вывод является максимумом элементов input-list. Может ли машинное обучение выучить такую ​​функцию, которая всегда выбирает максимум входных элементов, присутствующих на входе? Это может показаться довольно простым вопросом, но он может дать мне...

24
Почему сообщества НЛП и машинного обучения заинтересованы в глубоком обучении?

Я надеюсь, что вы можете мне помочь, так как у меня есть несколько вопросов на эту тему. Я новичок в области глубокого обучения, и хотя я сделал несколько уроков, я не могу связать или отличить понятия друг от...

22
Почему сверточные нейронные сети работают?

Я часто слышал, как люди говорили, почему сверточные нейронные сети все еще плохо поняты. Известно ли, почему сверточные нейронные сети всегда заканчивают тем, что изучают все более сложные функции, когда мы поднимаемся по уровням? Что заставило их создать такой набор функций, и будет ли это также...

21
Прогнозирование временных рядов с использованием LSTM: важность обеспечения устойчивости временных рядов

В этой ссылке на Стационарность и разность было упомянуто, что модели, подобные ARIMA, требуют стационарного временного ряда для прогнозирования, поскольку его статистические свойства, такие как среднее значение, дисперсия, автокорреляция и т. Д., Постоянны во времени. Поскольку RNN обладают лучшей...

21
Всегда ли градиентный спуск сходится к оптимальному?

Мне интересно, есть ли сценарий, при котором градиентный спуск не сходится к минимуму. Я осознаю, что градиентный спуск не всегда может привести к глобальному оптимуму. Я также знаю, что он может отличаться от оптимального, если, скажем, размер шага слишком велик. Тем не менее, мне кажется, что...

21
Существуют ли правила выбора размера мини-партии?

При обучении нейронных сетей одним гиперпараметром является размер мини-пакета. Обычный выбор - 32, 64 и 128 элементов в каждой партии. Существуют ли какие-либо правила / рекомендации, какими большими должны быть мини-партии? Какие-нибудь публикации, которые исследуют влияние на...

21
Как получить точность, F1, точность и отзыв, для модели Keras?

Я хочу вычислить точность, отзыв и оценку F1 для моей двоичной модели KerasClassifier, но не нашел никакого решения. Вот мой фактический код: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the...

20
Извлечение ключевого слова / фразы из текста с использованием библиотек Deep Learning

Возможно, это слишком широко, но я ищу ссылки на то, как использовать глубокое обучение в задаче обобщения текста. Я уже реализовал суммирование текста, используя стандартные частотно-частотные подходы и ранжирование предложений, но я хотел бы изучить возможность использования методов глубокого...

20
Керас против тф.керас

Я немного запутался в выборе между Keras (keras-team / keras) и tf.keras (tenorflow / tenorflow / python / keras /) для моего нового исследовательского проекта. Существует дискуссия о том, что Keras не принадлежит никому, поэтому люди будут рады внести свой вклад, и в будущем будет намного легче...