Наука о данных

19
Как определить архитектуру нейронной сети?

Мне было интересно, как мы должны решить, сколько узлов в скрытых слоях и сколько скрытых слоев разместить при построении архитектуры нейронной сети. Я понимаю, что уровень ввода и вывода зависит от имеющегося у нас обучающего набора, но как нам определить скрытый уровень и общую архитектуру в...

18
Как ускорить разработку алгоритма?

Работая над исследовательским анализом данных и разработкой алгоритмов, я обнаружил, что большую часть своего времени я провожу в цикле визуализации, написания некоторого кода, запуска на небольшом наборе данных, повторения. Имеющиеся у меня данные, как правило, относятся к типу компьютерного...

18
Реализация функции стоимости в Python в логистической регрессии: почему точечное умножение в одном выражении, а поэлементное умножение в другом

У меня есть очень простой вопрос, который относится к Python, numpy и умножению матриц в настройках логистической регрессии. Во-первых, позвольте мне извиниться за то, что не использовал математическую запись Я запутался в использовании умножения матричных точек и поэлементного умножения. Функция...

18
Ролевая производная сигмоидальной функции в нейронных сетях

Я пытаюсь понять роль производной сигмовидной функции в нейронных сетях. Сначала я строю сигмовидную функцию и производную всех точек из определения, используя python. Какова роль этой производной? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): return 1 / (1 + np.exp(-x)) def...

18
Какие фильтры используются по умолчанию в Keras Convolution2d ()?

Я довольно плохо знаком с нейронными сетями, но я достаточно хорошо понимаю линейную алгебру и математику свертки. Я пытаюсь понять пример кода, который я нахожу в различных местах сети для обучения сверточного NN Keras с данными MNIST для распознавания цифр. Я ожидаю, что когда я создаю сверточный...

18
локальные минимумы против седловых точек в глубоком обучении

Я слышал, как Эндрю Нг (в видео, которое я, к сожалению, больше не могу найти) рассказывал о том, как изменилось понимание локальных минимумов в задачах глубокого обучения в том смысле, что они теперь рассматриваются как менее проблемные, поскольку в многомерных пространствах (встречающихся в...

18
Как аннотировать текстовые документы с метаданными?

Имея много текстовых документов (на естественном языке, неструктурированных), каковы возможные способы аннотирования их некоторыми семантическими метаданными? Например, рассмотрим короткий документ: I saw the company's manager last day. Чтобы иметь возможность извлекать информацию из нее, она...

18
Как я могу прогнозировать трафик на основе данных предыдущих временных рядов?

Если у меня есть магазин розничной торговли, и у меня есть способ измерить, сколько людей заходит в мой магазин каждую минуту, и поставить отметку времени в этих данных, как я могу прогнозировать будущий объем трафика? Я изучил алгоритмы машинного обучения, но не уверен, какой из них использовать....

18
Повышение скорости реализации t-sne в python для больших данных

Я хотел бы уменьшить размерность почти на 1 миллион векторов с 200 измерениями ( doc2vec). Я использую TSNEреализацию из sklearn.manifoldмодуля, и главная проблема - временная сложность. Даже при том method = barnes_hut, что скорость вычислений все еще низка. Некоторое время даже не хватает памяти....

18
В чем разница между Inception v2 и Inception v3?

В статье « Пройдя глубже с извилинами» описывается GoogleNet, в которой содержатся оригинальные начальные модули: Переход к началу v2 заключался в том, что они заменили свертки 5x5 на две последовательные свертки 3x3 и применили объединение: В чем разница между Inception v2 и Inception...

18
Набор данных для распознавания именованных объектов в неформальном тексте

В настоящее время я ищу маркированные наборы данных, чтобы обучить модель извлекать именованные объекты из неформального текста (что-то похожее на твиты). Поскольку в документах из моего набора данных часто не хватает заглавных букв и грамматики, я ищу данные вне домена, которые немного более...

18
Руководство по выбору оптимизатора для обучения нейронных сетей

Я использую нейронные сети уже некоторое время. Тем не менее, одна вещь, с которой я постоянно борюсь, это выбор оптимизатора для обучения сети (используя backprop). Что я обычно делаю, так это просто начинаю с одного (например, стандартного SGD), а затем пробую другие другие довольно случайно. Мне...

18
Лучший практический алгоритм для сходства предложений

У меня есть два предложения, S1 и S2, оба из которых имеют количество слов (обычно) ниже 15. Каковы наиболее практичные и успешные (машинное обучение) алгоритмы, которые, возможно, легко реализовать (нейронная сеть в порядке, если архитектура не такая сложная, как Google Inception и т. Д.). Я ищу...

18
Значимы ли размеры t-sne?

Есть ли смысл для размеров вложения t-sne? Как и в случае с PCA, у нас есть смысл линейно преобразованных максимизаций дисперсии, но для t-sne существует ли интуиция, кроме пространства, которое мы определяем для отображения и минимизации...

18
Word2Vec против Sentence2Vec против Doc2Vec

Недавно я натолкнулся на термины Word2Vec , Sentence2Vec и Doc2Vec, и я был немного сбит с толку, поскольку я новичок в векторной семантике. Может кто-нибудь, пожалуйста, изложите различия в этих методах простыми словами. Каковы наиболее подходящие задачи для каждого...

18
Функция извлечения изображений в Python

В моем классе я должен создать приложение, используя два классификатора, чтобы решить, является ли объект на изображении примером phylum porifera (seasponge) или каким-либо другим объектом. Тем не менее, я полностью растерялся, когда дело доходит до методов извлечения функций в Python. Мой советник...

18
есть ли инструмент для очистки данных для python / pandas, похожий на инструмент R tidyr?

Я работаю над проблемой Kaggle, где некоторые переменные представлены строками, а не столбцами (разрушение сети Telstra). В настоящее время я ищу эквивалент функции collect (), separa (() и spread (), который можно найти в инструменте R...

18
Как бороться с строковыми метками в мультиклассовой классификации с керасом?

Я новичок в области машинного обучения и кера, и сейчас я занимаюсь многоклассовой классификацией изображений с помощью кера. На входе помечено изображение. После некоторой предварительной обработки данные обучения представлены в списке Python как: [["dog", "path/to/dog/imageX.jpg"],["cat",...