Вопросы с тегом «machine-learning»

12

Для экспериментов мы хотели бы использовать эмодзи, встроенные во многие твиты, в качестве базовых данных о правде / обучении для простого количественного анализа настроений. Твиты обычно слишком неструктурированы для НЛП, чтобы работать хорошо. Так или иначе, в Unicode 6.0 есть 722 Emoji, и,...

machine-learning classification parsing

12

Классификация неструктурированного текста

Я собираюсь классифицировать неструктурированные текстовые документы, а именно сайты неизвестной структуры. Количество классов, которые я классифицирую, ограничено (на данный момент я считаю, что их не более трех). У кого-нибудь есть предложения о том, как мне начать? Возможен ли подход "мешок...

machine-learning classification text-mining beginner

12

Хеширование - что на самом деле происходит

Когда алгоритмы ML, например, Vowpal Wabbit или некоторые из машин факторизации, побеждающих в конкурсе кликов ( Kaggle ), упоминают, что функции «хэшированы», что это на самом деле означает для модели? Допустим, есть переменная, которая представляет идентификатор интернет-добавления, который...

machine-learning predictive-modeling kaggle

12

Помощь относительно NER в NLTK

Я работал в NLTK некоторое время с использованием Python. Проблема, с которой я сталкиваюсь, заключается в том, что они не могут получить помощь по обучению NER в NLTK с моими пользовательскими данными. Они использовали MaxEnt и обучили его на корпусе ACE. Я много искал в Интернете, но я не смог...

machine-learning python nlp

12

Многозадачное обучение в Керасе

Я пытаюсь реализовать общие слои в Keras. Я вижу, что Keras имеет keras.layers.concatenate, но я не уверен в документации о его использовании. Могу ли я использовать его для создания нескольких общих слоев? Как лучше всего реализовать простую общую нейронную сеть, как показано ниже, с...

machine-learning neural-network deep-learning keras multitask-learning

12

Лучшая библиотека Юлии для нейронных сетей

Я использую эту библиотеку для базового построения и анализа нейронной сети. Однако он не поддерживает построение многослойных нейронных сетей и т. Д. Итак, я хотел бы знать о каких-либо хороших библиотеках для продвинутых нейронных сетей и Deep Learning в...

machine-learning neural-network julia

12

Сколько изображений в классе достаточно для обучения CNN

Я начинаю проект, где задача состоит в том, чтобы идентифицировать типы кроссовок по изображениям. В настоящее время я читаю в реализации TensorFlow и Torch . Мой вопрос: сколько изображений на класс требуется для достижения разумной эффективности классификации?...

machine-learning neural-network image-classification convnet image-recognition

12

Потери и точность проверки остаются постоянными

Я пытаюсь реализовать эту статью на множестве медицинских изображений. Я делаю это в Керасе. Сеть по существу состоит из 4 слоев conv и max-pool, за которыми следуют полностью связанный слой и программный классификатор max. Насколько я знаю, я следовал архитектуре, упомянутой в статье. Однако...

machine-learning python deep-learning keras

12

Как рассчитать VC-размерность?

Я изучаю машинное обучение, и я хотел бы знать, как рассчитать VC-измерение. Например: h(x)={10if a≤x≤belse h(x)={1if a≤x≤b0else h(x)=\begin{cases} 1 &\mbox{if } a\leq x \leq b \\ 0 & \mbox{else } \end{cases} , с параметрами(a,b)∈R2(a,b)∈R2(a,b) ∈ R^2 . Каково его...

machine-learning classification vc-theory

12

Сколько ячеек LSTM я должен использовать?

Существуют ли какие-либо практические правила (или фактические правила), касающиеся минимального, максимального и «разумного» количества ячеек LSTM, которые я должен использовать? В частности, я имею в виду BasicLSTMCell из TensorFlow и num_unitsсвойства. Пожалуйста, предположите, что у меня есть...

rnn machine-learning r predictive-modeling random-forest python language-model sentiment-analysis encoding machine-learning deep-learning neural-network dataset caffe classification xgboost multiclass-classification unbalanced-classes time-series descriptive-statistics python r clustering machine-learning python deep-learning tensorflow machine-learning python predictive-modeling probability scikit-learn svm machine-learning python classification gradient-descent regression research python neural-network deep-learning convnet keras python tensorflow machine-learning deep-learning tensorflow python r bigdata visualization rstudio pandas pyspark dataset time-series multilabel-classification machine-learning neural-network ensemble-modeling kaggle machine-learning linear-regression cnn convnet machine-learning tensorflow association-rules machine-learning predictive-modeling training model-selection neural-network keras deep-learning deep-learning convnet image-classification predictive-modeling prediction machine-learning python classification predictive-modeling scikit-learn machine-learning python random-forest sampling training recommender-system books python neural-network nlp deep-learning tensorflow python matlab information-retrieval search search-engine deep-learning convnet keras machine-learning python cross-validation sampling machine-learning

11

Алгоритм генерации правил классификации

Таким образом, у нас есть потенциал для приложения машинного обучения, которое довольно точно вписывается в традиционную проблемную область, решаемую классификаторами, то есть у нас есть набор атрибутов, описывающих элемент, и «корзина», в которой они заканчиваются. Однако вместо того, чтобы...

machine-learning classification

11

Техника извлечения признаков - суммирование последовательности данных

Я часто строю модель (классификацию или регрессию), где у меня есть некоторые предикторные переменные, которые являются последовательностями, и я пытался найти технические рекомендации для их обобщения наилучшим образом, чтобы включить их в качестве предикторов в модель. В качестве конкретного...

machine-learning feature-selection time-series

11

Решения для непрерывной онлайн-идентификации кластеров?

Позвольте мне показать вам пример гипотетического приложения онлайн кластерной: В момент времени n точек 1,2,3,4 выделяются синему кластеру A, а точки b, 5,6,7 выделяются красному кластеру B. В момент времени n + 1 вводится новая точка a, которая назначается синему кластеру A, но также вызывает...

machine-learning clustering

11

Нейронная сеть для мониторинга сервера

Я смотрю на pybrain для принятия сигналов монитора сервера и определения основной причины проблемы. Я доволен тем, обучение его с помощью контролируемого обучения и курирования наборов обучающих данных. Данные структурированы примерно так: Тип сервера A # 1 Тип тревоги 1 Тип тревоги 2 Тип сервера #...

machine-learning neural-network

11

Что такое горячее кодирование в тензорном потоке?

В настоящее время я делаю курс по тензорному потоку, в котором они использовали tf.one_hot (индексы, глубина). Теперь я не понимаю, как эти индексы превращаются в эту двоичную последовательность. Может кто-нибудь, пожалуйста, объясните мне точный процесс...

machine-learning python neural-network deep-learning tensorflow

11

Полевые машины факторизации

Кто-нибудь может объяснить, как машины факторизации с учетом специфики поля (FFM) сравниваются со стандартными машинами факторизации (FM)? Стандарт: http://www.ismll.uni-hildesheim.de/pub/pdfs/Rendle2010FM.pdf «Полевая информация»:...

machine-learning recommender-system

11

Что такое LSTM, BiLSTM и когда их использовать?

Я очень новичок в области глубокого обучения, и мне особенно интересно знать, что такое LSTM и BiLSTM и когда их использовать (основные области применения). Почему LSTM и BILSTM более популярны, чем RNN? Можем ли мы использовать эти архитектуры глубокого обучения в неконтролируемых...

machine-learning deep-learning rnn lstm

11

применяя word2vec к небольшим текстовым файлам

Я совершенно новичок в word2vec, так что, пожалуйста, несите это со мной. У меня есть набор текстовых файлов, каждый из которых содержит набор твитов, между 1000-3000. Я выбрал общее ключевое слово ("kw1") и хочу найти семантически релевантные термины для "kw1", используя word2vec. Например, если...

machine-learning nlp text-mining

11

Переоснащение / Подгонка с размером набора данных

На графике ниже ось x => Размер набора данных ось у => Оценка перекрестной проверки Красная линия для данных обучения Зеленая линия для тестирования данных В учебнике, на который я ссылаюсь, автор говорит, что точка, где красная линия и зеленая линия перекрываются, означает, Сбор большего...

machine-learning cross-validation

11

В чем разница между дилатацией и деконволюцией?

Эти две операции свертки очень распространены в глубоком обучении прямо сейчас. Я читал о расширенном сверточном слое в этой статье: WAVENET: ОБЩАЯ МОДЕЛЬ ДЛЯ СЫРЬЕГО АУДИО и Деконволюция в этой статье: полностью сверточные сети для семантической сегментации Оба, кажется, улучшают изображение, но в...

machine-learning deep-learning convnet computer-vision convolution