Наука о данных

28
В чем разница между гиперпараметрами модели и параметрами модели?

Я заметил, что такие термины, как гиперпараметр модели и параметр модели , использовались в сети взаимозаменяемо без предварительного разъяснения. Я думаю, что это неправильно и нуждается в объяснении. Рассмотрим модель машинного обучения, классификатор или распознаватель изображений на основе SVM...

28
Какие алгоритмы я должен использовать для выполнения классификации работы на основе данных резюме?

Обратите внимание, что я делаю все в R. Проблема заключается в следующем: В основном, у меня есть список резюме (резюме). Некоторые кандидаты будут иметь опыт работы раньше, а некоторые нет. Цель здесь состоит в том, чтобы: основываясь на тексте их резюме, я хочу классифицировать их по различным...

27
Существуют ли бесплатные облачные сервисы для обучения моделям машинного обучения?

Я хочу тренировать глубокую модель с большим количеством обучающих данных, но мой рабочий стол не имеет такой силы, чтобы тренировать такую ​​глубокую модель с этими обильными данными. Я хотел бы знать, существуют ли какие-либо бесплатные облачные сервисы, которые можно использовать для обучения...

27
RNN с несколькими функциями

У меня есть немного самообучаемых знаний по работе с алгоритмами машинного обучения (базовый материал типа «Случайный лес» и «Линейная регрессия»). Я решил расшириться и начать изучать RNN с Керасом. Рассматривая большинство примеров, которые обычно включают прогнозирование запасов, я не смог найти...

27
Приложения и различия для сходства Жакара и сходства косинусов

Сходство Жакара и косинусное сходство - два очень распространенных измерения при сравнении сходства предметов. Однако мне не очень понятно, в какой ситуации какой из них должен быть предпочтительнее другого. Может ли кто-нибудь помочь прояснить различия этих двух измерений (различие в концепции или...

27
Как заставить веса быть неотрицательными в линейной регрессии

Я использую стандартную линейную регрессию, используя scikit-learn в python. Тем не менее, я хотел бы, чтобы веса были положительными для каждой функции (не отрицательной), есть ли способ, которым я могу это сделать? Я искал в документации, но не мог найти способ сделать это. Я понимаю, что я не...

27
Гипертюнинг параметров XGBoost

XGBoost проделал большую работу, когда речь идет о работе как с категориальными, так и с непрерывно зависимыми переменными. Но как выбрать оптимизированные параметры для проблемы XGBoost? Вот как я применил параметры для недавней проблемы Kaggle: param <- list( objective = "reg:linear", booster...

26
Слияние двух разных моделей в Керасе

Я пытаюсь объединить две модели Keras в одну модель и не могу этого сделать. Например, на прилагаемом рисунке я хотел бы получить средний слой измерения 8 и использовать его в качестве входных данных для слоя (снова размера 8) в модели а затем объединить и модель и модель как один модель.А 2A2A2Б...

26
Книги о «науке» в науке о данных? [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он фокусировался только на одной проблеме, редактируя этот пост . Закрыто 5 лет назад . Какие книги о науке и математике стоят за наукой о данных?...

26
Общедоступные наборы данных / API социальных сетей

В качестве дополнения к нашему большому списку общедоступных наборов данных , я хотел бы знать, существует ли какой-либо список общедоступных наборов данных социальных сетей / API для сканирования. Было бы очень хорошо, если бы наряду со ссылкой на набор данных / API были добавлены характеристики...

26
Как установить количество нейронов и слоев в нейронных сетях

Я новичок в нейронных сетях, и мне было трудно понять две концепции: Как определить количество средних слоев в данной нейронной сети? 1 против 10 или что-то еще. Как определить количество нейронов в каждом среднем слое? Рекомендуется ли иметь одинаковое количество нейронов в каждом среднем слое или...

26
Может ли машинное обучение выучить такую ​​функцию, как поиск максимума из списка?

У меня есть вход, который является списком, и вывод является максимумом элементов input-list. Может ли машинное обучение выучить такую ​​функцию, которая всегда выбирает максимум входных элементов, присутствующих на входе? Это может показаться довольно простым вопросом, но он может дать мне...

26
Как клонировать рабочую среду Python на другой машине?

Я разработал модель машинного обучения с Python (Anaconda + Flask) на моей рабочей станции, и все идет хорошо. Позже я попытался отправить эту программу на другую машину, где, конечно, я пытался настроить ту же среду, но программа не запускалась. Я скопировал программу на другие машины, где она...

26
Как Keras рассчитывает точность?

Как Keras рассчитывает точность по классовым вероятностям? Например, у нас есть 100 образцов в тестовом наборе, которые могут принадлежать одному из двух классов. У нас также есть список классовых вероятностей. Какой порог использует Keras, чтобы назначить выборку любому из двух...

26
Как установить batch_size, steps_per epoch и шаги валидации

Я начинаю изучать CNN, используя Keras. Я использую theano бэкэнд. Я не понимаю, как установить значения: размер партии, шагов за эпоху, validation_steps. Каким должно быть значение batch_size, количество шагов на эпоху и количество этапов проверки, если у меня 240 000 образцов в обучающем наборе и...

26
PyTorch против Tensorflow Fold

Как PyTorch, так и Tensorflow Fold являются средами глубокого обучения, предназначенными для работы в ситуациях, когда входные данные имеют неодинаковую длину или измерения (то есть ситуации, когда динамические графики полезны или необходимы). Я хотел бы знать, как они сравниваются, в смысле...

25
Коэффициент Джини против примеси Джини - деревья решений

Проблема касается построения деревьев решений. Согласно Википедии « коэффициент Джини » не следует путать с « примесью Джини ». Однако обе меры можно использовать при построении дерева решений - они могут поддержать наш выбор при разделении набора элементов. 1) «примесь Джини» - это стандартная...

25
Существует ли простой способ параллельного запуска pandas.DataFrame.isin?

У меня есть программа моделирования и скоринга, которая активно использует DataFrame.isinфункцию панд, просматривая списки «похожих» на Facebook записей отдельных пользователей на каждой из нескольких тысяч конкретных страниц. Это самая трудоемкая часть программы, в большей степени, чем части...

25
Разница между политикой сети AlphaGo и сетью ценностей

Я читал обзор высокого уровня об AlphaGo от Google ( http://googleresearch.blogspot.co.uk/2016/01/alphago-mastering-ancient-game-of-go.html ), и я столкнулся с условиями "политика" сеть "и" сеть ценностей ". На высоком уровне я понимаю, что сеть политик используется для предложения шагов, а сеть...