Наука о данных

10
Можно ли использовать координаты GPS (широту и долготу) в качестве элементов в линейной модели?

У меня есть наборы данных, которые содержат, среди многих функций, GPS-координаты (широта и долгота). Я хотел бы использовать эти наборы данных для изучения таких проблем, как: (1) вычисление ETA для перехода между начальной и конечной точками; и (2) оценка количества преступлений по конкретной...

10
Зачем использовать регуляризацию L1 над L2?

При проведении модели линейной регрессии с использованием функции потерь, почему я должен использовать вместо регуляризации ?L 2L1L1L_1L2L2L_2 Это лучше для предотвращения переоснащения? Является ли это детерминированным (поэтому всегда уникальным решением)? Это лучше при выборе функции (потому что...

10
Что такое «новый алгоритм обучения подкреплению» в AlphaGo Zero?

По какой-то причине AlphaGo Zero не пользуется такой же популярностью, как оригинальный AlphaGo, несмотря на его невероятные результаты. Начиная с нуля, он уже побеждал AlphaGo Master и прошел множество других тестов. Еще более невероятно, что это сделано за 40 дней. Google называет его «возможно...

10
Почему обучение занимает так много времени на моем GPU?

Подробности: GPU : GTX 1080 Обучение : ~ 1,1 млн. Изображений, принадлежащих 10 классам Проверка : ~ 150 тысяч изображений, относящихся к 10 классам Время за эпоху : ~ 10 часов Я установил CUDA, cuDNN и Tensorflow (также Tensorflow GPU). Я не думаю, что моя модель настолько сложна, что занимает 10...

10
Как я могу определить, был ли фотоснимок?

Я хотел бы проверить файлы JPG, если они были изменены для изменения содержимого. Что я считаю НЕ фотоделал: Обрезка вращающийся (Масштабирование) Разрешение изображения Смартфоны могут автоматически изменять Что я считаю фотошопом: Добавление нового изображения поверх частей старого изображения...

10
Считается ли PCA алгоритмом машинного обучения?

Я понял, что анализ главных компонентов - это метод уменьшения размерности, то есть, учитывая 10 входных объектов, он даст меньшее количество независимых элементов, которые являются ортогональными и линейными преобразованиями исходных элементов. Является ли PCAсам по себе рассматривается как...

10
Попытка использовать TensorFlow для прогнозирования данных финансовых временных рядов

Я новичок в ML и TensorFlow (я начал около нескольких часов назад), и я пытаюсь использовать его для прогнозирования следующих нескольких точек данных во временном ряду. Я беру свой вклад и делаю это с этим: /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 | 6...

10
Keras LSTM с 1D временными рядами

Я изучаю, как использовать Keras, и я добился разумного успеха с моим помеченным набором данных, используя примеры в Chollet Deep Learning for Python . Набор данных ~ 1000 временных рядов с длиной 3125 с 3 потенциальными классами. Я хотел бы выйти за рамки базовых плотных слоев, которые дают мне...

10
Линейная регрессия и масштабирование данных

На следующем графике показаны коэффициенты, полученные с помощью линейной регрессии ( mpgв качестве целевой переменной и всех других в качестве предикторов). Для набора данных mtcars ( здесь и здесь ) как с масштабированием данных, так и без него: Как мне интерпретировать эти результаты? Переменные...

10
Неуправляемая сегментация изображения

Я пытаюсь реализовать алгоритм, где дано изображение с несколькими объектами на плоской таблице, желательным является вывод масок сегментации для каждого объекта. В отличие от CNN, целью здесь является обнаружение объектов в незнакомой среде. Каковы лучшие подходы к этой проблеме? Кроме того, есть...

10
Использование RNN (LSTM) для системы распознавания жестов

Я пытаюсь создать систему распознавания жестов для классификации жестов ASL (американский язык жестов) , поэтому мой ввод должен представлять собой последовательность кадров либо из камеры, либо из видеофайла, затем он обнаруживает последовательность и сопоставляет ее с соответствующей занятия...

10
Нулевое среднее и единичная дисперсия

Я изучаю масштабирование данных, и в частности метод стандартизации. Я понял математику, стоящую за этим, но мне не понятно, почему важно дать функциям нулевое среднее и единичную дисперсию. Можете ли вы объяснить...

10
Это хорошая практика разработки функций?

У меня есть практический вопрос о проектировании функций ... скажем, я хочу прогнозировать цены на жилье с помощью логистической регрессии и использовал множество функций, включая почтовый индекс. Затем, проверив важность функции, я понял, что zip - довольно хорошая функция, поэтому я решил...

10
XGboost - выбор по модели

Я использую XGboost, чтобы предсказать целевую переменную 2 классов по страховым претензиям. У меня есть модель (обучение с перекрестной проверкой, настройка гиперпараметров и т. Д.), Я запускаю другой набор данных. Мой вопрос: Есть ли способ узнать, почему данное утверждение было затронуто одним...

10
Ранняя остановка на потерю проверки или на точность?

В настоящее время я обучаю нейронную сеть, и я не могу решить, какой из них использовать для реализации моих критериев ранней остановки: потеря проверки или метрики, такие как точность / f1score / auc / независимо от того, что вычислено на наборе проверки. В своем исследовании я натолкнулся на...

10
Как я могу сделать классификацию с категориальными данными, которые не являются фиксированными?

У меня есть проблема классификации с категориальными и числовыми данными. Проблема, с которой я сталкиваюсь, заключается в том, что мои категориальные данные не являются фиксированными, это означает, что у нового кандидата, метка которого я хочу предсказать, может быть новая категория, которая...

10
Каковы различия между Convolutional1D, Convolutional2D и Convolutional3D?

Я узнал о сверточных нейронных сетях. При рассмотрении Kerasпримеров я натолкнулся на три различных метода свертки. А именно, 1D, 2D & 3D. Каковы различия между этими тремя слоями? Каковы их варианты использования? Есть ли ссылки или ссылки, чтобы показать их варианты...

10
Как закодировать класс с 24 000 категорий?

В настоящее время я работаю над моделью логистической регрессии для геномики. Одно из полей ввода, которое я хочу включить как ковариату, это genes. Существует около 24 000 известных генов. Существует много особенностей с таким уровнем изменчивости в вычислительной биологии, и необходимы сотни...

9
Как следует обращаться с неявными данными в рекомендации

Система рекомендаций ведет учет того, какие рекомендации были сделаны конкретному пользователю и принимает ли этот пользователь рекомендацию. Это как user_id item_id result 1 4 1 1 7 -1 5 19 1 5 80 1 где 1 означает, что пользователь принял рекомендацию, а -1 означает, что пользователь не ответил на...