Вопросы с тегом «r»

10
Статистика + Информатика = Наука о данных? [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Data Stack Exchange. Закрыто 5 лет назад . Я хочу стать специалистом по данным . Я изучал прикладную статистику (актуарная наука), поэтому у меня...

10
LSTM или другой пакет RNN для R

Я видел впечатляющий результат от моделей LSTM, производящих тексты, подобные Шекспиру. Мне было интересно, существует ли пакет LSTM для R. Я гуглил его, но нашел только пакеты для Python и Julia. (возможно, есть некоторая проблема с производительностью, которая объясняет, почему эти программы...

10
Как ученые придумали правильные параметры и топологию скрытой модели Маркова для использования?

Я понимаю, как скрытая марковская модель используется в геномных последовательностях, таких как поиск гена. Но я не понимаю, как придумать конкретную марковскую модель. Я имею в виду, сколько состояний должна иметь модель? Сколько возможных переходов? Должна ли модель иметь петлю? Как они узнали...

10
Преобразование автоэнкодеров

Я только что прочитал статью Джеффа Хинтона о преобразовании автоэнкодеров Хинтон, Крижевский и Ван: Преобразование авто-кодировщиков . В искусственных нейронных сетях и машинном обучении, 2011. и очень хотел бы поиграть с чем-то вроде этого. Но, прочитав его, я не смог получить достаточно...

10
Тестирование программного обеспечения для Data Science в R

Я часто использую Nose, Tox или Unittest при тестировании моего кода на Python, особенно когда он должен быть интегрирован с другими модулями или другими частями кода. Однако теперь, когда я обнаружил, что использую R больше, чем python, для моделирования и разработки ML. Я понял, что на самом деле...

10
Сходимость в методе К-средних Хартиган-Вонга и других алгоритмах

Я пытался понять различные алгоритмы кластеризации k-средних, которые в основном реализованы в statsпакете Rязыка. Я понимаю алгоритм Ллойда и онлайн-алгоритм МакКуина. Я понимаю их следующим образом: Алгоритм Ллойда: Первоначально выбираются случайные наблюдения «k», которые будут служить...

10
ggvis vs. ggplot2 + Shiny; какой выбрать для интерактивной визуализации?

В CrossValidated есть похожий вопрос, и я прочитал ответы. Мой вопрос немного другой. Я не хочу просто визуализировать свои данные, и на самом деле то, что я хочу визуализировать, нелегко визуализировать с помощью любого пакета. У меня есть два набора точек ( координаты ) на моем графике. Я хочу...

10
Изучение порядковой регрессии в R?

Я работаю над проектом и нуждаюсь в ресурсах, чтобы ускорить меня. Набор данных составляет около 35000 наблюдений по 30 или около того переменным. Около половины переменных являются категориальными, в то время как некоторые имеют много разных возможных значений, то есть, если вы разделите...

9
Имеет ли смысл обучать CNN как автоэнкодер?

Я работаю с анализом данных ЭЭГ, которые в конечном итоге необходимо будет классифицировать. Тем не менее, получение ярлыков для записей несколько дорого, что заставило меня рассмотреть неконтролируемые подходы, чтобы лучше использовать наши довольно большие объемы немаркированных данных. Это,...

9
Реализовать дополнительный наивный байесовский в python?

проблема Я пытался использовать наивный байесовский код на помеченном наборе данных о преступности, но получил очень плохие результаты (точность 7%). Наивный Байес работает намного быстрее, чем другие алгоритмы, которые я использовал, поэтому я хотел попытаться выяснить, почему счет был таким...

9
R случайный лес на Amazon ec2 Ошибка: невозможно выделить вектор размером 5,4 Гб

Я тренирую модели случайных лесов на R, используя randomForest()1000 деревьев и фреймы данных с примерно 20 предикторами и 600К строк. На моем ноутбуке все работает нормально, но когда я перехожу на amazon ec2, чтобы запустить то же самое, я получаю ошибку: Error: cannot allocate vector of size 5.4...

9
Карьерный переход на Big Data Analytics

Я 35-летний ИТ-специалист, чисто технический специалист. Я хорош в программировании, изучаю новые технологии, понимаю их и внедряю. Я не любил математику в школе, поэтому у меня не было хороших результатов по математике. Я очень заинтересован в карьере аналитика больших данных. Меня больше...

8
Существуют ли методы машинного обучения для определения точек на графиках / изображениях?

У меня есть данные для бокового положения каждого транспортного средства с течением времени и номер полосы, как показано на этих 3 графиках в изображении и данных примера ниже. > a Frame.ID xcoord Lane 1 452 27.39400 3 2 453 27.38331 3 3 454 27.42999 3 4 455 27.46512 3 5 456 27.49066 3 Боковое...