Вопросы с тегом «python»

10
Избегайте перезагрузки DataFrame между разными ядрами Python

Есть ли способ сохранить переменную (большой стол / фрейм данных) в памяти и разделить ее между несколькими ноутбуками ipython? Я бы искал что-то, что концептуально похоже на постоянные переменные MATLAB. Там можно вызывать пользовательскую функцию / библиотеку из нескольких отдельных редакторов...

10
Сеть искусственных нейронов (ANN) с произвольным числом входов и выходов

Я хотел бы использовать ANNs для моей проблемы, но проблема заключается в том, что номера входов и выходов не являются фиксированными. Я сделал поиск в Google, прежде чем задавать вопрос, и обнаружил, что RNN может помочь мне с моей проблемой. Но все примеры, которые я нашел, так или иначе...

10
Найдите последовательные нули в DataFrame и выполните условную замену

У меня есть такой набор данных: Примерный фрейм данных import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) Я хотел бы заменить некоторые из 0«s в col1и col2с...

10
Как выполнить логистическую регрессию с большим количеством функций?

У меня есть набор данных с 330 выборками и 27 функциями для каждой выборки, с проблемой двоичного класса для логистической регрессии. Согласно «правилу если десять» мне нужно по крайней мере 10 событий для каждой функции, которая будет включена. Тем не менее, у меня есть несбалансированный набор...

10
Почему обучение занимает так много времени на моем GPU?

Подробности: GPU : GTX 1080 Обучение : ~ 1,1 млн. Изображений, принадлежащих 10 классам Проверка : ~ 150 тысяч изображений, относящихся к 10 классам Время за эпоху : ~ 10 часов Я установил CUDA, cuDNN и Tensorflow (также Tensorflow GPU). Я не думаю, что моя модель настолько сложна, что занимает 10...

10
Попытка использовать TensorFlow для прогнозирования данных финансовых временных рядов

Я новичок в ML и TensorFlow (я начал около нескольких часов назад), и я пытаюсь использовать его для прогнозирования следующих нескольких точек данных во временном ряду. Я беру свой вклад и делаю это с этим: /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 | 6...

10
Keras LSTM с 1D временными рядами

Я изучаю, как использовать Keras, и я добился разумного успеха с моим помеченным набором данных, используя примеры в Chollet Deep Learning for Python . Набор данных ~ 1000 временных рядов с длиной 3125 с 3 потенциальными классами. Я хотел бы выйти за рамки базовых плотных слоев, которые дают мне...

9
Кластеризация документов с использованием тем, полученных из скрытого распределения Дирихле

Я хочу использовать скрытое выделение дирихле для проекта, и я использую Python с библиотекой gensim. После нахождения тем я хотел бы кластеризовать документы, используя алгоритм, такой как k-means (в идеале я хотел бы использовать хороший для перекрывающихся кластеров, поэтому любая рекомендация...

9
Реализовать дополнительный наивный байесовский в python?

проблема Я пытался использовать наивный байесовский код на помеченном наборе данных о преступности, но получил очень плохие результаты (точность 7%). Наивный Байес работает намного быстрее, чем другие алгоритмы, которые я использовал, поэтому я хотел попытаться выяснить, почему счет был таким...

9
Как двоично кодировать многозначную категориальную переменную из кадра данных Pandas?

Предположим, у нас есть следующий фрейм данных с несколькими значениями для определенного столбца: categories 0 - ["A", "B"] 1 - ["B", "C", "D"] 2 - ["B", "D"] Как мы можем получить такой стол? "A" "B" "C" "D" 0 - 1 1 0 0 1 - 0 1 1 1 2 - 0 1 0 1 Примечание: мне не обязательно нужен новый фрейм...

9
Многомерная линейная регрессия в Python

Я ищу пакет Python, который реализует многомерную линейную регрессию. (Терминологическое примечание: многомерная регрессия имеет дело со случаем, когда существует более одной зависимой переменной, в то время как множественная регрессия имеет дело со случаем, когда существует одна зависимая...

9
Библиотека Python, которая может вычислить матрицу путаницы для классификации по нескольким меткам

Я ищу библиотеку Python, которая может вычислить матрицу путаницы для классификации по нескольким меткам . FYI: scikit-learn не поддерживает мульти-метки для матрицы путаницы) В чем разница между Multiclass и Multilabel Problem...

9
Экспорт весов (формула) из Случайного Лесного Регрессора в Scikit-Learn

Я обучил модель прогнозирования с помощью Scikit Learn на Python (Random Forest Regressor) и хочу каким-то образом извлечь вес каждой функции, чтобы создать превосходный инструмент для ручного прогнозирования. Единственное, что я нашел, - model.feature_importances_но это не помогает. Есть ли способ...

9
Почему скорость обучения приводит к стремительному росту веса моей нейронной сети?

Я использую tenorflow для написания простых нейронных сетей для небольшого количества исследований, и у меня было много проблем с весами 'nan' во время обучения. Я пробовал много разных решений, таких как смена оптимизатора, изменение потерь, размера данных и т. Д., Но безрезультатно. Наконец, я...

9
Может ли HDF5 надежно записываться и считываться одновременно отдельными процессами Python?

Я пишу сценарий для записи живых данных с течением времени в один файл HDF5, который включает весь мой набор данных для этого проекта. Я работаю с Python 3.6 и решил создать инструмент командной строки, используя clickдля сбора данных. Меня беспокоит, что произойдет, если сценарий сбора данных...

9
Несбалансированные данные, приводящие к неправильной классификации в мультиклассовом наборе данных

Я работаю над классификацией текста, где у меня 39 категорий / классов и 8,5 миллионов записей. (В дальнейшем данные и категории будут увеличиваться). Структура или формат моих данных выглядит следующим образом....

9
Почему моя модель Keras учится распознавать фон?

Я пытаюсь обучить эту реализацию Keras Deeplabv3 + на Pascal VOC2012, используя предварительно обученную модель (которая также обучалась на этом наборе данных). Я получил странные результаты с точностью, быстро сходящейся к 1,0: 5/5 [==============================] - 182s 36s/step - loss:...

8
Почему регрессия Gradient Boosting предсказывает отрицательные значения, когда в моем тренировочном наборе нет отрицательных значений y?

Как я могу увеличить количество деревьев в scikit узнать «S GradientBoostingRegressor, я получаю более негативные прогнозы, несмотря на то, нет отрицательных значений в моем обучении или тестирования набора. У меня есть около 10 функций, большинство из которых являются двоичными. Вот некоторые...

7
Ошибка памяти при использовании большего количества слоев в модели CNN

На моем dell core i7 - 16 ГБ ОЗУ - 4 ГБ 960-метровый ноутбук с графическим процессором я работаю над проектом по классификации изображений КТ легких с использованием 3D CNN. Я использую процессорную версию tenorflow. Изображения подготовлены как размер массива (25,50,50). В моей модели CNN было 2...