Я прохожу аспирантуру по прикладной статистике, в которой используется следующий учебник (чтобы дать вам представление об уровне освещаемого материала): Статистические концепции и методы , автор Г.К. Бхаттачарья и Р.А. Джонсон.
Профессор требует от нас использовать SAS для домашних заданий.
Мой вопрос заключается в следующем: есть ли библиотека (-ы) Java, которую можно использовать вместо SAS для задач, обычно встречающихся в таких классах.
В настоящее время я пытаюсь обойтись с Apache Math Commons, и хотя я впечатлен библиотекой (это простота использования и понятность), ей, кажется, не хватает даже простых вещей, таких как способность рисовать гистограммы (думать о комбинировании ее с библиотекой графиков). ).
Я посмотрел на Кольта, но мой первоначальный интерес угас довольно быстро.
Был бы признателен за любой вклад - и я смотрел на аналогичные вопросы по Stackoverflow, но не нашел ничего убедительного.
ПРИМЕЧАНИЕ. Мне известны библиотеки R, SciPy и Octave, а также java-библиотеки, которые делают к ним вызовы - я ищу нативную библиотеку Java или набор библиотек, которые вместе могут предоставить нужные мне функции.
ПРИМЕЧАНИЕ. Темы, охватываемые таким классом, как правило, включают: тесты с одним и двумя выборками и доверительные интервалы для средних и средних значений, описательную статистику, тесты на соответствие требованиям, одно- и двусторонний анализ ANOVA, одновременный вывод, тестирование дисперсии, регрессионный анализ и анализ категориальных данных.
Ответы:
Когда я вынужден использовать Java для базовой статистики, Apache Commons Math - путь. Для графиков я использую и рекомендую JFreeChart . Последний широко распространен, поэтому в stackoverflow даже есть заполненный тег для него .
редактировать
Если вы ищете набор, то, возможно, Deducer вариант. GUI основан на JGR, в то время как статистические части называются в R. Кажется, что он расширяется как через R, так и через Java . Можно, например, пропустить вызовы в Rengine, но вместо этого вызывать ссылочные библиотеки java. Но, признаюсь, я еще не пробовал.
Насколько я понял OP, оптимальным будет что-то вроде Rapidminer for Statistics , поскольку Rapidminer - это чистый Java-фреймворк, который поддерживает доступ к GUI (включая визуализации), использование в качестве библиотеки и разработку пользовательских плагинов. Насколько мне известно, что-то подобное для статистики не существует. Я не рекомендую Rapidminer для этой конкретной задачи , потому что, насколько мне известно, он включает только самые основные статистические тесты. Визуализации были расширены в последнее время, но я не могу оценить, насколько они настраиваемы сейчас.
источник
Проверьте Суан Шу: NumericMethod.com . Это не бесплатно в целом, но это бесплатно для академического использования.
источник
По аналогии с предложением Штеффена RapidMiner, вы можете рассмотреть Weka . Это может быть более конкретно ориентировано на машинное обучение, чем вы надеетесь. Он имеет множество алгоритмов для таких задач, как кластеризация, классификация и регрессия. Weka имеет графический интерфейс, но он также может быть использован в качестве библиотеки программного обеспечения. Я видел гистограммы в графическом интерфейсе, но я не уверен, легко ли их повторно использовать через библиотеку или нет.
источник
Попробуйте http://www.roguewave.com/Portals/0/products/imsl-numeric-libraries/java-library/docs/5.0.1/api/overview-summary.html
Он хорошо документирован и предоставляет множество полезных статистических и математических функций. Но, к сожалению, это не с открытым исходным кодом. Так что, если это не беспокоит вас, то библиотека должна быть в порядке.
Я не знаю, однако, если это обеспечивает графический вывод.
источник
В вычислительной среде DataMelt есть много статистических библиотек Java практически для любой темы. Вы можете использовать его с помощью Jython, как это предлагается на веб-сайте, но я использую его с Java и Groovy.
Я могу сказать больше: проект DataMelt охватывает следующие статистические темы:
Вот пример нелинейной регрессии, использующий метод логарифмического правдоподобия для подбора данных с ошибками:
Пакет бесплатный.
источник