Несмотря на то, что я получил образование инженера, я обнаружил, что все больше интересуюсь данными. Прямо сейчас я пытаюсь исследовать область далее. В частности, я хотел бы понять различные категории программных инструментов, которые существуют, и какие инструменты известны в каждой категории и почему. (Обратите внимание, что я не сказал «лучшие» инструменты, только известные, чтобы мы не начали пламенную войну.) Особо отметьте инструменты с открытым исходным кодом и свободно доступные - хотя не принимайте это как означающее, что Я интересуюсь только открытым исходным кодом и бесплатно.
data-mining
Джон Берриман
источник
источник
Ответы:
Это, пожалуй, самый полный список, который вы найдете: mloss.org
источник
Посмотри на
и хранилище машинного обучения UCI для наборов данных.
источник
Rattle - это графический интерфейс для интеллектуального анализа данных, который предоставляет интерфейс для широкого спектра R-пакетов.
источник
Посмотрите на НОЖ .
Очень легко учиться. С большим количеством возможностей для дальнейшего прогресса. Прекрасно интегрируется с Weka и R.
источник
С точки зрения популярности, эта статья (2008) рассматривает 10 лучших алгоритмов в области интеллектуального анализа данных .
источник
RapidMiner (Java) [с открытым исходным кодом]
источник
Есть ELKI , университетский проект с открытым исходным кодом, несколько сравнимый с WEKA, но гораздо более сильный, когда дело доходит до кластеризации и обнаружения выбросов. На самом деле WEKA - это не интеллектуальный анализ данных, а программное обеспечение для машинного обучения.
источник
Есть Red-R, который имеет приятный графический интерфейс и интерфейс визуального программирования. Он использует R для обработки различных данных анализа.
источник
Rexer Anlaytics проводит обзор инструментов каждый год. KDnuggets имеет описания программного обеспечения как по отрасли, так и по назначению.
источник
Интеллектуальный анализ данных SQL Server (SSDM) долгое время не обновлялся, но он все еще достаточно конкурентоспособен, если вы разрабатываете большие реляционные базы данных и кубы. Я медленно, но систематически пробираюсь сквозь тесты как можно большего количества инструментов для майнинга, и интерфейс Windows SQL Server является наиболее продуктивным и стабильным, который я когда-либо встречал (особенно когда речь идет о корпоративных базах данных, некоторые из которых удивительно небрежные интерфейсы) несмотря на свой возраст. Я бы предпочел современный интерфейс Windows Presentation Foundation (WPF), но это следующая лучшая вещь.
Я написал целую серию подробных любительских учебных пособий под названием «Rickety Stairway to SQL Server Data Mining» , когда я пытался приобрести некоторые базовые навыки майнинга. Несмотря на мою неопытность, они все еще полезны, помогая идентифицировать некоторые "ошибки" заранее.
источник