Обзор программных инструментов интеллектуального анализа данных

15

Несмотря на то, что я получил образование инженера, я обнаружил, что все больше интересуюсь данными. Прямо сейчас я пытаюсь исследовать область далее. В частности, я хотел бы понять различные категории программных инструментов, которые существуют, и какие инструменты известны в каждой категории и почему. (Обратите внимание, что я не сказал «лучшие» инструменты, только известные, чтобы мы не начали пламенную войну.) Особо отметьте инструменты с открытым исходным кодом и свободно доступные - хотя не принимайте это как означающее, что Я интересуюсь только открытым исходным кодом и бесплатно.

Джон Берриман
источник
1
Я советую это вики сообщества.
Тал Галили
звучит как домашнее задание
Нил Макгиган
@Tal Конечно, теперь преобразован.
@el главный - это очень широкий и общий вопрос ... но я боюсь, что это не домашнее задание.
Джон Берриман

Ответы:

7

Это, пожалуй, самый полный список, который вы найдете: mloss.org

Педро Оливейра
источник
Тем не менее, он сфокусирован на машинном обучении, которое можно рассматривать как смежную область интеллектуального анализа данных, так же как ИИ. Хотя обычно это использование синонимично, так как «прогнозирование» является одной из ключевых задач в интеллектуальном анализе данных. Но есть нечто большее, чем «обучение» интеллектуальному анализу данных.
ВЫЙТИ - Anony-Mousse
7

Посмотри на

  • Weka (Java, сильный в классификации)
  • Orange (скрипты на питоне, в основном классификация)
  • GNU R (язык R, в некоторой степени ориентированный на векторные таблицы, см. Обзор задач « Машинное обучение» и пользовательский интерфейс Rattle )
  • ELKI (Java, сильный на кластеризации и обнаружения выбросов, поддержка структуры индекса для ускорений, список алгоритмов )
  • Mahout (Java, принадлежит Hadoop, если у вас есть кластер и огромные наборы данных)

и хранилище машинного обучения UCI для наборов данных.

chl
источник
1
Вы можете добавить Red-R в список (своего рода клон Orange в R): red-r.org
Amro
Я скачал R и сейчас играю с ним.
Джон Берриман
@ Амро Спасибо! Тем не менее, он не доступен на платформе Mac, если я не ошибаюсь?
ЧЛ
Я не пользователь Mac, но я думаю, что сборка Linux может работать для вас (вам нужно вручную установить все зависимости Python): red-r.org/forum/topic.php?id=22#post-76
Amro
@ Амро, я попробую; в прошлом я тестировал RAnalyticFlow ( j.mp/bYF8xs ), но не убедился: я в основном пользователь CLI :-)
chl
3

Rattle - это графический интерфейс для интеллектуального анализа данных, который предоставляет интерфейс для широкого спектра R-пакетов.

Джером англим
источник
3

Посмотрите на НОЖ .

Очень легко учиться. С большим количеством возможностей для дальнейшего прогресса. Прекрасно интегрируется с Weka и R.

Радек
источник
2

Есть ELKI , университетский проект с открытым исходным кодом, несколько сравнимый с WEKA, но гораздо более сильный, когда дело доходит до кластеризации и обнаружения выбросов. На самом деле WEKA - это не интеллектуальный анализ данных, а программное обеспечение для машинного обучения.

ВЫЙТИ - Anony-Mousse
источник
1

Есть Red-R, который имеет приятный графический интерфейс и интерфейс визуального программирования. Он использует R для обработки различных данных анализа.

Стат-R,
источник
1

Rexer Anlaytics проводит обзор инструментов каждый год. KDnuggets имеет описания программного обеспечения как по отрасли, так и по назначению.

Димитрий Васильевич Мастеров
источник
0

Интеллектуальный анализ данных SQL Server (SSDM) долгое время не обновлялся, но он все еще достаточно конкурентоспособен, если вы разрабатываете большие реляционные базы данных и кубы. Я медленно, но систематически пробираюсь сквозь тесты как можно большего количества инструментов для майнинга, и интерфейс Windows SQL Server является наиболее продуктивным и стабильным, который я когда-либо встречал (особенно когда речь идет о корпоративных базах данных, некоторые из которых удивительно небрежные интерфейсы) несмотря на свой возраст. Я бы предпочел современный интерфейс Windows Presentation Foundation (WPF), но это следующая лучшая вещь.

Я написал целую серию подробных любительских учебных пособий под названием «Rickety Stairway to SQL Server Data Mining» , когда я пытался приобрести некоторые базовые навыки майнинга. Несмотря на мою неопытность, они все еще полезны, помогая идентифицировать некоторые "ошибки" заранее.

SQLServerSteve
источник