В свое свободное время я работаю над небольшой веб-системой, которая собирает отчеты о сбоях (но не о других, не сообщающих об ошибках), отправляемых из приложений Delphi для Windows.
Для устранения неполадок пользователи хотели бы иметь функцию интеллектуального анализа данных, чтобы найти взаимосвязи между версиями оборудования или операционной системы и конкретной ошибкой и / или сбоем.
Как пример, как это должно работать:
- для каждого сбоя в базе данных имеется отчет, в котором есть отпечаток / хэш-код трассировки стека (стек вызовов) на момент сбоя для выявления дубликатов
- алгоритм проверяет, все ли дубликаты отчета об ошибках также имеют некоторые другие общие атрибуты, например, отсутствующий пакет обновления операционной системы
- результат анализа перечисляет все свойства, которые имеют общие отчеты об ошибках
Давайте предположим, что эти автоматические отчеты об ошибках содержат всю ключевую информацию, такую как имена всех процессов, которые в данный момент выполняются, имена файлов, информация о версии загруженных библиотек DLL и т. Д.
Как я могу найти корреляции между повторяющимися сбоями и окружающей средой? Существуют ли конкретные алгоритмы или статистические методы, которые могут помочь?
Ответы:
Не могли бы вы попробовать [не разбившиеся] машины вашего пользователя на ту же информацию, что и в отчете о сбое? Потому что тогда вы могли бы использовать логистическую регрессию для моделирования этих атрибутов (и взаимодействий) с вероятностью сбоя.
источник