Как компании отслеживают ошибки на устройствах IoT, шлюзах и платформах в настоящее время? Моя компания использует papertrail для агрегирования журналов со всех устройств, однако это часто приводит к тому, что мы сталкиваемся с несколькими системами, когда в работе возникает ошибка.
Я ищу способ уменьшить нашу «временную причину» при разрешении исключений, которые могли быть сгенерированы в одном месте (например, на платформе IoT), но возникли в результате проблемы в другом месте в стек - например, ошибка данных с периферийного устройства.
С точки зрения того, что я нашел в этом пространстве, Sentry и Rollbar хороши для отслеживания исключений на серверах или в приложениях, но не предоставляют средства для отслеживания каскадных ошибок, как обсуждалось в предыдущем абзаце.
Существуют ли системы, позволяющие сделать это лучше, чем регистрация текста? Я специально искал возможность использовать события в виде хлебных крошек, которые вы получаете от Sentry, но с отслеживанием по распределенной системе.