Я наткнулся на эту статью, в которой используется обнаружение аномалий ссылок для прогнозирования актуальных тем, и я нахожу это невероятно интригующим: статья «Обнаружение новых тем в социальных сетях с помощью обнаружения аномалий ссылок» .
Я хотел бы скопировать его на другой набор данных, но я недостаточно знаком с методами, чтобы знать, как их использовать. Допустим, у меня есть ряд снимков сети узлов за период в шесть месяцев. Узлы имеют длиннохвостое распределение степеней, большинство из которых имеют только несколько соединений, но у некоторых их очень много. Новые узлы появляются в течение этого периода времени.
Как я могу реализовать последовательно рассчитанные нормализованные расчеты максимального правдоподобия, используемые в статье для обнаружения аномальных связей, которые, я думаю, могут быть предвестниками взрыва? Есть ли другие методы, которые были бы более подходящими?
Я спрашиваю как теоретически, так и практически. Если бы кто-то мог указать мне на способ реализовать это в Python или R, это было бы очень полезно.
Кто угодно? Я знаю, что у вас, умные люди, есть несколько стартовых мыслей для ответа,
Ответы:
Сначала вы должны составить определение показателя аномалии для нового узла (см. Раздел 3.1, 3.2). К счастью, соответствие между новым постом (в их случае) и новым узлом (в вашем случае) практически однозначное, поскольку нас интересует только набор узлов (пользователей), которым является узел (пост) относится к.
Спросите, если у вас есть трудности с выполнением шагов, описанных в подразделе 3.4., Где применяется SDNML.
источник