Мне дали сетку положительных целочисленных значений. Эти числа представляют интенсивность, которая должна соответствовать силе убеждения человека, занимающего это место в сетке (более высокое значение указывает на более высокое убеждение). Человек, как правило, будет влиять на несколько ячеек сетки.
Я считаю, что схема интенсивностей должна «выглядеть гауссовской» в том смысле, что будет центральное местоположение высокой интенсивности, а затем интенсивности сужаются радиально во всех направлениях. В частности, я хотел бы смоделировать значения как «масштабированный гауссовский» с параметром для дисперсии и другим для масштабного коэффициента.
Есть два осложняющих фактора:
- отсутствие человека не будет соответствовать нулевому значению из-за фонового шума и других эффектов, но значения должны быть меньше. Они могут быть ошибочными, и в первом приближении может быть трудно смоделировать как простой гауссов шум.
- Диапазон интенсивности может варьироваться. Для одного экземпляра значения могут находиться в диапазоне от 1 до 10, а в другом - от 1 до 100.
Я ищу подходящую стратегию оценки параметров или указатели на соответствующую литературу. Указатели на то, почему я подхожу к этой проблеме в целом, также будут оценены :). Я читал о кригинге и гауссовских процессах, но это кажется очень тяжелым механизмом для моей проблемы.
источник
Ответы:
Вы можете использовать этот модуль в pysal библиотеки питона для методов пространственного анализа данных , я обсуждаю ниже.
Ваше описание того, как на отношение каждого человека влияют отношения окружающих его людей, может быть представлено пространственной авторегрессионной моделью (SAR) (см. Также мое простое объяснение SAR из этого ответа SE 2 ). Самый простой подход состоит в том, чтобы игнорировать другие факторы и оценить силу влияния того, как окружающие люди влияют на отношение друг друга, используя статистику Морана I.
Если вы хотите оценить важность других факторов при оценке силы влияния окружающих людей, это более сложная задача, тогда вы можете оценить параметры регрессии: . См. Документы здесь . (Методы оценки этого типа регрессии происходят из области пространственной эконометрики и могут стать намного более сложными, чем ссылка, которую я дал.)Y= b x + r h o WY+ е
Ваша задача будет построить матрицу пространственных весов ( ). Я думаю, что каждый элемент w i j матрицы должен быть 1 или 0 в зависимости от того, находится ли человек i на некотором расстоянии, вы чувствуете, что он должен влиять на другого человека j .W веся ж я J
Чтобы получить интуитивное представление о проблеме, ниже я проиллюстрирую, как процесс генерирования пространственных авторегрессионных данных (DGP) будет формировать структуру значений. Для 2 решеток имитируемых значений белые блоки представляют высокие значения, а темные блоки представляют низкие значения.
В первой решетке ниже значений сетки были сгенерированы нормально распределенным случайным процессом (или гауссовым), где равно нулю.г ч о
источник
Вот простая идея, которая может работать. Как я уже говорил в комментариях, если у вас есть сетка с интенсивностями, почему бы не соответствовать плотности двумерного распределения?
Вот пример графика, чтобы проиллюстрировать мою точку зрения:
Каждая точка сетки с отображается в виде квадрата, окрашенного в соответствии с интенсивностью. На график накладывается контурный график двумерного графика нормальной плотности. Как вы можете видеть, контурные линии расширяются в направлении уменьшения интенсивности. Центр будет управляться средним двухвариантной нормали и разбросом интенсивности в соответствии с ковариационной матрицей.
Чтобы получить оценки среднего значения и ковариационной матрицы, можно использовать простую числовую оптимизацию, сравнить интенсивности со значениями функции плотности, используя среднее значение и ковариационную матрицу в качестве параметров. Минимизируйте, чтобы получить оценки.
Конечно, это, строго говоря, не статистическая оценка, но, по крайней мере, это даст вам представление о том, как действовать дальше.
Вот код для воспроизведения графика:
источник
источник