Управление информацией, связанной с ГИС [закрыто]

22

Я часто работаю над картированием чувствительных данных об уровне пациента. Хотя я чувствую, что хорошо разбираюсь во многих вопросах управления (например, когда использовать методы биннинга и k-анонимности ), но я бы хотел улучшить свои знания по этому вопросу.

Вот хороший пример того, почему это важно: пространственная конфиденциальность и ГИС: реорганизация мест смертности по опубликованным картам об урагане Катрина

Есть ли у кого-нибудь хорошие эмпирические правила, которые они используют при отображении конфиденциальных данных?

Существуют ли какие-либо хорошие ресурсы, которые охватывают различные методы защиты конфиденциальности или дают рекомендации по этому вопросу?

Повалить
источник
2
+1 (кстати, один метод анонимизации данных, предложенный в предыдущей теме, появляется на gis.stackexchange.com/questions/31236/… ). Не могли бы вы пояснить, что вы подразумеваете под «эмпирическими правилами»? Ищете ли вы технические решения для сокрытия данных, или вы ищете руководство относительно того, когда и насколько данные должны быть защищены?
whuber
1
В первую очередь технические решения, хотя руководство по уровню защиты также было бы полезно. Я вижу, что они идут рука об руку. Например, очень чувствительные данные, состоящие из множества небольших чисел, должны отображаться с использованием метода X или метода Y, если включена демографическая информация. Я подумывал об использовании шестнадцатеричного биннинга для задачи, но потом вдруг понял, что понятия не имею о численности населения в каждом шестиугольнике. Что если я отобразил значение 20, а затем обнаружил, что в этом шестиугольнике было только 20 жителей? Я также недавно слышал о проблеме модифицируемого воздушного блока, связанной с этим.
спад
Я проголосовал за то, чтобы закрыть это как слишком широкое, потому что оно ищет и «практические правила», и список ресурсов.
PolyGeo

Ответы:

8

Это обсуждение крайне необходимо в профессии ГИС, и я возложил большую вину на высшее образование за пренебрежение этой темой.

Тем не менее, вот некоторая интересная, если не устаревшая, литература по теме. Единственный реальный консенсус между этими ресурсами заключается в том, что в профессии ГИС нет консенсуса относительно личной конфиденциальности, но это должно быть серьезной проблемой.

Этика ГИС | Джереми Крэмптон

Защита личной конфиденциальности при использовании географических информационных систем | Харлан Дж. Онсруд, Джефф П. Джонсон и Ксавье Лопес | ССЫЛКА ОБНОВЛЕНО 1/11/17

Конфиденциальность и конфиденциальность в здравоохранении ГИС | ССЫЛКА ОБНОВЛЕНО 1/11/17

Шон Адкинс
источник
1
Проголосовал за это, как на самом деле подчеркивает трудности, присущие (до сих пор) в этой области. Рассол действительно (и специально) открыл своими наблюдениями такую ​​огромную банку с червями, что почти невозможно рассмотреть все возможные акты нераскрытия. Всегда существует острая проблема контекстуальных знаний, влияющих на требования о раскрытии, а также - прикладные знания извне оригинального ресурса, которые могут быть использованы для идентификации личности. Хеширование данных или пространственное смещение точек никогда не могут свести на нет такие потенциальные проблемы. Так что вы в значительной степени остались с вашей собственной этической позицией!
Андрей Тис
Стандартные процедуры анонимности имеют тенденцию делать предположения о нормально распределенных группах населения, когда большая часть пространственного анализа, как правило, далека от нормального распределения. Создание растровых изображений немного размывает воспринимаемую точность результатов, поэтому их можно рассмотреть для общего представления. В первоначальном вопросе говорилось о MAUP, и, безусловно, может помочь использование какой-либо формы мошенничества на разных пространственных уровнях, хотя в конечном итоге стоило бы стереть что-то вроде GAM от Openshaw?
Андрей Тис
1
@AndrewTice Могу я спросить, что такое афера? Мои де-акронимистические способности оставили меня сегодня!
падение
1
@ Сброс - Извини! Он обозначает метод регулировки малых ячеек. Если вы Google, что в полном объеме, вы найдете литературу от ONS в Великобритании. Это один из проверенных и проверенных методов для отчетов о переписи на небольшом уровне, поэтому он применяется для подсчета площадных единиц. Это немного грубая сила, но поскольку ONS широко ее использует, есть основания для применения этого метода.
Эндрю Тис
1
Хлоп! Всегда облом при обращении к старому материалу. Я постараюсь найти рабочие ссылки и отредактировать свой пост соответствующим образом. Благодарность!
Шон Адкинс
4

Это правила, данные Евростатом, когда он просит сообщить о местонахождении хозяйств. Местоположения сообщаются с округленными координатами и в некоторых случаях с применением дополнительного полуслучайного смещения. Я не знаю, дают ли они хорошее эмпирическое правило, но, по крайней мере, эти правила используются известным европейским авторитетом.

Относительно местоположения холдинга применяются два принципа: (i) точные координаты не требуются; и (ii) местоположение с одним владением будет перекодировано.

(i) точные координаты не требуются: координаты долготы и широты не потребуются в виде секунд или десятичных долей минут. Необходимо будет указать местоположение только в ближайшие 5 минут, что соответствует площади земли примерно 3000-7000 га, в зависимости от местоположения в Европе.

ii) будет перекодировано местоположение только с одним удержанием: возможно, что в районах с очень большими запасами местоположение, указанное с точностью до 5 минут долготы и широты, может содержать только одно удержание, которое, следовательно, может быть непосредственно идентифицировано. Чтобы гарантировать, что прямая идентификация не может иметь место, населенный пункт, имеющий только одно владение, должен быть распределен по ближайшей соседней точке (выбранной случайным образом), по крайней мере, с другим удержанием. Если какое-либо из 8 соседних местоположений не имеет по меньшей мере одного удержания, соседние местоположения должны быть расширены до тех пор, пока другие не будут расположены по меньшей мере с одним другим удержанием. Однако, когда это возможно, агрохолдинг должен быть отнесен к региону NUTS 3, где он расположен.

user30184
источник
3

Это очень интересное поле.

Мое первое предложение - эти статьи: http://dk-giscience.zgis.net/index.php/37-website/255-kounadi-ourania от исследователя, который имеет степень доктора философии по этой теме.

И это о маскировке чувствительных географических данных: http://www.cartographicperspectives.org/index.php/journal/article/view/cp49-leitner-curtis

Также о медицинских данных: http://www.ij-healthgeographics.com/content/8/1/46

Geof
источник
1

Я подумала, что добавлю этот полезный сайт в качестве дополнительной ссылки: Британская анонимная сеть

Он не относится к ГИС и нацелен на Великобританию, но дает некоторую полезную информацию и ресурсы по снижению риска раскрытия.

Они также проводят серию бесплатных семинаров и клиник по анонимизации

Повалить
источник
Еще одна полезная ссылка, структура принятия решений от UKAN: ukanon.net/ukan-resources/ukan-decision-making-framework
Tumbledown