Я читал эту книгу для своего класса рандомизированных алгоритмов. В этой конкретной книге есть целый раздел, посвященный поиску медианы массива с использованием случайного выбора, что приводит к более эффективному алгоритму. Теперь я хотел бы знать, есть ли какие-либо практические применения этого алгоритма в области информатики, кроме теоретического улучшения. Существуют ли алгоритмы или структуры данных, которые должны найти медиану массива?
runtime-analysis
randomized-algorithms
Шаран Дуггирала
источник
источник
Ответы:
Применение этого алгоритма тривиально - вы используете его всякий раз, когда хотите вычислить медиану набора данных (другими словами, массива). Эти данные могут поступать из разных областей: астрономические наблюдения, социальные науки, биологические данные и т. Д.
Тем не менее, стоит упомянуть, когда предпочитать медиану (или режим). По сути, в описательной статистике, когда наши данные распределены совершенно нормально, среднее, модальное и медианное значения равны, т.е. они совпадают. С другой стороны, когда наши данные искажены, то есть частотное распределение для наших данных (влево / вправо) искажено, среднее значение не может обеспечить наилучшее центральное местоположение, поскольку асимметрия уводит его от типичного значения влево или вправо в то время как медиана не так сильно зависит от искаженных данных, и, таким образом, лучше всего сохраняет эту позицию, указывая на типичное значение. Таким образом, вычисление медианы может быть предпочтительным, когда вы имеете дело с искаженными данными.
Кроме того, в машинном обучении интенсивно используются статистические методы, например, кластеризация медиан .k
источник
Медианная фильтрация распространена при уменьшении определенных типов шума при обработке изображений. Особенно шум соли и перца. Он работает, выбирая медианное значение в каждом цветовом канале в каждой локальной окрестности изображения и заменяя его им. Насколько велики эти окрестности, может варьироваться. Популярные размеры фильтра (окрестности) составляют, например, 3x3 и 5x5 пикселей.
источник
Вычисление медиан особенно важно в рандомизированных алгоритмах.
источник
Алгоритм выбора имеет несколько приложений:
источник