Привет жителям сервера Fault
У меня раздражающая проблема с локальной сетью из примерно 100 компьютеров, 2 серверов домена Windows и 12 телефонов VoIP. С момента их установки около года назад, каждую неделю или около того, мы замечаем, что телефон VoIP перезагружается сам - иногда во время разговора. Одновременно часто появляются признаки временной потери соединения на компьютерах: зависание в проводнике при доступе к сетевым ресурсам, ошибки в нашем программном обеспечении для администрирования из-за потери соединения с сервером базы данных.
Я проводил мониторинг Wireshark на соединении между УАТС VoIP и остальной частью сети. Wireshark обнаруживает группу повторно переданных TCP-пакетов в то время, когда мы записываем перезапуски телефона. Журнал Wireshark показывает около 2 кластеров повторных передач в день, от 5 пакетов до сотен. Они в каждом кластере находятся в основном между УАТС и некоторым набором телефонов VoIP, но не всегда один и тот же набор. Часто повторные передачи одновременно осуществляются на телефоны, подключенные к одному и тому же коммутатору, но иногда повторные передачи происходят вместе на телефоны на противоположных концах сети. Обычно при передаче TCP-трафика происходят некоторые повторные передачи, например, между клиентскими компьютерами и файловыми серверами.
Пики в повторных передачах и перезагрузках телефона плохо коррелируют с тем, когда сеть сильно загружена. Кажется, что они случаются немного чаще в течение дня, но чаще вечером, когда движение должно уменьшиться. Они происходят достаточно часто поздно ночью, когда большинство компьютеров выключено и трафик должен быть наименьшим.
У вас есть идеи, которые могут помочь диагностировать причину подобных проблем? Одна вещь, которую я еще не попробовал, но должен был, это обновить прошивку всех коммутаторов.
источник
Ответы:
Повторные передачи TCP обычно происходят из-за перегрузки сети. Ищите большое количество широковещательных пакетов во время возникновения проблемы. Если процент трафика широковещания в вашем захвате превышает примерно 3% от общего захваченного трафика, то вы определенно испытываете заторы. Посмотрите на широковещательные рассылки как физического уровня (ARP), так и сетевого уровня (разрешение имен) в сети. Если вы обнаружите большой объем широковещательного трафика, вы можете отследить его до источника по данным захвата.
источник
arp
- и только для просмотра широковещательных записей - с использованием фильтраeth.addr==ff:ff:ff:ff:ff:ff
Сбор статистики трафика для ваших коммутаторов может показать, что у вас есть периоды, когда вы работаете с максимальной пропускной способностью. Это может привести к повторным попыткам, когда ответы не возвращаются в течение начального тайм-аута (часто 3 секунды). Это на мгновение увеличивает заторы, пока не сработают механизмы уменьшения заторов.
Ищите людей, использующих потоковое мультимедиа, так как они могут быстро впитываться.
Вы можете решить проблему с телефонами путем ограничения трафика. Это просто перенесет проблему на других пользователей.
источник
Для меня это звучит как петля связующего дерева или широковещательный шторм, особенно если повторные передачи и проблемы локализованы для одного и того же коммутатора (который отличается). Когда это происходит, каковы состояния порта на вашем устройстве L2? Возможно плохой коммутатор или плохие приоритеты корневого моста? Интересная проблема.
источник
Вы, вероятно, решили эту проблему, так как это было так долго, но по сути вам нужно включить «быстрый порт» на портах, которые имеют конечные точки (VoIP-телефоны, рабочие станции, серверы). Телефон может отправлять PDU, поэтому, если этот парень перезагружается, это вызывает сближение STP, в результате чего таблица FDB сбрасывается и все устройства проходят через 4/5 шагов STP. Помещая порты с конечной точкой в «быстрый порт», они пропускают ожидание и переходят прямо в режим пересылки.
источник
Надеюсь, ваши телефоны находятся в другой подсети и VLAN от других компьютеров?
источник
Это также может быть неисправное оборудование, например, неисправный выключатель. Ретрансляции соотносятся с телефонами / компьютерами на одном конкретном коммутаторе или части сети?
Просто чтобы немного расширить мой ответ. Не все переключатели созданы равными, даже если они имеют одинаковые характеристики. Некоторые способны справиться с гораздо более высокой нагрузкой, чем другие, потому что у них внутри более быстрые процессоры. Может случиться так, что ваши переключатели не совсем подходят.
Я бы начал с того, что поставил некоторые из ваших самых проблемных VOIP-телефонов на их физический коммутатор и посмотрел, продолжаются ли их перезагрузки. Если он уйдет, значит, вы на пути к его решению очень скоро.
источник