Cisco 6500 VSS улучшает или вредит MTBF?

11

Я понимаю преимущества Cisco 6500 VSS с очевидными преимуществами единого управления, одного экземпляра маршрутизации, исключения STP, каналов портов в шасси и т. Д. С двумя автономными Cisco 6500, которые могут иметь порты L3 и L2 между ними, по крайней мере, они не имеют операционной зависимости друг от друга через плоскость управления.

В мире VSS - и у меня нет прямого опыта с этим - у нас теперь есть программное обеспечение и другие протоколы, которые управляют обоими коммутаторами. В моих разработках, в которых ожидается, что в программном обеспечении будут обнаружены ошибки, VSS понижает MTBF, как я подозреваю, и является компромиссом с полученными возможностями, или я упускаю, как улучшается MTBF?

generalnetworkerror
источник
4
Мне бы очень хотелось увидеть необработанные данные об этом, но я сомневаюсь, что даже у Cisco это есть. Случайный взгляд на c-nsp и bugtool показывает много специфичных для VSS режимов сбоев, но, очевидно, это ничего не доказывает. В нашей сети три главные причины перебоев в работе, каждая из которых разделена огромным запасом: 1. Ошибка оператора 2. Сломанный SW 3. Сломанный HW / Infra. Но обычно дизайны фокусируются на том, чтобы сделать 3. лучше, в то же время делая 1-2 хуже.
ytti
2
По вашему опыту, дайте # 2 Broken SW, это происходит более или менее часто с VSS?
generalnetworkerror
1
Мы не запускаем VSS, поэтому нет данных. Я очень сомневаюсь, что рано придумаю любое решение, которое добавляет передачу сигналов совместного использования судьбы между узлами, я гораздо больше сосредоточен на локальных решениях восстановления без сохранения состояния. Но я полностью признаю, что для некоторых приложений VSS может быть чрезвычайно привлекательным.
ytti
3
Вы спрашиваете о сбоях в обслуживании или фактических сбоях линейных плат? MTBF обычно используется для описания частоты отказов оборудования. В этом случае VSS не влияет на оборудование в любом случае.
smoothbSE
@smoothbSE, хорошее замечание по MTBF - это ошибки h / w. Я использовал термин свободно, чтобы указать любой тип отказа.
generalnetworkerror

Ответы:

7

Короткая версия ответа: немного и того, и другого, но это не означает, что это технология для прямого повышения доступности

Длинная версия ответа: как уже отмечали другие, традиционные определения MTBF и доступности производителя фокусируются на сбоях оборудования. Другие факторы - человеческая ошибка, программное обеспечение с ошибками, плановое обслуживание и т. Д. - являются соображениями при разработке архитектуры, но учитываются на уровне отдельного пользователя.

С точки зрения аппаратного обеспечения VSS не влияет на доступность. Используется одно и то же оборудование, поэтому используются те же номера MTBF / MTTR, а уравнения конечной доступности одинаковы.

Для более целостного подхода это действительно сложный вопрос, который будет зависеть в значительной степени от ваших индивидуальных потребностей и потребностей. С одной стороны, вы можете считать его менее надежным, поскольку это сложный элемент технологии, и одна «виртуальная точка отказа» (т. Е. Плоскость управления VSS) будет воздействовать на обе части избыточной передачи. С другой стороны, это можно увидеть для повышения доступности, поскольку одно виртуальное устройство значительно упрощает работу сети, снижая вероятность того, что другие вещи будут работать неправильно (меньше устройств для управления, нет HSRP / VRRP, не зацикленный домен STP, более простая топология L3 и т. д.).

Рынок в значительной степени показал, что большинство сетевых инженеров рассматривают VSS и подобные технологии как улучшение по сравнению с традиционной топологией дистрибутива / доступа L2, но есть и другие технологии, с которыми вы могли бы работать. Например, маршрутизируемый уровень доступа L3 может достичь большинства преимуществ VSS, но VLAN не смогут охватить несколько устройств уровня доступа, что делает решение потенциально бесполезным в некоторых сценариях (например, виртуализированные центры обработки данных).

totallystubby
источник
2

С функциональной точки зрения VSS в основном принимает два шасси и управляет ими в одной плоскости управления. Если вы хотите создать 1800 слот 6500, то это идеальная технология. Если цель заключается в большей доступности, то это гораздо сложнее оправдать. Ключевым моментом является то, что при создании пары VSS вы создали единое функциональное шасси. Любой режим отказа на плоскости управления - от программного дефекта до ошибки конфигурации - оказывает непосредственное влияние на весь комплекс.

Что бы это ни стоило, я действительно не видел много новых развертываний VSS за последние пять лет, но я видел немало, где эта функция была удалена в пользу запуска независимых пар 6K.

rnxrx
источник
1

По моему опыту, VSS удлиняет MTBF за счет снижения эксплуатационной сложности (т.е. без HSRP / VRRP, меньшего количества настроек STP, более простой маршрутизации и т. Д.), Особенно для магазинов с менее опытными инженерами. Повторное схождение после сбоев канала обычно происходит быстрее, так как остальная сеть видит пару как одно устройство с точки зрения L2 и L3. Я предполагаю, что будет меньше сбоев, связанных с ошибками программного обеспечения VSS, чем сбоев, связанных с взаимодействиями и режимами сбоев различных протоколов, которые обычно выполняются на этом уровне.

smoothbSE
источник