Использование SignalR с отработкой отказа Redis messagebus с использованием BookSleeve ConnectionUtils.Connect ()

112

Я пытаюсь создать сценарий аварийного переключения шины сообщений Redis с приложением SignalR.

Сначала мы попробовали простой аппаратный балансировщик нагрузки, который просто отслеживал два сервера Redis. Приложение SignalR указало на единственную конечную точку HLB. Затем я отказал одному серверу, но не смог успешно передать какие-либо сообщения на втором сервере Redis без перезапуска пула приложений SignalR. Предположительно это связано с тем, что ему необходимо отправить команды настройки новой шине сообщений Redis.

Начиная с SignalR RC1, Microsoft.AspNet.SignalR.Redis.RedisMessageBusиспользует Booksleeve RedisConnection()для подключения к одному Redis для pub / sub.

Я создал новый класс, RedisMessageBusCluster()который использует Booksleeve ConnectionUtils.Connect()для подключения к одному в кластере серверов Redis.

using System;
using System.Collections.Generic;
using System.Linq;
using System.Threading;
using System.Threading.Tasks;
using BookSleeve;
using Microsoft.AspNet.SignalR.Infrastructure;

namespace Microsoft.AspNet.SignalR.Redis
{
    /// <summary>
    /// WIP:  Getting scaleout for Redis working
    /// </summary>
    public class RedisMessageBusCluster : ScaleoutMessageBus
    {
        private readonly int _db;
        private readonly string[] _keys;
        private RedisConnection _connection;
        private RedisSubscriberConnection _channel;
        private Task _connectTask;

        private readonly TaskQueue _publishQueue = new TaskQueue();

        public RedisMessageBusCluster(string serverList, int db, IEnumerable<string> keys, IDependencyResolver resolver)
            : base(resolver)
        {
            _db = db;
            _keys = keys.ToArray();

            // uses a list of connections
            _connection = ConnectionUtils.Connect(serverList);

            //_connection = new RedisConnection(host: server, port: port, password: password);

            _connection.Closed += OnConnectionClosed;
            _connection.Error += OnConnectionError;


            // Start the connection - TODO:  can remove this Open as the connection is already opened, but there's the _connectTask is used later on
            _connectTask = _connection.Open().Then(() =>
            {
                // Create a subscription channel in redis
                _channel = _connection.GetOpenSubscriberChannel();

                // Subscribe to the registered connections
                _channel.Subscribe(_keys, OnMessage);

                // Dirty hack but it seems like subscribe returns before the actual
                // subscription is properly setup in some cases
                while (_channel.SubscriptionCount == 0)
                {
                    Thread.Sleep(500);
                }
            });
        }


        protected override Task Send(Message[] messages)
        {
            return _connectTask.Then(msgs =>
            {
                var taskCompletionSource = new TaskCompletionSource<object>();

                // Group messages by source (connection id)
                var messagesBySource = msgs.GroupBy(m => m.Source);

                SendImpl(messagesBySource.GetEnumerator(), taskCompletionSource);

                return taskCompletionSource.Task;
            },
            messages);
        }

        private void SendImpl(IEnumerator<IGrouping<string, Message>> enumerator, TaskCompletionSource<object> taskCompletionSource)
        {
            if (!enumerator.MoveNext())
            {
                taskCompletionSource.TrySetResult(null);
            }
            else
            {
                IGrouping<string, Message> group = enumerator.Current;

                // Get the channel index we're going to use for this message
                int index = Math.Abs(group.Key.GetHashCode()) % _keys.Length;

                string key = _keys[index];

                // Increment the channel number
                _connection.Strings.Increment(_db, key)
                                   .Then((id, k) =>
                                   {
                                       var message = new RedisMessage(id, group.ToArray());

                                       return _connection.Publish(k, message.GetBytes());
                                   }, key)
                                   .Then((enumer, tcs) => SendImpl(enumer, tcs), enumerator, taskCompletionSource)
                                   .ContinueWithNotComplete(taskCompletionSource);
            }
        }

        private void OnConnectionClosed(object sender, EventArgs e)
        {
            // Should we auto reconnect?
            if (true)
            {
                ;
            }
        }

        private void OnConnectionError(object sender, BookSleeve.ErrorEventArgs e)
        {
            // How do we bubble errors?
            if (true)
            {
                ;
            }
        }

        private void OnMessage(string key, byte[] data)
        {
            // The key is the stream id (channel)
            var message = RedisMessage.Deserialize(data);

            _publishQueue.Enqueue(() => OnReceived(key, (ulong)message.Id, message.Messages));
        }

        protected override void Dispose(bool disposing)
        {
            if (disposing)
            {
                if (_channel != null)
                {
                    _channel.Unsubscribe(_keys);
                    _channel.Close(abort: true);
                }

                if (_connection != null)
                {
                    _connection.Close(abort: true);
                }                
            }

            base.Dispose(disposing);
        }
    }
}

Booksleeve имеет свой собственный механизм для определения мастера и автоматически переключается на другой сервер, и сейчас я тестирую это с помощью SignalR.Chat.

В web.config, я установил список доступных серверов:

<add key="redis.serverList" value="dbcache1.local:6379,dbcache2.local:6379"/>

Тогда в Application_Start():

        // Redis cluster server list
        string redisServerlist = ConfigurationManager.AppSettings["redis.serverList"];

        List<string> eventKeys = new List<string>();
        eventKeys.Add("SignalR.Redis.FailoverTest");
        GlobalHost.DependencyResolver.UseRedisCluster(redisServerlist, eventKeys);

Я добавил два дополнительных метода Microsoft.AspNet.SignalR.Redis.DependencyResolverExtensions:

public static IDependencyResolver UseRedisCluster(this IDependencyResolver resolver, string serverList, IEnumerable<string> eventKeys)
{
    return UseRedisCluster(resolver, serverList, db: 0, eventKeys: eventKeys);
}

public static IDependencyResolver UseRedisCluster(this IDependencyResolver resolver, string serverList, int db, IEnumerable<string> eventKeys)
{
    var bus = new Lazy<RedisMessageBusCluster>(() => new RedisMessageBusCluster(serverList, db, eventKeys, resolver));
    resolver.Register(typeof(IMessageBus), () => bus.Value);

    return resolver;
}

Теперь проблема в том, что, когда у меня включено несколько точек останова, до тех пор, пока не будет добавлено имя пользователя, а затем отключены все точки останова, приложение работает должным образом. Однако, с отключенными с самого начала точками останова, похоже, есть какое-то состояние гонки, которое может не работать во время процесса подключения.

Таким образом, в RedisMessageCluster():

    // Start the connection
    _connectTask = _connection.Open().Then(() =>
    {
        // Create a subscription channel in redis
        _channel = _connection.GetOpenSubscriberChannel();

        // Subscribe to the registered connections
        _channel.Subscribe(_keys, OnMessage);

        // Dirty hack but it seems like subscribe returns before the actual
        // subscription is properly setup in some cases
        while (_channel.SubscriptionCount == 0)
        {
            Thread.Sleep(500);
        }
    });

Я попытался добавить как a Task.Wait, так и даже дополнительный Sleep()(не показан выше), которые ждали / etc, но все еще получали ошибки.

Повторяющаяся ошибка, похоже, находится в Booksleeve.MessageQueue.cs~ ln 71:

A first chance exception of type 'System.InvalidOperationException' occurred in BookSleeve.dll
iisexpress.exe Error: 0 : SignalR exception thrown by Task: System.AggregateException: One or more errors occurred. ---> System.InvalidOperationException: The queue is closed
   at BookSleeve.MessageQueue.Enqueue(RedisMessage item, Boolean highPri) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\MessageQueue.cs:line 71
   at BookSleeve.RedisConnectionBase.EnqueueMessage(RedisMessage message, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\RedisConnectionBase.cs:line 910
   at BookSleeve.RedisConnectionBase.ExecuteInt64(RedisMessage message, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\RedisConnectionBase.cs:line 826
   at BookSleeve.RedisConnection.IncrementImpl(Int32 db, String key, Int64 value, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\IStringCommands.cs:line 277
   at BookSleeve.RedisConnection.BookSleeve.IStringCommands.Increment(Int32 db, String key, Int64 value, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\IStringCommands.cs:line 270
   at Microsoft.AspNet.SignalR.Redis.RedisMessageBusCluster.SendImpl(IEnumerator`1 enumerator, TaskCompletionSource`1 taskCompletionSource) in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Redis\RedisMessageBusCluster.cs:line 90
   at Microsoft.AspNet.SignalR.Redis.RedisMessageBusCluster.<Send>b__2(Message[] msgs) in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Redis\RedisMessageBusCluster.cs:line 67
   at Microsoft.AspNet.SignalR.TaskAsyncHelper.GenericDelegates`4.<>c__DisplayClass57.<ThenWithArgs>b__56() in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Core\TaskAsyncHelper.cs:line 893
   at Microsoft.AspNet.SignalR.TaskAsyncHelper.TaskRunners`2.<>c__DisplayClass42.<RunTask>b__41(Task t) in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Core\TaskAsyncHelper.cs:line 821
   --- End of inner exception stack trace ---
---> (Inner Exception #0) System.InvalidOperationException: The queue is closed
   at BookSleeve.MessageQueue.Enqueue(RedisMessage item, Boolean highPri) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\MessageQueue.cs:line 71
   at BookSleeve.RedisConnectionBase.EnqueueMessage(RedisMessage message, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\RedisConnectionBase.cs:line 910
   at BookSleeve.RedisConnectionBase.ExecuteInt64(RedisMessage message, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\RedisConnectionBase.cs:line 826
   at BookSleeve.RedisConnection.IncrementImpl(Int32 db, String key, Int64 value, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\IStringCommands.cs:line 277
   at BookSleeve.RedisConnection.BookSleeve.IStringCommands.Increment(Int32 db, String key, Int64 value, Boolean queueJump) in c:\Projects\Frameworks\BookSleeve-1.2.0.5\BookSleeve\IStringCommands.cs:line 270
   at Microsoft.AspNet.SignalR.Redis.RedisMessageBusCluster.SendImpl(IEnumerator`1 enumerator, TaskCompletionSource`1 taskCompletionSource) in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Redis\RedisMessageBusCluster.cs:line 90
   at Microsoft.AspNet.SignalR.Redis.RedisMessageBusCluster.<Send>b__2(Message[] msgs) in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Redis\RedisMessageBusCluster.cs:line 67
   at Microsoft.AspNet.SignalR.TaskAsyncHelper.GenericDelegates`4.<>c__DisplayClass57.<ThenWithArgs>b__56() in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Core\TaskAsyncHelper.cs:line 893
   at Microsoft.AspNet.SignalR.TaskAsyncHelper.TaskRunners`2.<>c__DisplayClass42.<RunTask>b__41(Task t) in c:\Projects\Frameworks\SignalR\SignalR.1.0RC1\SignalR\src\Microsoft.AspNet.SignalR.Core\TaskAsyncHelper.cs:line 821<---



public void Enqueue(RedisMessage item, bool highPri)
{
    lock (stdPriority)
    {
        if (closed)
        {
            throw new InvalidOperationException("The queue is closed");
        }

При возникновении исключения закрытой очереди.

Я предвижу еще одну проблему: поскольку соединение Redis осуществляется внутри, Application_Start()могут возникнуть проблемы с «переподключением» к другому серверу. Однако я думаю, что это справедливо при использовании единственного числа RedisConnection(), когда есть только одно соединение на выбор. Тем не менее, с введением ConnectionUtils.Connect()я хотел бы услышать от @dfowlerдругих ребят из SignalR о том, как этот сценарий обрабатывается в SignalR.

ElHaix
источник
Я посмотрю, но: первое, что происходит, это то, что вам не нужно звонить, Openтак как соединение, которое у вас есть, уже должно быть открыто. Я не смогу посмотреть сразу, так как готовлюсь к вылету
Марк Грейвелл
Я считаю, что здесь есть две проблемы. 1) как Booksleeve справляется с аварийным переключением; 2) Как SignalR использует курсоры для отслеживания клиентов. Когда инициализируется новая шина сообщений, все курсоры из mb1 не выходят на mb2. Поэтому при сбросе пула приложений SignalR он начнет работать - не раньше, что, очевидно, не является жизнеспособным вариантом.
ElHaix
2
Ссылка, описывающая, как SignalR использует курсоры: stackoverflow.com/questions/13054592/…
ElHaix
Попробуйте использовать последнюю версию шины сообщений Redis. Он поддерживает передачу в фабрику соединений и обрабатывает повторные попытки подключения, когда сервер выходит из строя.
davidfowl
У вас есть ссылка на примечания к выпуску? Спасибо.
ElHaix

Ответы:

13

Команда SignalR теперь реализовала поддержку настраиваемой фабрики соединений с помощью StackExchange.Redis , преемника BookSleeve, который поддерживает избыточные соединения Redis через ConnectionMultiplexer.

Первоначальная возникшая проблема заключалась в том, что, несмотря на создание моих собственных методов расширения в BookSleeve, чтобы принимать набор серверов, переключение при отказе было невозможно.

Теперь, когда BookSleeve превратился в StackExchange.Redis, теперь мы можем настроить сбор серверов / портов прямо при Connectинициализации.

Новая реализация намного проще, чем путь, по которому я шел, создавая UseRedisClusterметод, а внутренняя обработка теперь поддерживает настоящую отработку отказа:

var conn = ConnectionMultiplexer.Connect("redisServer1:6380,redisServer2:6380,redisServer3:6380,allowAdmin=true");

StackExchange.Redis также позволяет выполнять дополнительную ручную настройку, как описано в Automatic and Manual Configurationразделе документации:

ConfigurationOptions config = new ConfigurationOptions
{
    EndPoints =
    {
        { "redis0", 6379 },
        { "redis1", 6380 }
    },
    CommandMap = CommandMap.Create(new HashSet<string>
    { // EXCLUDE a few commands
        "INFO", "CONFIG", "CLUSTER",
        "PING", "ECHO", "CLIENT"
    }, available: false),
    KeepAlive = 180,
    DefaultVersion = new Version(2, 8, 8),
    Password = "changeme"
};

По сути, возможность инициализировать нашу горизонтально масштабируемую среду SignalR с набором серверов теперь решает начальную проблему.

ElHaix
источник
Должен ли я наградить ваш ответ наградой в 500 человек? ;)
nicael
Что ж, если вы верите, что это теперь ответ :)
ElHaix
@ElHaix, раз уж вы задали вопрос, вы, вероятно, наиболее квалифицированы, чтобы сказать, является ли ваш ответ окончательным или это просто часть головоломки - я предлагаю добавить предложение, чтобы указать, решило ли оно вашу проблему и, возможно, как оно
Ларс Хеппнер
Так? Награда за награду? Или я могу подождать, пока это привлечет больше внимания.
nicael
Мне что-то не хватает или это только в ветке функций, а не в основном (2.1) пакете nuget? Кроме того, похоже, что в ветке bug-stackexchange ( github.com/SignalR/SignalR/tree/bug-stackexchange/src/… ) в классе RedisScaleoutConfiguration еще нет способа предоставить собственный мультиплексор.
Steve