4

我正在使用 C# 通过 TCP 连接读取连续的数据流(ITCH 数据,即外汇价格),但在运行应用程序较长时间后,有时应用程序会丢弃数据包并且信息会丢失。

下面是我用来读取数据的代码片段:

private void ReaderThreadStarter()
    {
        StreamReader streamReader = new StreamReader(this._networkStream);
        while (!_stopping)
        {
            try
            {
                if (this._networkStream.DataAvailable)
                {
                    while ((line = streamReader.ReadLine()) != null)
                    {
                        lock (_queue.ConcurrentQueue)
                        {
                            byte[] data = System.Text.Encoding.ASCII.GetBytes(line);
                            Log.Info("Data Added in Queue: " + Encoding.ASCII.GetString(data, 0, data.Length));
                            _queue.WriteToQueue(data);
                        }
                    }
                }
            }
            catch (Exception exception)
            {
                Log.Error(exception);
            }
            finally
            {
                SetStopped();
            }
        }
    }

上面这段代码所做的是,它从 TCP 连接中读取数据并将其写入并发队列,然后另一个线程使用队列中的数据进行处理。所以基本上是一个简单的生产者-消费者问题。

生产者-消费者部分似乎工作正常,因为我在队列中写入的内容被消费者使用。

一种选择是使用嗅探器并确认应用程序正在丢弃数据包,但我在无法使用嗅探器的环境中工作。我相信有丢包的原因是因为对于我的一些外汇订单我从来没有被取消并且我的价格下跌并且数据提供商告诉我定价在那里是正确的。

我还在记录保存在队列中之前从 TCP 端口读取的数据,因此从日志中我假设数据在从连接中读取时丢失了。

有人可以告诉我我在这里可能做错了什么或丢弃数据包的原因是什么。

以下是我的消费者代码的代码片段:

public void ReadQueue()
    {
        try
        {
            while (true)
            {
                {
                    byte[] data = _queue.ReadFromQueue();

                    Parse(data);
                }
            }
        }
        catch (Exception exception)
        {
            Log.Error(exception);
        }
    }

public byte[] ReadFromQueue()
    {
        try
        {
            byte[] data;
            lock (this) // Enter synchronization block
            {
                ConcurrentQueue.TryDequeue(out data);
            } 
            return data;
        }
        catch (Exception exception)
        {
            Log.Error(exception);
            return null;
        }
    }
4

1 回答 1

7

有两件事引起了我的注意;首先是您使用DataAvailable. 使用它实际上从来都不是正确的做法。这主要用于在同步和异步方法之间进行选择。例如,它不会告诉您是否有更多数据入站,并且可能会给出“误报”(因为您正在使用它并不意味着的东西)导致您的循环过早退出。DataAvailable仅告诉您数据当前是否在本地缓冲区中可用,这就是它告诉您的全部内容

我感兴趣的第二件事data是二进制还是文本。您正在使用的事实StreamReader表明文本,但是......为什么要将它重新编码回byte[]?如果它任意二进制文件,那么您不能将其作为文本处理——这将不起作用。当您通过StreamReader您获取它时,您已经损坏了内容。如果它是基于文本的协议,请不要重新编码:使用字符串队列(或类似的)。

在不相关的说明中......如果队列是真正的并发,您可能不需要同步访问。

于 2012-05-28T11:56:27.320 回答