IOCP的理解

已查看 155 次
跳至第一个未读帖子

liam

未读,
2009年7月18日 10:14:582009/7/18
收件人 高性能网络编程邮件列表
这一段在做网关的设计,有一个相信初学者容易疑惑的地方就是多工作线程下是否存在数据包乱序问题.查阅了一下文档资料.有这么一句话:
The CreateIoCompletionPort function associates an I/O completion port
with one or more file handles. When an asynchronous I/O operation
started on a file handle associated with a completion port is
completed, an I/O completion packet is queued to the port.
CreateIoCompletionPort函数会使一个I/O完成端口与一个或多个文件句柄发生关联。当与一个完成端口相关的文件句柄上启动的异步
I/O操作完成时,一个I/O完成包就会进入到该完成端口的队列中。
比如说接收数据,当我们未曾调用WSARecv()这样的接收数据之前,不会发生完成操作.这样就保证了我们数据在接收完成前的序列化,这样我们可以为
每一个连接定义相应的收发缓冲区保证序列的严格执行,在进行接收操作前对该缓冲区进行一些,比如说移动缓冲区指针,统计流量等操作.最后一步才进行
read操作.

对于IOCP我们会定义足够多的工作线程去处理IO完成事件,这就会涉及执行逻辑与工作线程之间的资源竞争.逻辑线程要对数据包进行逻辑处理.如何更好
的如何减少锁竞争次数,我参考了一下网上的一些方法.下面这些引自网络:

"对于如何减少锁竞争次数的优化方案,Ghost Cheng提出了一种。提供一个队列容器,里面有多个队列,每个队列都可固定存放一定数量的消息。网
络IO线程要给逻辑线程投递消息时,会从队列容器中取一个空队列来使用,直到将该队列填满后再放回容器中换另一个空队列。而逻辑线程取消息时是从队列容
器中取一个有消息的队列来读取,处理完后清空队列再放回到容器中。
  这样便使得只有在对队列容器进行操作时才需要加锁,而IO线程和逻辑线程在操作自己当前使用的队列时都不需要加锁,所以锁竞争的机会大大减少了。
  这里为每个队列设了个最大消息数,看来好像是打算只有当IO线程写满队列时才会将其放回到容器中换另一个队列。那这样有时也会出现IO线程未写满一
个队列,而逻辑线程又没有数据可处理的情况,特别是当数据量很少时可能会很容易出现。Ghost Cheng在他的描述中没有讲到如何解决这种问题,但
我们可以先来看看另一个方案。
  这个方案与上一个方案基本类似,只是不再提供队列容器,因为在这个方案中只使用了两个队列,arthur在他的一封邮件中描述了这个方案的实现及部
分代码。两个队列,一个给逻辑线程读,一个给IO线程用来写,当逻辑线程读完队列后会将自己的队列与IO线程的队列相调换。所以,这种方案下加锁的次数
会比较多一些,IO线程每次写队列时都要加锁,逻辑线程在调换队列时也需要加锁,但逻辑线程在读队列时是不需要加锁的。"

思考了一下,对于IOCP我们应该尽量避免的是阻塞发生在工作线程,当我们所有工作线程对同一资源操作的时候会带来更多工作线程的等待.我提出下面一种
方案,是基于1个原则,就是CPU的处理速度远远大于网络IO速度.这样我倾向于为每一个客户端的连接建立一个自己的队列,暂时定义为.128个数据包
上限.工作线程处理的时候仅仅会锁住该连接的接收队列(发送下面会讲到),逻辑处理线程会对每个连接的接收队列轮循.每个连接队列每次最大处理12个数
据包.
当缓冲区将要溢出或队列满的时候我会认为该客户端连接非法

对于发送数据,会在IOCP上屏蔽发送完成包.使其不响应发送完成事件.

不知各位大侠有没有认同的. :)

Kouga

未读,
2009年7月18日 14:30:292009/7/18
收件人 dev4s...@googlegroups.com
嘛~那种队列和咱马蜂窝似的水桶异曲同工啊~喵~

既然用了IOCP,就不要阻塞!那样效率会高很多的~



2009/7/18 liam <liam...@hotmail.com>



--
签名是什么东西??

张晓衡

未读,
2009年7月18日 21:09:182009/7/18
收件人 dev4s...@googlegroups.com
不阻塞当然是最理想的, 我见到过一种设计是: 一个IOCP端口,一个工作者线程方式,就不用加锁,但这只是工作线程之间。
但接收数据时,把IOCP的工作线程与应用层线程分开(比如查数据库等等),
IOCP工作线程相当于生产者,向队列里放接收到的数据包。 有一个专门的检查线程,向队列里取数据。
这里的队例是多个线程在共享访问必须加锁。

Kouga

未读,
2009年7月19日 04:42:362009/7/19
收件人 dev4s...@googlegroups.com
恩,被访问的队列必须要上锁,但是可以使用几个队列循环使用,接收线程和工作线程轮流去锁队列即可。

简单的就比如swap下的双队列,由工作线程进行安全的翻转即可。

2009/7/19 张晓衡 <zxh1...@gmail.com>



--
签名是什么东西??

张晓衡

未读,
2009年7月19日 09:36:502009/7/19
收件人 dev4s...@googlegroups.com
我有一个问题,就是从队列从取消息时,我只使用了一个线程。 有没有必要使用多个线程呢? 有时候上层业务很复杂,怕一个线程忙不过来。
如果是多个线程,怎么处理消息顺序问题呢?因为有些线程会执行的快些,有些会慢些,并不是先从队列中取出消息的线程先完成任务。
我当时为了完成任务没有去细想,不知道大家有什么好方法,使用多个线程来取数据,又要保证处理消息顺序不乱。

z_kris

未读,
2009年7月19日 20:09:162009/7/19
收件人 高性能网络编程邮件列表
第二种方法实际上就是双缓冲,操作系统底层也有使用,实际上如果实现得不错的话,是一种比较好比较成熟的方案了。
缓冲区的大小要根据数据量的大小进行调整的,如果缓冲区很小,就能更及时的处理数据,但吞吐量以及出现资源竞争的几率大多了。另外,双缓冲的实现也有不
同策略的,一是读操作优先,就是生产者只要发现空闲缓冲,马上swap,二是你说的,写线程只有在当前的缓冲区写满了,才进行swap操作。两种策略的
优劣需要自己仔细权衡。

Nicolas Tian

未读,
2009年7月20日 04:39:132009/7/20
收件人 高性能网络编程邮件列表
对于双队列调换(双缓冲)方案,可不可以这样理解:如果认为网络IO的速度大于逻辑处理的速度,在调换时机上应该读操作优先,即当逻辑线程读完自己的队
列后就会将自己的队列与IO线程的队列相调换;如果认为逻辑处理的速度大于网络IO的速度,在调换机制上应该是写操作优先,即当IO线程将自己的队列写
满了后才会将自己的队列与逻辑线程的队列相调换。简单来说,就是“谁慢谁是大爷”。

另外,楼主想讨论的其实是自己的方案的可行性吧:
“对于IOCP我们应该尽量避免的是阻塞发生在工作线程,当我们所有工作线程对同一资源操作的时候会带来更多工作线程的等待。我提出下面一种方案,是基
于一个原则,就是CPU的处理速度远远大于网络IO速度。这样我倾向于为每一个客户端的连接建立一个自己的队列(暂时定义为128个数据包上限)工作线
程处理的时候仅仅会锁住该连接的接收队列(发送下面会讲到),逻辑处理线程会对每个连接的接收队列轮循。每个连接队列每次最大处理12个数据包。当缓冲
区将要溢出或队列满的时候我会认为该客户端连接非法。对于发送数据,会在IOCP上屏蔽发送完成包,使其不响应发送完成事件。”

没有经验,不敢乱放,顶出来等高手解答。

关中刀客

未读,
2009年7月20日 06:20:472009/7/20
收件人 高性能网络编程邮件列表
上层逻辑按照帧率来处理,每一帧的时候将双层缓冲队列调换一下,取一个队列来处理即可。一般不会出现逻辑慢过io吧,可以给缓冲队列设置最大上限,超过
上限的数量之后,将包丢弃不插入队列。

> > > 不知各位大侠有没有认同的. :)- 隐藏被引用文字 -
>
> - 显示引用的文字 -

liam

未读,
2009年7月20日 09:13:162009/7/20
收件人 高性能网络编程邮件列表
呵呵,自己想的方案.其实对于上面每一种都能成为一个成功案例,只不过是承载人数多少问题.想找到一个最优解.我期望能支持到8K以上的并发连接量.
前面做的服务器是没有网关.在尝试.


On 7月20日, 下午4时39分, Nicolas Tian <pillgr...@vip.sina.com> wrote:

liam

未读,
2009年7月20日 09:21:112009/7/20
收件人 高性能网络编程邮件列表
对于MMorpg类型来讲,我们针对每一个客户端数据池单线程执行.对于所有连接来讲由多个线程处理.这里不用考虑真正意义上的数据包顺序,因为网络也
是未定的
通常我们逻辑服务器会以场景来划分线程,不同线程执行不同场景.一个线程可以执行多个场景.因为玩家属于场景,我们会把玩家数据,包括其缓冲池丢给场景

处理.

avalon xu

未读,
2009年7月20日 22:21:002009/7/20
收件人 dev4s...@googlegroups.com
其实异步io模型就是普通的windows编程模型,用一个thread来getmessage ,然后dispatch出去,至于handler,可以用多线程,也可以一个线程,甚至多进程,这取决于逻辑需要了。

Michael

未读,
2009年8月11日 09:27:332009/8/11
收件人 高性能服务器研发与运营邮件列表
我的想法和Nicolas相反,是"谁快谁是大爷"。如果逻辑处理速度大于网络IO速度,当逻辑线程处理完自己的队列后同IO的队列调换;如果网络IO
速度大于逻辑处理速度,当IO队列满之后同逻辑线程队列调换。
回复全部
回复作者
转发
0 个新帖子