英特尔? 软件网络博客 - 中文 ? 多核编程中的条件同步模式

来源:百度文库 编辑:神马文学网 时间:2024/04/29 09:33:33

 

在多线程编程中,当对共享资源进行操作时,需要使用同步(通常是锁或原子操作)来进行保护,以避免数据竞争问题。不幸的是,同步操作的开销非常大,比如对一个整数变量进行加法操作,那么同步操作的开销是加法操作的上百倍以上。

有没有办法可以减少这种同步操作的开销呢?如果能设计出更快的锁或更快的原子操作来,那么这种开销自然就减少了。以目前的技术来看,最快速的原子操作耗时也是普通加法操作的上百倍,所以从这方面着手是非常困难的。

那么能不能从软件算法的角度来减少同步操作的开销呢?答案是当然可以,基本思想是减少使用同步的次数,比如原来要使用同步1000次,现在改为在满足一定条件下才使用同步,只需要10次,那么同步的开销平摊下来就被减少了100倍,效率大大提高了。下面先来看一个共享队列例子。

一个普通的共享队列通常都是使用锁来实现,当然也有用CAS原子操作来实现的,这里只讨论用锁来实现的共享队列。

在有锁保护的共享队列中,在队列的进队和出队操作时,通常都是使用锁来进行保护的,一个典型的使用锁保护的出队操作伪代码如下:

       template class

       Locked_DeQueue(T &data)

       {

              Lock();

              DeQueue(data);  //调用串行的出队操作

              Unlock();

       }

 

在使用上面的Locked_DeQueue()函数时,每调用一次,就会发生一次锁操作。事实上,并不是每次都需要加锁操作的,比如队列为空时,这时实际上是不需要进行出队操作的,完全可以采取的一定的方法避免锁操作,但是采用上面的Locked_DeQueue()函数无法避免锁操作,这就需要对上面的函数进行改进。

一种最容易想到的方面就是先判断队列是否为空,如果不为空才使用锁保护进行出队操作。代码如下:

       template class

       Locked_DeQueue_a(T &data)

       {

              If ( !IsEmpty() )

              {

                     Lock();

                     DeQueue(data);  //调用串行的出队操作

                     Unlock();

              }

       }

 

上面的Locked_DeQueue_a()函数的一个关键之处是IsEmpty()函数必须不能使用锁操作,否则不仅没有减少同步开销,反而将同步开销增大了近一倍。

如何来使得IsEmtpy()函数不用锁操作呢,以数组实现的环行队列为例,在判断队列是否为空时,其基本方法是判断队首指针是否等于队尾指针。伪代码如下:

INT IsEmpty()

{

       Lock()

       if ( 队首指针 == 队尾指针 )

       {

              Unlock();

              return 1; //为空

       }

       else

       {    

              Unlock();

              return 0; //非空

       }

}

 

由于队首指针和队尾指针在进队或出队操作时会发生改变,因此在上面的IsEmpty()函数中,需要使用锁保护,那么如何去掉这层锁保护呢?

基本的方法是设一个标志变量EmptyFlag,在进队和出队操作中,当队列为空时,标志变量的值置为1,队列非空时,标志变量的值置为0。这样判断队列是否为空就可以通过EmptyFlag单个变量来进行,而单个变量的读写可以使用原子操作来实现,使得读操作和普通操作一样不存在同步操作。

下面是使用EmptyFlag变量实现的出队操作。

       template class

       Locked_DeQueue_b(T &data)

       {

              if ( EmptyFlag )

              {

                     return;

              }

              Lock();

              if ( !EmptyFlag )  //Lock()前, 其他线程可能修改了标志

              {

                     DeQueue(data);  //调用串行的出队操作

                  if ( 队首指针 == 队尾指针 )

                  {

                      //出队后,队列变空,使用原子操作将EmptyFlag置为1

                      AtomicIncrement(&EmptyFlag);

                  }

              }

              Unlock();

       }

 

队列的是否为空函数可以使用下面的完全不需要同步的实现。

       INT IsEmpty()

       {

              return EmptyFlag;

       }

 

从Locked_DeQueue_b()函数的实现可以看出,如果队列本来为空的情况下,它只判断一个EmptyFlag就返回了,不会调用锁操作,减少了同步使用的次数,并且在IsEmpty()函数中,根本不需要使用同步,这对于那些需要频繁判断队列是否为空的使用场景,有很好的效果。

比如对于动态任务调度,假设使用普通的有锁的共享队列。当一个线程私有队列为空时,需要去偷取其他线程的共享队列中的任务,如果偷取的队列为空则发生了一次锁操作,此时需要再偷另外一个队列的任务,如果这个队列仍然为空则又要一次锁操作,一次获取任务的操作中将可能出现多次加锁解锁的情况。通过上面讲的条件同步方法就可以在偷取取一个任务时,只要一次锁操作就可以实现。

上面讲的条件同步模式非常适应于具有状态机性质的场合,只有在发生状态切换(例如队列中空或非空的状态的切换)时才使用同步,通过对状态变量(例如EmptyFlag)的操作来替代其他非状态变量(例如队首指针和队尾指针)的操作,减少同步的使用。


英特尔? 软件网络博客 - 中文 ? 多核编程中的条件同步模式 英特尔? 软件网络博客 - 中文 ? 多核编程锁竞争问题及其对策 英特尔? 软件网络博客 - 中文 ? 多核编程的四层境界 英特尔? 软件网络博客 - 中文 ? 多核编程锁竞争问题及其对策 英特尔? 软件网络博客 - 中文 ? 利用多核多线程进行程序优化 英特尔? 软件网络博客 - 中文 ? 多核分布式队列的实现:“偷”与“自私”的运用(3) 英特尔? 软件网络博客 - 中文 ? 多核分布式队列的实现:“偷”与“自私”的运用(4) Meego:为什么是QT? – 英特尔? 软件网络博客 - 中文 英特尔? 软件网络博客 - 中文 ? 程序员的十层楼(4~5层) 英特尔? 软件网络博客 - 中文 ? 程序员的十层楼(6~7层) C 语言的谜题 – 英特尔? 软件网络博客 - 中文 TBB: concurrent_queue 高性能的奥秘 – 英特尔? 软件网络博客 - 中文 英特尔多核平台编程优化大赛报告 - flyingdog的专栏 - CSDNBlog 英特尔多核平台编程优化大赛报告 - flyingdog的专栏 - CSDNBlog 英特尔将与中国37所高校共同推进多核技术 网络编程 行计算简介和多核CPU编程Demo 行计算简介和多核CPU编程Demo--Mountain Notebook 赖勇浩:应对多核编程革命 - zdnet软件技术专区 从Java看多核并发编程的2.0趋势 行计算简介和多核CPU编程Demo--Mountain Notebook 多线程在Visual C#网络编程中的应用 处理Linux网络编程中的IP地址 — 通信产业 多线程在Visual C#网络编程中的应用