intmain() {int numAgents =10;int numTickets =150;InitThreadPackage(false); // false 表示不要打印 debug 信息for (int agent =1; agent <= numAgents; agent++) {char name[32];sprintf(name,"Agent %d Thread", agent);ThreadNew(name, SellTickets,2, agent, numTickets/numAgents); // 此时 thread 尚未执行 }RunAllThreads(); // start heart beatreturn0;}voidSellTickets (int agentID,int numTicketsToSell) {while (numTicketsToSell >0) {printf("Agent %d sells a ticket \n", agentID);// this is not a atomic operation// c instructions are not atomic numTicketsToSell--;// simulate the real worldif (RandomChange(0.1)) ThreadSleep(1000); }printf("agent %d: All done \n", agentID);}// Agent 1 sells a ticket.// ...// ...// Agent 2 sells a ticket// Agent 3 sells a ticket// ...// ...// Agent 7 All done.// Agent 8 sells a ticket// Agent 8 All done.// ...// ...// Agent 4 All done
上文的 main 中,我们通过 InitThreadPackage、ThreadNew 和 RunAllThreads 来模拟 10 个中介同时卖票的过程。在单核 CPU 的环境下,这种同时卖票的过程是通过在不同的中介之间快速切换来实现的:当 RunAllThreads 运行时,Thread Manager 将 CPU 的计算资源分成时间段,然后将每个时间段分配给不同的 Thread,由于只有一个核,一组寄存器,因此这些 Threads,即 10 个中介,只能轮流进入核中来推进售票流程,这就是所谓的并发;在多核 CPU 环境下,这时候可能有多个 Thread 同时在运行,即同时可能有多个中介进入不同的核中来推进售票流程,这就是所谓的并行。并发与并行过程对应用开发者不可见。无论是并发还是并行,在一些实际场景中都能起到提升效率的效果,举例如下:
web page loading
浏览器载入网页的过程是并行、并发大显身手的地方。假设没有它们,浏览器只能使用一个线程去连接服务器,获取网页 html、css以及图片等其它的静态文件,这些文件可能各自来自不同的服务器,而与这些服务器分别建立连接的过程本身所需网络等待时间可能超过实际建立连接之后下载数据所需的时间,因此这个过程比较低效。但如果浏览器能使用多个线程去连接服务器,那么它就能够在线程 A 等待网络连接的过程中切换到线程 B ,等线程 A 的连接响应时,再从线程 B 切换回线程 A,这时候页面的整体载入时间就能够大大缩短。
回到车票销售的场景,引入并发、并行确实能够提高资源利用率,但与此同时也引入了线程之间的信息不对称的问题,如下文代码所示所示,中介不再销售固定数量的不同的车票,而是通过访问余票总数来判断是否可以继续售票。如果线程 A 执行完 while (*numTickets > 0) 的判断后,被 Thread Manager 剥夺 CPU 时间, 同时 Thraed Manager 会把寄存器中的所有信息保存到 A 中再切换到线程 B,这时 B 看到了与 A 相同的余票值,作出同样的判断。这样就出现了信息不对称的问题。
我们称 SemaphoreWait 与 SemaphoreSignal 之间的区域为 critical region,这个区域只能有一个线程进去。值得一提的是,critical region 应当放置尽可能少的代码,不影响线程间通信的代码尽量放在 critical region 之外,如上面的 printf("sell a ticket")