|
多内核微处理器走向主流
英特尔决定从明年开始将多内核处理器投入大众市场,这引发了一系列没有答案的问题。
英特尔总裁Paul Otellini宣布,该公司将驱使多内核微处理器(MPU)成为计算市场的主流。为此,英特尔将面临华尔街和公众的仔细审视。另一方面,工程师、计算机制造商和消费者正在探寻多内核计算所能带来的新的可能性,与之相伴的新一轮技术商业战已经蓄势待发。
设计人员必须决定内核和高速缓存架构,使之能获得最大的性能,同时避免裸片尺寸、功耗和良品率超出可控制的范围。市场行销人员必须拿出一些新的测试基准,以说明多内核和多线程的好处。
计算机制造商一方面看到了简化电路板布局的机遇,另一方面也意识到对其利润微薄的计算机业务造成的潜在威胁:随着产品更加大众化,利润空间将会更些此外,OEM厂商和终端用户都在关注目前最棘手的问题:软件将花费多少钱?
多内核设计能够同时运行操作系统或应用程序的多个任务。某些这样的系统最终将配备所谓的虚拟化能力,从而为不同的任务创建独立的虚拟机。例如,在一个区域上运行Windows,在另一个区域运行Linux,同时在其它区域即时播放DVD。这将为商业用户和消费者带来很酷的新特性,除非微软、甲骨文及其它软件供应商要求按每个内核或每个虚拟机收费,而不是按每台系统收费。
"到底该怎样收费?这的确是个复杂的问题,英特尔、IBM、微软、甲骨文及其它很多公司将不得不就此达成协议,"惠普公司服务器部资深技术专家Michael
Krause表示,"现在,惠普公司已经有人着手研究此问题。这是多内核产品上市的最大问题之一,而目前业界尚无对策。"
"在这个问题上,软件和硬件两大阵营正酝酿着一场激战,"《微处理器报告》的总编辑Kevin Krewell表示,"它可能将持续到明年。"
多内核处理器在嵌入式系统中并不陌生,例如思科公司最近推出的CRS-1运营商级路由器就采用了一款192内核的Tensilica
CPU。多内核处理器还在高性能后台服务器领域占有一席之地。事实上,英特尔和AMD仍在追随IBM和Sun公司为市场提供多内核服务器CPU。现在,英特尔计划将这种设计引入大众市畅 "这是计算技术的一次巨大变革,将从根本上转变我们对这种技术的看法。"Otellini在英特尔开发商论坛(IDF)的主题演讲中表示,"2005年,我们将向各个市场部分付运至少采用两种不同架构的双内核处理器。"
Otellini预测,到2006年底,英特尔40%的台式机CPU、70%的笔记本电脑CPU以及85%的服务器CPU将是多内核器件。而且,英特尔未来所有的CPU都将采用多内核设计。他还透露,英特尔投资公司正在资助那些可以加速向多线程软件转变的新兴公司。英特尔的动机很明显。20年来,该公司一直凭借提升主频来不断提高CPU的速度,但这种方法在Tejas级奔腾芯片上遭遇挫折,因为它消耗和泄漏的功率太大,而且散发出太多的热量。今年初,英特尔取消了Tejas设计。"英特尔确实被与时钟速度和漏电有关的散热问题逼上了绝路,"Dataquest高级分析师Martin
Reynolds表示。
在向多内核转变的进程中,竞争对手AMD超过了英特尔。AMD工程师在设计Hammer时就已经预见到多内核趋势,并在此器件中构建了仲裁逻辑。分析家预计,AMD的双内核Opteron和Athlon微处理器将于2005年下半年面市。大约在同时,英特尔的首款双内核奔腾CPU和Xeons处理器也将上市。所有这些CPU都将采用90纳米CMOS工艺制造。分析家指出,AMD最新的单内核处理器比英特尔的同类芯片具有更高的频率/瓦。"由此可以推测,AMD具有更大的散热空间,允许其进一步提升芯片频率,并把典型台式机处理器的功耗保持在90瓦之内,"Insight64公司市场观察家Nathan
Brookwood表示。当英特尔在2005年底推出第一款65纳米工艺的处理器时,它才有可能避开AMD的领先优势。
架构是一个更棘手的问题,而且英特尔有可能采用两种互相竞争的方法。一种架构将采用其以色列Centrino设计团队开发的笔记本电脑CPU内核,它具有相对高效的MIPS/瓦指标。但这些内核尚无法支持目前某些服务器和工作站所要求的CPU特性,如64位寻址。英特尔的第二种架构是基于现有的台式机或服务器CPU内核。该架构将实现更多的功能,但也将消耗更大的功率。根据一些报道,英特尔是如此急于转向多内核,以至于其首款双内核服务器芯片甚至连仲裁逻辑都没有。它只是简单地将两个内核放置到一个裸片上,要求使用现有的总线争抢协议来处理双倍的工作量。设计出恰当的高速缓存结构也需要时间。共享的高速缓存具有最低的延时,但也最难设计。英特尔在定于明年推出的Itanium服务器CPU芯片Montecito上集成了高达26MB的高速缓存。这么大容量的高速缓存不可能出现在不支持多处理技术的台式机和笔记本电脑CPU中,但英特尔表示,其首款双内核台式机CPU的配置将超过目前的2MB片上高速缓存。
一旦裸片上有多个CPU,Windows领域之外的工作站开发商将具有优势。因为处理器之间的本地总线协议的优化,片上高速缓存的大小和配置将高度依赖于软件。设计师有可能针对一个相对稳定的操作系统和一小批关键应用程序优化多处理芯片架构。但针对未来的操作系统和一系列具有不同I/O特征的应用程序优化架构则几乎没有意义。几乎可以肯定的是在多内核裸片上的每个CPU将有自己的高速缓存或一级(L1)缓存。但这些CPU是否将有独立的指令和数据缓存,或者采用统一的缓存?它们将有多大?某一给定的高速缓存是否将被直接映射或者与多路关联?这只是个开始。共享或多个L2高速缓存的互连方案也存在问题。Sun公司在其Niagara芯片中为每个CPU内核提供了专有的L1缓存,但L2缓存是共享的。"这是我们根据对应用程序的大量建模所做出的决定,"该公司副总裁Fred
DeSantis表示。
总线协议是另一个主要问题。在某些情况下(如一个带有固定软件负载的嵌入式系统),无需硬件,简单的仲裁协议就足以确保高速缓存的一致性,而且能提高性能。在软件负载是可变的或不可预测的情况中,总线仲裁可能需要一个动态可调整的优先级机制以及MESI或者一致性协议。奔腾级CPU内核已经很大,很耗能。而高速缓存很难在保持高性能的同时实现低功耗设计。一旦英特尔承诺在单个裸片上集成多个CPU内核,设计者将被迫放弃其它方面的一些关键参数,如本地互连带宽或高速缓存大小,从而牺牲在某些应用上的整体系统性能。市场行销人员也不得不费一番心思,因为第一代多内核产品可能运行在与前代器件相同或比它们更低的时钟速率上。此外,非技术买家可能期望双内核CPU提供两倍的性能,这在理论上是可能的。但英特尔台式机事业部总经理Bill Siu表示,所运行程序的数量以及它们对多线程的使用情况将导致极大的性能差异。实际的性能增长可能介于0%到70%,平均可能是25%。"很难确定具体的性能指数,"Siu说。
华尔街的投资分析家们试图弄明白,多内核芯片是否将需要比先前X86产品更大的裸片尺寸。对全球最大的芯片制造商来说,在奔腾和Xeon芯片中额外的几个平方毫米就意味着更低的利润。由于英特尔没有披露具体细节,分析家推测,首款90纳米多内核芯片可能将比典型的下一代英特尔产品大一些,但随着65纳米工艺的采用,尺寸问题将很快得到解决。
软件问题
与此同时,在多内核架构上转向虚拟机的趋势打开了新的商业模式,使许多厂商可以在从服务器到移动电话等一系列系统上访问更鲁棒、更安全的空间。"这对于所有处理器都具有深远的影响,并足以促使用户购买新的产品,"Dataquest的Reynolds表示。英特尔已经在其CPU设计中添加了虚拟化硬件资源的功能。微软将在定于2006年发布的下一代Windows操作系统Longhorn中支持此功能。
多内核CPU的软件开发商面临技术和商业问题。负责IBM多内核、多线程Power5服务器CPU设计的Balaram
Sinharoy指出,现有软件只能在集成2到4个内核,而且每个内核只有两个线程的处理器上发挥性能优势。"随着时间推移,我想操作系统的调度程序必须设计得更复杂,"《微处理器报告》的Krewell说。随着软件性能的提高,它将允许在每个裸片上集成更多可支持更多线程的内核。
对OEM厂商来说,转向多内核CPU意味着可以降低板级设计的成本、功耗和尺寸,但也引发了其它问题。"现在,每家厂商都在转向单插槽主流服务器,但我们担心这将使售价已经低至1,500美元的双处理器X86服务器市场变得更加大众化,"惠普的Krause表示,"那么,各家厂商将如何使他们的产品具有差异化功能呢?"无论带来的是问题还是机遇,多内核微处理器的时代已经来临。"这不只是一代产品的事情,"英特尔的Siu说,"多线程、多内核处理器的每瓦性能比单内核设计更强大、更高效。"
|