Power of 3!全面推动Intel主板SLI
Core i7和X58 Chipset的发布,正式打破了同一平台无法官方支持CrossFireX和SLI的多卡互联技术,不过Core i7和X58 Chipset的昂贵售价组合,让很多消费者只能望而却步。这让很多用户对同为“你喝了吗”架构的LGA 1156 i5/i7产品及P55 Chipset产生了极大期望,值得一提的是,P55 Chipset不服众望与X58 Chipset同样官方完美支持CrossFireX和SLI多卡互联技术,但上述技术仅能支持在PCI-Express Gen2 x8下,不过PCI-Express Gen2 x8对于目前主流甚至顶级旗舰产品来说是不会造成瓶颈。
● 回顾过去 梳理AMD/Intel/NVIDIA复杂关系
我们知道,AMD、Intel、NVIDIA(按字母排序,先后无名次)三大芯片级厂商在主板芯片组上,除Intel目前没有独立显卡外,其他两家都仅在自有主板芯片组上支持自主研发的多卡互联技术,这主要是交叉授权难度大,毕竟二者是直接竞争对手关系。也许正是因为Intel目前没有独立显卡业务,不会与二者产生直接的图形处理领域竞争,所以Intel在975 Chipset上第一次支持了AMD CrossFire技术,而NVIDIA与AMD之间,NVIDIA与Intel之间的错综复杂关系通过下面的图表相信能让各位读者更快的理清3者间关系。
2006年AMD、Intel和NVIDIA之间的授权关系
通过图片不难看出,当年3家就多卡授权和总线授权之间的你我纷争。不过随着AMD推出具有排他性质的3A平台后,无独立显卡的Intel和无CPU的NVIDIA均遇到了一定的尴尬处境。不过好在NVIDIA仍有Intel的总线授权,可以推出具备SLI功能的Intel主板芯片组;而Intel是得到了AMD的CrossFire授权,可以在自有主板上支持CrossFire。
● 三剑屠龙 游戏至尊
时至今日,随着AMD的3A平台经过Spider(蜘蛛)平台、Dragon平台和未来的Leo平台,这种自有产品的整合性越来越高,Intel和NVIDIA之间的联手貌似成为了必然。在Intel的Nehalem架构处理器平台发布后,Core i7和X58 Chipset成为了目前当之无愧的最高效能平台,而且值得一提的是NVIDIA在Intel这一代处理器上不会研发自主的主板芯片组,所以SLI多卡互联技术走入Intel桌面级产品成为必然。
正如前文所提及,Core i7 LGA 1366和X58 Chipset的组合隶属Intel目前顶级组合,对于普通消费者来说,非主流的价格自然不会成为主流市场的宠儿,自然要享受SLI多卡互联技术,大部分用户仍然要使用Intel的LGA 775处理器搭配NVIDIA nForce 780/790主板。不过今天Intel发布的Core i5/i7 LGA 1156和P55 Chipset组合,彻底宣布Intel自有的SLI平台走入主流化、平民化,同时Intel和NVIDIA之间在SLI平台上合作被命名为“Power of 3”平台。
目前Intel主流平台对多卡互联技术的支持情况如下表:
Power of 3!全面推动Intel主板SLI
本页的标题确实很不切实际,蓝色妖姬和烈焰红唇仅是描述本次PK的两个平台主色调而已。下面让我们详细了解一下这两套平台的搭配。
● Intel/NVIDIA联袂打造Power of 3平台
虽然Core i5/i7 LGA 1156和P55 Chipset今天才发布,但是在全国卖场和一些B2C、C2C网上商城中已经能够较为轻易的购买到相关产品,可以提前体验主流入门级的Nehalem架构处理器及P55主板的实力。
CPU方面,笔者选择了目前Nehalem架构处理器中最便宜的Core i5 750,它基于4核设计但没有超线程,目前市场零售价格为1600元左右。
本次平台使用了由技嘉提供的P55-UD3R主板,它是技嘉旗下最便宜面向主流市场的一款P55产品,目前官方报价1499元。同时我们搭配了同由技嘉设计生产的GV-N275UD-896I,这款显卡作为NVIDIA的对位对手顶级单图形核心的产品,其实力毋庸置疑。值得一提的是,目前技嘉无论主板还是显卡都采用了其主推的2倍铜概念,产品在散热、稳定性等方面十分出色。
技嘉无论主板还是显卡都惯用蓝色,此次参与对决的P55-UD3R和GV-N275UD-896I亦是如此,为了让平台效果图更“蓝”,笔者选用了Intel Core i5 750原装散热器和蓝色马甲内存。
对于Power of 3平台来说,必须拥有2根PCI-Express Gen2 x8以上规格插槽,这样就能搭建Intel和NVIDIA联合推出的Power of 3 SLI平台。虽然技嘉P55-UD3R为该品牌旗下目前最低端的P55 Chipset主板,但是我们可以看到整个主板的设计依然豪华且功能齐全、丰富。
技嘉GV-N275UD-896I
自然,为了实现Power of 3平台需要两块NVIDIA GeForce 系列产品成为必然,本次选用了NVIDIA单图形核心次顶级的GeForce GTX 275。技嘉的GV-N275UD-896I才用非公版设计,默认频率高于公版设定为660MHz/1460/2400MHz,同时其还使用2倍铜设计和标配HDMI + DVI + D-Sub的丰富接口组合。
● AMD独门绝学3A Dragon平台
众所周知,AMD在收购ATI后同时拥有CPU、主板和显卡三条核心产品线,由于同时拥有自主的核心部件技术,所以能够更好的整合产品及产品性能发挥,并于2007年推出Spider 3A平台概念。随着各部件的逐渐升级,3A平台由Spider升级为Dragon,而且确定在明年四月推出Leo 3A平台。
目前,AMD的顶级主板芯片组为AMD 790FX,而AMD的顶级单图形核心显卡为Radeon HD 4890,二者的搭配可以说是目前AMD的顶级组合。同时为了选择与Intel Core i5 750价位相当的AMD处理器,笔者选择了AMD 羿龙IIX4 955(黑盒),它是目前AMD在桌面普及型产品中最高端型号。
此次我们选择的3A平台使用了微星型号为790FX-GD70的产品,AMD 790FX不仅是AMD目前的顶级主板芯片组,微星790FX-GD70也是微星旗下最高端的AMD主板。值得一提的是产品标配4根PCI-Express Gen2 x16插槽,如果搭建2路CrossFireX时,每块显卡可以获得PCI-Express Gen x16的带宽,如果要搭建4路CrossFireX,每块显卡就只能获得PCI-Express Gen x8的带宽。
Radeon HD 4890采用了由RV770改良而来的RV790核心,虽然仍使用55nm工艺制造,但是其默认频率和超频能力要远高于RV770产品。本次选用的Radeon HD 4890为超频产品,默认频率为900MHz/3900MHz。
● 依然不变的经典 Nehalem架构解析
本文我们使用的Core i5 750,虽然在针脚上仅为1156与Core i7 LGA 1366有一定差距,但是在核心架构上二者没有区别。
Lynnfield同样是基于Nehalem架构的产品,其采用了原生四核心设计。同时还将三级缓存引入其中。其L1缓存的设计与酷睿微架构相同,而L2缓存则采用超低延迟的设计,不过容量大大降低,每个内核仅有256KB,新加入的L3缓存采用共享式设计。即将发布的LGA1156接口酷睿i7/i5处理器与目前市场中的LGA1366酷睿i7系列相同,均配备了8MB的三级缓存。
上图为Nehalem架构缓存结构图,从图中我们可以了解到其三级缓存由四颗核心完全共享,它几乎可以处理所有的一致性流量问题,同时不需要单独打扰每颗独立核心自己的L1、L2缓存。如果L3缓存没有命中,那么我们需要访问的数据也不在L1或者L2中,此时也不需要侦听所有核心。如果L3缓存命中成功,它还可以作为侦听过滤器。
Nehalem的每个核心有64KB的L1和256KB的L2在L3缓存中保留数据,因此在总共的8MB L3中,有1MB-1.25MB的数据与前两级缓存相同。
为了提高缓存利用效率,Nehalem使用了MESIF缓存一致性协议(全称为MESIF cache coherency protocol),在它的L3缓存中的每一个缓存行里,有4bit用作核心确认,以此表明是哪一个核心在它私有的缓存里具有这个行的数据备份。如果某个核心确认位设置位0,则那颗核心就不具有该行的数据备份;如果两个以上核心的确认位都有效,设置为1,那么该缓存行就被确定为未被修改的,任何一个核心的缓存行都不能够进入更改模式;当4颗核心确认位都是0时,就不需要对其它内核做侦听,而只有1个位是有效时,则只需要侦听那1颗核心。这种仲裁机制让Nehalem的L3缓存避免了每个核心数据一致性错误,带来更多带宽。
技嘉显卡 技嘉 GV-N275UD-896H 点评 报价 评测 技嘉显卡论坛
白送索泰玩家GTX260+至尊版
NVIDIA全面助力Intel平台 CUDA/PhysX
Power of 3平台概念意在Intel和NVIDIA之间互相合作大幅提升性能的组合,而且两家的独有专利技术能够在该平台上得到最大的发挥和融合。例如Power of 3中,基于Intel Core i5/i7的整套平台,能够凭借高效的Nehalem架构设计,为整体平台性能提供保障。
而Power of 3中的另一产品线显卡中,由于是基于NVIDIA的GeForce产品线,所以NVIDIA的CUDA、PhysX等一些图形核心计算技术一并融合到Power of 3平台中。而这其中当属针对普通用户量身打造的PhysX物理引擎、3D Discover/Stereo以及视频编码最为用户关注,下面让我们简单了解一下NVIDIA GeForce系列产品的这3个技术。
● 温故而知新 CUDA简介回顾
CUDA全称Compute Unified Device Architecture,它不需要像GUGPU一样基于图形API运算,这样的设计降低了开发者的要求。首先减免了软件开发者使用CUDA必须了解图形API的痛苦,其次CUDA专用API更接近C语言和Fortran语言,能够令绝大多数软件开发者在极短时间内上手。
与GeForce GTX 280一同发布的CUDA 2.0
需要说明的是CUDA并非一种简单意义的上技术或者功能,而是一种图形核心架构,也就是说目前采用统一架构的NVIDIA GeForce系列产品均采用CUDA架构设计,而基于CUDA架构设计的产品通过GPU和相应的API来实现多种多样的应用。
例如,我们常说的PhysX物理引擎、3D Discover/Stereo、并行计算等,都是必须使用在基于CUDA架构上设计的图形处理器。当然,目前使用CUDA架构设计的图形处理器仅有NVIDIA。
● 让虚拟3D世界更加真实化——PhysX
虽然Ageia的PhysX产品性能出色,但是苦于售价过高、游戏厂商接纳率低,一直没有得到大面积普及。不过NVIDIA看到Ageia的PhysX产品的优势,在2008年年初正式并购Ageia,并将PhysX物理引擎及技术引入到自己的显卡产品中。因为前文已经提到过GPU拥有强大的浮点运算能力,再配合CUDA可以实现很多非3D渲染运算,所以物理卡完全可以被显卡所吸收。
而且值得一提的是,正如前文所说物理卡将被显卡整合,今后NVIDIA-Ageia不会再单独推出独立物理卡,如果现在购买一款支持CUDA的产品等于NVIDIA免费赠送了一款物理卡。
● 让虚拟3D世界更加立体化——3D Discover/Stereo
NVIDIA出品的3D Discover/Stereo虽然不会增加显卡等硬件产品性能,但它却能在不增加硬件负担前提下增加游戏视觉效果。而且值得一提的是这款产品由NVIDIA打造,凭借多年在3D效果处理及GPU设计上的经验,令这款产品会如鱼得水。
虽然3D Discover和3D Stereo均是NVIDIA针对虚拟3D立体影像设计的相关技术,但是二者在技术实现即成本投资上天壤之别。
首先3D Stereo是NVIDIA基于最先进的“时分法”技术实现,配合这副眼镜与120Hz显示器的信号同步,当显示器输出左眼图像时,左眼镜片为透光状态,而右眼为不透光状态;而在显示器输出右眼图像时,右眼镜片透光而左眼不透光,以这样地频繁切换来使双眼分别获得有细微差别的图像,经过大脑计算从而生成一幅3D立体图像。最终通过视觉残留影像,在人的大脑中形成3D立体图像。
不过一套3D Stereo眼镜官方零售价1499元,和一台22寸120Hz显示器3000元左右的价格,只能让大多数用户望空兴叹。
为了让更多用户体验立体3D效果,同时又不会给用户带来经济负担,NVIDIA开发相对平民化的新3D眼镜产品——3D Discover。既然是平民化产品,其成本、造价就相对较低,而且使用了传统的红蓝滤光原理,这种设计方案比3D Stereo采用两眼60Hz刷新交换帧的方法廉价了好多。
● 让视频编码简单化——CUDA GPU并行计算
Badaboom、Folding@Home和Tesala等都是基于CUDA的GPU并行计算,它们利用GPU特殊的架构设计,令以前只有大型机才能完成的任务,小型化并且成本降低。
基于NVIDIA CUDA技术的Badaboom
支持NVIDIA CUDA技术的MediaCoder
由于图形渲染需要高密度、并行计算,因此GPU不会像CPU一样将更多的晶体管投入到数据缓存和流量控制,而是将绝大多数晶体管用于数据处理。图形渲染这点需求上与很多科学运算不谋而合,GPU的多流处理器在解决一个问题上实现独立并行高速处理,可以大大降低运算复杂度,并且多数据元素高运算密度可以近似忽略内存访问的延迟,这也就为GPU应用于科学计算奠定基础。
目前针对我们大众用户推出的基于CUDA架构并行计算的软件有很多,常见的都是针对视频处理的软件,例如大家常见的Badaboom、MediaCoder、TMGEnc、Loilo等,其中MediaCoder是国人设计、开发,同时这款软件还是完全免费,值得大家试用。
性能测试的硬件、软件平台状况
我们的硬件评测使用的内存模组、电源供应器、CPU散热器均由COOLIFE玩家国度俱乐部提供,COOLIFE玩家国度俱乐部是华硕(ASUS)玩家国度官方店、英特尔(Intel)至尊地带旗舰店和芝奇(G.SKILL)北京旗舰店,同时也是康舒(AcBel)和利民(Thermalright)的北京总代理。
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
● DX9理论性能测试:3DMark 06
3Dmark 06作为上一代3DMark系列巅峰之作,所有测试都需要支持SM3.0的DirectX 9硬件,并且支持HDR特性,这款软件的最终得分里CPU性能占有不小的权重,因此它更适宜分析整个系统的3D加速能力。
● DX10理论性能测试:3Dmark Vantage
3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。
● Call of Duty 5:World at War
与《使命召唤4》不同,《使命召唤5世界战争/战火世界》不但由曾开发《使命召唤3》的Treyarch负责制作,而且游戏的战场也回到了系列之前的第二次世界大战时期,游戏将围绕发生在太平洋战场的战役展开,让玩家体验美军与日军之间的战争场面。
● Left 4 Dead
Valve 公布全新射击游戏《Left 4 Dead》,游戏由《反恐精英:零点危机》(Counter-Strike:Condition Zero,简称 CSCZ)游戏工作室 Turtle Rock 制作,强调使用“强化版”的 Source 引擎,将带领玩家进入冲击性的射击快感。
● Mirrors Edge
《Mirror's Edge》TV Game版获得成功后,在2009年01月13日发布了PC版产品。值得一提的是,NVIDIA公司宣布与EA公司达成战略合作伙伴关系,有EA公司发行、DICE制作的《Mirrors Edge》自然会有更佳表现。
● Street Fighter IV
由CAPCOM负责开发的格斗游戏《街头霸王4》(Street Fighter 4)早已在电视游戏机上发售,经过漫长的等待,街霸迷们终于盼到了PC版的发布。本作不仅继承了TV Game版的所有特色,还增加更多诸如画面风格等特色。
● Batman: Arkham Asylum
《蝙蝠侠:阿卡姆疯人院》将给玩家带来一场不同寻常的,阴暗并且富有戏剧性的冒险历程,我们将抵达阿卡姆疯人院的最深处--位于哥谭市用来关押精神病犯人的精神病院.玩家将在黑暗中前行,带给敌人以恐惧,并且和小丑以及那些控制了疯人院哥谭市最臭名昭著的恶棍们一决胜负。灵活运用蝙蝠侠的各种小道具以及他的能力,玩家将化身成为不可阻挡的镇压者阻止小丑那疯狂的阴谋。
● Company of Heroes
Company of Heroes(英雄连)是一款即时战略类游戏。二战是几年来长盛不衰的3D游戏题材,Company of Heroes就是从101空降师诺曼底登陆后在欧洲战场血战题材入手的最新战略游戏,不过其自带测试并非针对即时战略的实际场景,反而更像第一人称视角游戏。
● Cryostasis
《Cryostasis》是一款变种的室内风格的射击游戏,游戏中玩家的活动场所将是黑暗神秘的室内环境,玩家需要利用自己的智慧和本能生存下去。游戏发生在一艘被冻在北极的核动力破冰船北风号上。玩家扮演一名名叫Alexander Nesterov的气象学家。Alexander被困在这艘被冰冻在北极点上的船上,而船外面只有死一般的寂静与寒冷。然而玩家并不孤单,因为穿上还有一种凶残的实验变异生物。现在,玩家不得不逃离船舱。
● Crysis
跳票多时、万众期待的DirectX 10游戏大作Crysis,把目前PC 3D娱乐的视觉体验发挥到极致的游戏,大量使用DirectX 10的硬件功能,对显卡的负载也提升至空前水平。
● S.T.A.L.K.E.R.Clearsky
作为《S.T.A.L.K.E.R.》的续作,《S.T.A.L.K.E.R.Clearsky》的基本开发工作在去年年底已经接近尾声,开发者表示,他们夜以继日地进行开发工作。《S.T.A.L.K.E.R.Clear Sky》的开发者表示,他们很高兴有机会来完成2003年以来积攒的创意,这些创意因为时间关系,没能在《S.T.A.L.K.E.R.》当中得到体现。玩家在《S.T.A.L.K.E.R.Clear Sky》当中,将能体验到切尔诺贝利的历史、地理特质和基本生活环境。
● 应用测试-系统功耗检测
我们使用Seasonic PowerAngel功率计测试整个系统的实时功率,CPU关闭了EIST等自动降频功能以减少误差,空载为系统进入操作系统待机时、满载为运行Fumark + GPU-Z软件烤机模式,取值均是相当长一段时期观察达到过的最大值。
● 应用类测试—并行计算能力
在平台计算能力方面,笔者选择了多套方案进行对比。
首先,在基于CUDA设计的视频编码软件选择有Badaboom和MediaCoder,同时应用于Power of 3平台上;其次,针对Power of 3和3A两套平台的CPU编码能力进行对比测试。
通过4套预设测试平台的成绩对比可以看出Badaboom的成绩最佳,在同一视频同一目的画质下用时仅为16秒,其次是同为应用CUDA的MediaCoder为24秒。而在仅使用CPU进行视频编码的的Power of 3平台和3A平台上,Intel Core i5 750获胜,而且值得一提的是Core i5 750主频为2.67GHz,羿龙X4 955主频为3.2GHz。
综合来看,Power of 3平台无论是使用CPU还是GPU,实际编码效能都要比同价位的3A平台快。
● 应用类测试—3D Discover测试
我们知道NVIDIA提供的3D Discover/Stereo技术,都是非常优秀的虚拟3D立体成像技术。但是开启这种功能后,是否会对平台的3D性能带来更高的负担呢?我想这也是很多用户较为关心的问题,下面我们就针对这一问题进行全面测试。
3D Discover和3D Stereo拥有相同的支持游戏库列表, 也就是说目前能够支持325个以上的主流游戏实现3D立体虚拟成像。本环节测试笔者选择了《镜之边缘》这款游戏同时打开PhysX,检验在多重负载下,图形处理器的能力。
通过实际测试,在开启3D Discover技术后,性能有了较大幅度的下降,不过平均帧数还是能够保障流畅运行的标准,而且在1920*1200 4X AA /16X AF主流普及型顶级画质下不会造成卡、顿现象。
虽然很多游戏支持3D Discover/Stereo技术,但是笔者使用Fraps截图发现只能截出正常渲染图像,即使使用Fraps录制视频亦是如此。最后使用Windows自带的截屏键,能够在《使命召唤5之世界战争》中得以成功,而这种方法在其他游戏中仍然不行。
如果你手中正好有3D Discover眼镜,可以查看上面两副图,能够看出3D虚拟立体效果。
用数据说话 同价位高端平台你选谁?
通过前文的测试,在选择基本相同价位的Power of 3和3A平台下性能其实已见分晓,而且值得一提的是Power of 3能够提供很多3A平台无法提供的功能和技术,例如高效的PhysX物理引擎,例如全面的第三方视频编码工具,再例如高画质或高性价比的虚拟3D立体全方位解决方案!
不过无论怎样,最终我们还是要用数据直接对比Power of 3的SLI模式和3A的CrossFireX谁更强,具体数据如下,其中红色数据代表该项获胜。
不难看出在上面34项平台数据对比面前,Power of 3平台以7成以上的获胜数据领先。而且在并行计算能力和3D Discover两项中,更是以独有技术的形式获胜。
当然笔者并不反对用户使用Core i5和P55去搭配A卡及A卡CrossFiresX,因为在实际测试中确实这样的搭配要比3A平台略强,但是在同等价位上Power of 3不仅能够提供更高的性能, 还能提供更多的功能,何乐而不为呢?