处置器革命二代酷睿处理器机能对照 - Free Advertising Forums | Free Advertising Board | Post Free Ads Forum | Free Advertising Forums Directory | Best Free Advertising Methods

06-14-2011, 06:01 PM

SNB GPU有本人的电源岛跟时钟域,也支撑Turbo Boost技巧,能够独破加速或降频,并共享三级缓存.显卡驱动会把持拜访三级缓存的权限,甚至可以限度G PU应用多少缓存.将图形数据放在缓存里就不必绕道去遥远而"迟缓"的内存了,这对晋升机能、下降功耗都大有裨益.
评测软件选用
核心能力运算性能测试
由于在WinRAR压缩过程中不仅对CPU的性能是个重大的考量,同时也对CPU同内存之间的数据交流有着比较准确的评估.而且WinRAR可以支持多核心处理,并且在多核心和单核心测试中差距比较显明,能够非常准确地反映出CPU实际性能.第二代智能酷睿处理器领先旧酷睿一倍有余,提升非常显著.
新的硬件加速解码引擎中,整个视频管线都通过固定功能单元进行解码,和现在正好相反.Intel据此声称, SNB在播放视频的时候功耗可降低一半. 视频编码引擎则是全新的.详细细节没有颁布,但是Intel现场拿出了一段3分钟长的1080 p 30Mbps高清视频,将其转换成640*360 iPhone格局,结果整个进程耗时仅仅14秒钟,转换速度高达400FPS左右,而这只破费了大约3平方毫米的核心面积.
核心面积的精简恰是AVX指令(SNB最主要革新之一)集得以实现并保障良好性能的症结所在.以最小的核心面积代价,Intel将所有SIMD单元都转向了256-bit.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464953.jpg?? 128 />
三级缓存的延迟也从大概36个周期减少到26-31个周期.此前预览的时候我们就已经感到到了这一点,现在终于有了确实的数字.三级缓存现在被划分成多个区块,分辨对应一个CPU核心,都在环形总线上有自己的接入点和完全缓存管线.每个核心都可以访问全体三级缓存,只是延迟不同.此前三级缓存只有一条缓存管线,所有核心的恳求都必需通过它,现在很大水平上分而治之了. 和以前不同的是,三级缓存的频率现在也和核心频率同步,因此速度更快,不外毛病是三级缓存也会跟着核心而降频,所以假如CPU降频的时候GPU又正好须要访问三级缓存,速度就慢下来了.
CineBench R10测试成绩
Super PI测试成就
科学运算测试:Fritz Chess Benchmark
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464955.jpg?? 130 />
Sandy Bridge家族仍旧沿用酷睿i3/i5/i7的品牌+子系列的命名方法,编号上采用四位数字,其中第一位均为"2",表示第二代Core i系列,编号末尾往往有一个代表不同含意的字母:K代表不锁定倍频,均为高端产品;S代表性能优化,原始频率比没有字母后缀的低许多,但是单核心加速最高频率基原形同,另外热设计功耗都是65W;T代表功耗优化, 热设计功耗只有45W或35W,但是频率也是各产品中最低的.
这样,SNB每个核心的三级缓存带宽都是96GB/s,堪比高端Westmere,而四核心系统更是能达到384GB/s,因为每个核心都在环上有一个接入点.
索尼S138EC采用了一颗酷睿i5-560M处理器,它采用32nm
系统助手的频率要低于其余部门,有自己独立的电源层.
华硕N53S采用了一颗酷睿i7-2820M处理器,它采用32nm制造工艺,更加省电,主频为2.3GHz.酷睿i7 2820QM处理器拥有原生4个核心,具备超线程技术,能够模拟8核心运行.其共享8MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存,另外还为每颗核心配备了与Core架构极为类似的32KB L1缓存.
华硕N53S处理器信息
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464972.jpg?? 147 />
不过这么做并没有说起来这么简略.NVIDIA GF100核心费了九牛二虎之力,SNB其实也差未几,同样进行了全新设计.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464968.jpg?? 143 />
下面我们通过表格来懂得一下其相关信息:
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464954.jpg?? 129 />
迷信运算才能测试:wPrime
类似于AMD的推土机、山猫,Intel SNB也使用了物理寄存器文件.Core 2、Nehalem架构中,每个微指令需要的每个操作数都有一份拷贝,这就意味着乱序执行硬件( 调度器/重排序缓存/关系队列)必需要非常大,以便容纳微指令和相关数据.Core Duo时代是80-bit,asics running trainers,参加SSE指令集后增至128-bit,现在又有了AVX指令集,按照趋势会翻番至256-bit.
联想Y460P处理器信息
此外还有DMI总线接口、显示引擎、电源节制单元(PCU).
2011年一季度首批Sandy Bridge移动平台处理器前瞻
Intel的集成显卡仿佛老是个笑话,但这次确切不一样了.SNB的CPU性能相比现在提升了10-30%,进化到第六代的GPU图形性能则会轻松翻好几番.
这不得不说是SandyBridge最显著,也最令人惊喜的处所,内存读写性能和带宽都大幅增加,由此带来的是CPU效能的直接提升,在诸多应用和测试中都有体现.
从高等层面角度看,SNB架构只是一次进化,但是如果看看Nehalem/Westmere以来晶体管变化的范围,相对是一次革命. Core 2引入了一种叫作循环流检测器(LSD)的逻辑块,检测到CPU履行软件循环的时候就会关闭分枝猜测器、预取/解码引擎,然后通过本身缓存的微指令(micro-ops)供应执行单元.这种做法通过在轮回执行的时候关闭前端节俭了功耗,并改良了性能.
WinRAR测试成绩
Sandy Bridge内核架构解析:环形总线、三级缓存和系统助手
制造工艺,主频为2.67GHz.酷睿i5-560M处理器占有原生2个核心,具备超线程技术,能够模仿4核心运行.其共享3MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464969.jpg?? 144 />
SandyBridge的环形总线
CineBench R11.5测试成绩
CPU测试软件随着CPU核心数量的增加而在一直的优化,随着CPU测试软件的发展速度还不能追上目前CP U的发展速度,特别是对CPU新的指令集没有进行优化.对于CPU来说决定CPU性能的除了主频外,核心架构才是影响其性能要害的所在.就像当时的飞跃4虽然主频高达3G甚至更高,但是因为核心架构问题,造成CP U的执行效力无比之低下.因而,在性能方面却远不迭现在的酷睿2架构.
多媒体性能测试揭秘
测试里面共分为,32m和1024m两个测试项目,根据前面设置的线程数来对CPU数学运行性能考察.wP rime能够很大程度上反映出CPU在多义务下的实际运算能力,而且再多核心CPU测试成绩的准确性远远高于Super Pi,是目前比较风行的一款圆周率多线程计算软件.
Intel此前的图形架构中,寄存器文件都是即时重新调配的.如果一个线程需要的寄存器较少,剩余寄存器j iuihui分配给其他线程.这样虽能节省核心面积,但也会限制性能,很多时候线程可能会见临没有寄存器可用的为难.在芯片组集成时期,每个线程平均64个寄存器,Westmere HD Graphics提高到均匀80个,SNB则每个线程固定为120个.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464964.jpg?? 139 />
英特尔公司中国区总裁杨叙先生展现Sandy Bridge平台芯片
R10版能榨干系统的最后一点潜能,准确体现系统性能指标.CINEBENCH R10支持Windows XP和vista的X86/X64系统,以及PowerPC和Intel架构Mac平台,最高支持16个处理器核心.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464966.jpg?? 141 />
经由环形总线、三级缓存的变化,非核心(Uncore)概念还在,但是Intel改称之为系统助手,基本就相当于曾经的北桥芯片:
第一,标准的BPU都是2-bit预测器,每个分支都使用相关可信度(强/弱)进行标志.Intel发明,这种双模预测器所预测的分支简直都是强可信度的,因此SNB里多个分支都使用一个可托度位,而不是每个分支对应一个可信度位,结果就是在分支历史表中同样的位可以对应更多分支,进而提高预测准确度.
架构进级带来性能提升
Fritz Chess Benchmark的特色也是可以根据CPU的核心数量自动检测出测测试的线程数,将CPU的最后一滴潜能都施展得酣畅淋漓.其更加着重于CPU的逻辑运行能力,测试成果还将与P3 1G的测试性能进行比拟,最后得出CPU与P3 1G处理器之间的关联.
Sandy Bridge内核架构解析:物理存放器文件
这个缓存是直接映射的,能存储大约1.5K微指令,相称于6KB指令缓存.它位于一级指令缓存内,大多数程序的命中率都能达到80%左右,而且带宽也相比一级指令缓存更高、更稳定.真正的一级指令和数据缓存并没有变,依然都是32KB,共计64KB.
联想Y460P采用了一颗酷睿i7-2630M处理器,它采用32nm制造工艺,更加省电,主频为2GHz.酷睿i7 2630QM处理器拥有原生4个核心,具备超线程技术,能够模拟8核心运行.其共享6MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存,另外还为每颗核心装备了与Core架构极为相似的32KB L1缓存.
Fritz 10针对了多核心处理器进行了优化,比较能够凸显产品的多线程能力.拥有4核心8线程的第二代智能酷睿处理器毫无疑难地当先2核心4线程的旧酷睿一大截.
从上表可知,移动级处理器编号中均会有"M"字母做标识,同时沿用"QM"与"XM"标识,分离表示四核心和至尊版处理器.
SNB答应256-bit AVX指令借用128-bit的整数SIMD数据门路,这就使用最小的核心面积实现了双倍的浮点吞吐量,每个时钟可以进行两个25 6-bit AVX操作.另外执行硬件和路径的上位128-bit是受电源栅极(Power Gate)控制的,尺度128-bit SSE操作不会因为256-bit扩大而增加功耗.
第二,分支目标同样做了翻新.之前的架构中分支目标的大小都是固定的,但是大多数目的都是相对近似的.SN B现在支持多个不同的分支目标大小,而不是一味扩大寻址能力、保留所有分支目标,因而挥霍的空间更少,CP U能够跟踪更多目标、加快预测速度.
第二代智能酷睿i参测产品简介
对多媒体性能而言,缓存大小及主频频率对性能表现都有着一定的影响.不过我们也可以看出来,核心数量的影响对处理器多媒体的表现也有着必定的决议作用.可以看出,第二代智能英特尔酷睿处理器在多媒体表现里有着很大幅度的提升,产品性能有着极大地提高.可见架构的变化对其性能有着极大的帮助.
Intel与软件工业配合亲密,信任这种视频转码技术会很快得到普遍支持.
可编程着色硬件被称为EU,包括着色器、核心、执行单元等,可以从多个线程双发射时取指令.内部ISA映射和绝大多数DX10 API指令逐一对应,架构很像CISC,结果就是有效扩展了EU的宽度,IPC也明显提升.
SNB里又增加了一个微指令缓存,用于在指令解码时常设寄存.这里没有什么严厉的算法,指令只有在解码就会放入缓存.预取硬件获得一个新指令的时候,会首先检讨它是否存在于微指令缓存中,如是则由缓存为其余的管线服务,前端随之关闭.解码硬件是x86管线里非常庞杂的部分,关闭它能够节俭大量的功耗.如果这种技术也能引入到Atom处理器架构中,无疑也能使之受益匪浅.
图形渲染测试:Cinebench
七、新一代Turbo Boost
在这个环节中,我们分别用新旧两个版本10和11.5的Cinebench进行测试.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464982.jpg?? 157 />
Nehalem架构中有三个执行端口和三个执行单元堆栈:
除了GPU图形核心,SNB中还有一个媒体处理器,专门负责视频解码、编码.
一、缓存
SandyBridge革命性的环形总线与三级缓存构造,使得处理器缓存的效率大大提升.只管目前还没有软件可以明白测试其性能,但是其带来的影响是可以通过测试软件成绩看到的.
不难发现,此次发布的第二代智能英特尔酷睿处理器的频率都设定较高,这与采用的32纳米工艺制程不无关系. 32纳米所带来的更小体积为制造商在等同芯片面积内包容更多功能提供了方便与基本,在Sandybrige 上,我们能看到处理器与显示核心以及内存控制器的共存,同时基于环形总线架构的处理器设计也为性能的提升奠定了坚实的基础.
媒体处理器
顺便提一下Intel的独立显卡工程Larrabee.它的重点是广泛使用全面可编程硬件(除了纹理硬件) ,SNB则是全面使用固定功能硬件,功能特性和硬件单元绝对应,这样的利益是性能、功耗、核心面积都大大优化,丧失则是缺少弹性.显然,Intel世界的核心仍然是CPU,不能让GPU过火强大,这和NVIDIA 的理念正好相反.
本次发布会英特尔共发布了桌面级、移动级范畴的20多款处理器、无线适配器和芯片组,包括英特尔酷睿i7、 i5和i3处理器、英特尔6芯片组系列、英特尔迅驰Wi-Fi与WiMAX适配器.全球各大电脑制作商将基于上述产品推出500多款笔记本和台式机平台的新产品.据悉,第二代智能英特尔酷睿处理器的四核产品将于1月9日正式上市,双核产品将于2月上市.
第三,提高分枝预测器精度的传统方式是使用更多的历史位,但这只对请求长指令的特定类型分支有效,SNB于是将分支依照是非不同历史进行划分,从而提高预测精度.
解紧缩性能测试
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464956.jpg?? 131 />
为了和新酷睿i平台作对照,我们精心筛选了两款笔记本:索尼S138EC和神舟精盾K580-i7.先来看一下他们的配置.
第二代智能酷睿i处理器在32M和1024M情况下已经迫近10秒和300秒的大关,这得益于其优良的最新架构外,其所支持的第二代睿频加速功能也功不可没.
这看起来有点儿像Pentium 4的追踪缓存,但最大的不同是它并不缓存追踪,而更像是一个指令缓存,存储的是微指令,而非x86指令(m acro-ops). 与此同时,Intel还完全重新了一个分支预测单元(BPU),精确度更高,并在三个方面进行了立异.
所有这些改进加起来,SNB里每个EU的指令吞吐量都比现在的HD Graphics增长了一倍.
SNB利用这一点特征,许可单元掌握单元(PCU)在短时间内将活泼核心加速到TDP以上,而后缓缓降下来 .PCU会在闲暇时跟踪散热剩余空间,在系统负载加大时予以应用.处理器空闲的时间越长,能够超出TDP的时间就越长,但最长不超过25秒钟.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464967.jpg?? 142 />
SiSoftware Sandra算数处理器测试(数值越大越好)
之前我们也已经说过了,SNB GPU图形核心也可以独立动态加速,最高可达惊人的1.35GHz.如果软件需要更多CPU资源,那么CP U就会加速、GPU同时减速,反之亦然.
Sandy Bridge平台汇总
AVX支持256-bit操作数,相当耗费晶体管与核心面积,而RPF的使用加大了乱序执行缓冲,能够很好地满意更高吞吐量的浮点引擎.
从新设计的双通道DDR3内存控制器,内存延迟也恢复了畸形程度(Westmere将内存控制器移出CPU 、放到了GPU上);
缓存带宽的测试中,第二代智能英特尔酷睿处理器所带来的提升还长短常明显,这得益于其环形总线设计,同时改进的L3缓存也为缓存带来了更大幅度的性能提升.在同上代产品的比较中可以看出,濒临50%的提升为处理器的性能飞跃奠定了基础.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464973.jpg?? 148 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464961.jpg?? 136 />
<img alt=src= 46464981.jpg?? 714 145 156 hv1 pics digi img1.gtimg.com http: />
SNB集成的GPU图形核心分为两大版本,分别拥有6个、12个EU.首批发布的移动版全部是12个EU, 桌面版则根据型号不同而有两种配置,可能是高端12个、低端6个.得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点,即便只有六个的时候性能也会相当令人满足.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464970.jpg?? />
形象数学运算由EU内的硬件负责,性能得以同步进步.Intel表现,正弦(sine)、余弦(cosin e)操作的速度比当初的HD Graphics提升了多少个数目级.
内存控制器性能大幅提升:
Super PI纯为单线程运用,重要考察CPU核心的运算能力,在这个环节中新旧两代酷睿处理器的成绩差别不是很大. 酷睿i7-2630M和i7-640M的成绩相称.
Sandy Bridge内核架构解析:缓存
Super PI是一款专用于检测CPU稳定性的软件,软件通过计算圆周率让CPU高负荷运作,以达到考验CPU计算能力与稳定性的作用.该软件的使用很简单,下载运行后,单击软件主界面"计算"菜单,软件将弹出对话框让你挑选要计算的圆周率位数,计算的位数越多,检测时间越长,对CPU的考验也越大.通常个别情况下可以选择10 4万位的运算,如果要求较高则可以选择419万位的运算.如果CPU能够在最高的3355万位的检测中通过 ,则该CPU将能够在非常刻薄的环境下稳定运行.
处理器缓存带宽测试结果
从以上的对比测试结果可以看到,英特尔第二代智能酷睿处理器在各项性能指标上都秒杀旧酷睿处理器.作为世界上第一款真正意思上融会了核芯显卡的移动处理器,它的架构和新功能上的提升才是支持他性能上奔腾的最大能源 ,下面我就来总结一下这一周的测试心得.
科学运算测试:Super PI
在发布会上,英特尔公司中国区总裁杨叙表示:"英特尔公司致力于以翻新推进产业发展,并联袂产业协作搭档为用户带来一日千里的计算体验和使用模式,更智能化的计算,更个性化的体验,是宽大消费者的需要,也是各种计算装备发展的趋势和方向.第二代智能英特尔酷睿处理器是英特尔公司钟摆模式(Tick-Tock)产品发展策略在微架构上实现的又一次改革,智能化程度更高,计算能力更出色,尤其是在视觉体验方面实现了冲破性的先进,将为用户'创立、编纂和观赏'包括高清和3D在内的多种内容带来全新的使用体验."
Lynnfield Core i7/i5首次引入了智能动态加速技术"Turbo Boost"(睿频),可以根据工作负载,主动以恰当速度开启全部核心,或者关闭局部限制核心、提高残余核心的速度,比方一颗热设计功耗(TDP)为 95W的四核心处理器,可能会三个核心完整封闭,salvatore ferragamo outlets,最后一个大幅提速,始终到达95W TDP的制约. 现有处理器都是假设一旦开启动态加速,就会达到TDP限制,但事实上并非如斯,处理器不会即时变得很热,而是有一段时光发烧量间隔TDP还差良多.
这条环形总线由四条独立的环组成,分别是数据环(DT)、要求环(QT)、响应环(RSP)、侦听环(SN P).每条环的每个站台在每个时钟周期内都能接收32字节数据,而且环的访问总会自动取舍最短的路径,以缩短延迟.随着核心数量、缓存容量的增多,缓存带宽也随时同步增加,ghd iv salon styler,因而能够很好地扩展到更多核心、更大服务器集群.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464971.jpg?? 146 />
索尼S138EC处理器信息
2011年1月6日,是一个值得留念的日子,由于英特尔公司在这一天正式发布了其第二代智能英特尔酷睿处理器家族(产品研发代号:Sandy Bridge),全新的产品和特性将为用户供给前所未有的高智能化和新视觉休会.同时,在遥远的美国拉斯维加斯,英特尔新平台在国际花费电子展(CES)长进行了寰球同步发布.
WinRAR作为一款目前非常流行的压缩软件,我们使用了它内置的测试功能.测试的结果可以有效的反映CP U的性能.
不过在稳固性方面,PCU不会容许超过任何限制.
PCI-E控制器,可提供16条PCI-E 2.0信道,支持单条PCI-E x16或者两条PCI-E x8插槽;
缓存架构的改进:
目前国内厂商中能和英特尔最新处理器的发布同步上市的只有:联想、华硕和宏碁.而今天我们拿到的就是鼎鼎大名的联想Y460P和华硕N53S.两者都采用了英特尔酷睿二代智能处理器,下面我们就来看一下他们的配置表.
处理器缓存带宽测试
wPrime测试结果(数值越小越好)
在核心能力运算性能测试方面,第二代智能酷睿表现非常抢眼,在i7平等级下是旧款酷睿的两倍有余.
测试软件抉择
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464979.jpg?? 154 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464974.jpg?? 149 />
更低的功耗和发热:
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464978.jpg?? 153 />
架构升级带来性能提升:
神舟精盾K580-i7采用了一颗酷睿i7-640M处理器,它采用32nm制造工艺,主频为2.80GHz.酷睿i7-640M处理器拥有原生2个核心,具备超线程技术,能够模拟4核心运行.其共享4MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存.
上一代酷睿i平台简介
依据上述情形我们将测试名目分为基准测试、科学运算能力测试、内存及缓存效力测试、图形渲染性能测试.所使用的软件我们也尽量做到能公平客观地反映CPU各项参数的性能.
五、整合图形核心
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464962.jpg?? 137 />
第二代智能英特尔酷睿处理器的全新特性包括英特尔高速视频同步技术、加强的英特尔睿频加速2.0技术以及英特尔(WiDi)无线显示技术等.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464960.jpg?? 135 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464977.jpg?? 152 />
英特尔发布会
六、媒体引擎
多媒体性能测试(数值越大越好)
现在CineBench已经更新到R11.5版本,因为旧版本已经可以说异常轻松而且运行时间也非常短,所以在新版本中需要加大测试量,asics 2150,这样渲染时间也长出很多,对于硬件性能的对比更有利.
wPrime测试结果(数值越小越好)
CineBench是业界公认的基准测试软件,在海内外主流媒体的多数系统性能测试中都能看到它的身影.它使用该公司针对片子电视行业开发的Cinema 4D殊效软件引擎,可以测试CPU和显卡的性能.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464958.jpg?? 133 />
SiSoftware Sandra (the System ANalyser, Diagnostic and Reporting Assistant)一套功效强盛的体系分析、诊断、测试和讲演工具,包含众多的剖析与测试模组.它的最新版本支持多中心、多线程处置器,让咱们可以更好地用它来考核PC的总体性能.与Everest比拟,San dra更为正确牢靠,它可以对全部CPU的缓存带宽进行测试.这里将测试CPU的缓存带宽.
SiSoftware Sandra (the System ANalyser, Diagnostic and Reporting Assistant)一套功能强大的系统分析、诊断、测试和呈文工具,包括众多的分析与测试模组.它的最新版本支持多核心、多线程处理器,让我们可以更好地用它来考察PC的总体性能.这里将测试CPU的根本运算能力效能.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464957.jpg?? 132 />
旧酷睿平台配置表
AMD推土机架构对AVX的支持则有所不同,使用了两个128-bit SSE路径来合并成256-bit AVX操作,即使八核心(四模块)推土机的256-bit AVX吞吐量也要比四核心SNB少一半,不过实际影响完全取决于应用程序如何利用AVX. SNB的峰值浮点性能翻了一番,这就对载入和存储单元提出了更高要求.Nehalem/Westmere架构中有三个载入和存储端口:载入、存储地址、存储数据.
Nehalem/Westmere每个核心都与三级缓存独自相连,都需要大约1000条连线,而这种做法的缺陷是如果频繁访问三级缓存,后果可能不会太好.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464965.jpg?? 140 />
二、物理寄存器文件(PRF)和执行改进
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464959.jpg?? 134 />
多媒体指令集测试我们同样的使用SiSoftware Sandra这款软件来进行评测.这里将测试CPU的多媒体指令集效能.
Westmere固然也自带了图形核心,但与CPU是双内核封装,只是通过45nm工艺、更多着色硬件、更高频率提升了性能,SNB则将CPU、GPU封装在统一内核中,全部采用32nm工艺,特殊是显著提高了I PC(指令/时钟).
wPrime是一款与Super Pi雷同的圆周率盘算软件,但与Super Pi只能支持单线程不同的是,wPrime可以支持多个线程同时计算,也就是说可以支持更多核心处理器,并且测试多核心处理器性能时比Super Pi更加精确.
每当处理器平台的更新换代,都会带来更强劲的性能和更加丰盛的功能,有的产品只是提升一个等级,而有的产品则会是带来里程碑式的变更,而在相干的报道中,英特尔则将此次序二代智能酷睿处理器的宣布归类于第二者.堪比当年经典奔跑处理器的出生.那么下面我们就来看一下这个第二代智能酷睿处理器到底有什么过人之处.
杨叙先生讲授新平台架构
作为Intel首款采取32nm工艺的四核心处理器,Core i7 2630QM/2820QM的功耗表示优于上代产品,别忘了这是在处理器性能有着大幅提升的条件下.这象征着SandyB ridge岂但性能更强劲,也更加节能、环保.
神舟精盾K580-i7处理器信息
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464975.jpg?? 150 />
Fritz Chess Benchmark是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款取得国际认可的国际象棋程序中的一个测试性能部分.它可以让我们的X86计算机也能实现IBM"深蓝"当初所做的事件, 那就是计算国际象棋的步法预测和计算,虽然现在我们的个人电脑依然无奈与10年前IBM的"深蓝"等量齐观 ,并且无论是在处理器架构方面、节点方面仍是AIX操作系统方面都有很大的差距,但是Fritz Chess Benchmark仍然是目前在个人计算机方面最好的步法计算和预测软件,同时也可以让我们平等的看到目前我们所使用的个人计算机到底达到了一个什么样子的水平.同时该软件还给出了一个基准参数,就是在P3 1.0G处理器下,其可以每秒运算48万步.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464963.jpg?? 138 />
三、环形总线与三级缓存
Sandy Bridge挪动平台命名及基础信息
处理器的核心数量极大的影响着多核成绩.在测试中,酷睿i7 2820QM处理器得分达到了4.85分的高分,可见其多核心利用率较高,能够失掉不错的成绩.而在测试酷睿i7 2630QM中我们发现,其CPU得分同样也超过了4分,达到了4.85,这样的执行效率已经堪比上代具备了超线程功能的酷睿i7处理器.
实在,我们在电脑的日常利用中都分开WinRAR这款功能壮大的软件,然而这款软件自带的硬件性能测试也是可能十分好的反映出CPU的实际性能,除此之外,WinRAR还可以反应出内存与CPU之间的带宽速度.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464952.jpg?? 127 />
Fritz Chess Benchmark
SNB架构中载入和存储地址端口是对称的,都可以执行载入或者存储地址,载入带宽因此翻倍. SNB的整数执行也有了改进,只是比较有限.ADC指令吞吐量翻番,乘法运算可加速25%.
Fritz Chess Benchmark测试成绩
酷睿二代参测产品配置表
二代酷睿处理器性能比较测试总结
值得一提的是,现在CPU核心数量发展敏捷,短短的几年间4核心处理器开端趋于遍及,售价千元左右的四核产品已经浮出水面,这样对CPU测试软件就必须要对多线程和多核心进行优化.其实,在多任务下也是消费者们最为关怀的.
在评测中无疑会涌现大量测试数据,虽然这些测试数据可以从侧面的反映出测试产品的实际性能,相信绝大部分消费者对这些数据的发生并不了解甚至概念可言.作为评测数据呈现比较频繁的处理器来说,评测数据很大程度上可以反映出这款产品在某些方面的实际性能.其实,CPU评测软件的工作原理都是不尽相同的,不同的CPU测试软件对CPU不同方面的性能评估也是不尽相同的.
四、系统助手
SNB又整合了GPU图形核心、视频转码引擎,并共享三级缓存.Intel并不沿用此前的做法,再增添20 00条连线,而是像服务器版的Nehalem-EX、Westmere-EX那样,引入了环形总线(Ring Bus),每个核心、每一块三级缓存(LLC)、集成图形核心、媒体引擎、系统助手(System Agent)都在这条线上领有自己的接入点,形象地说就是个"站台".
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464976.jpg?? 151 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464980.jpg?? 155 />
RPF在寄存器文件中存储微指令操作数,而微指令在乱序执行引擎中只会携带指向操作数的指针,而非数据自身 .这就大大降低了乱序执行硬件的功耗(转移大批数据很费电的),同时也减小了流水线的核心面积,数据流窗口也增大了三分之一.
Sandy Bridge内核架构解析:核芯显卡、媒体引擎和睿频2.0