核心能力运算性能测试
顺便提一下Intel的独立显卡工程Larrabee.它的重点是普遍使用全面可编程硬件(除了纹理硬件) ,SNB则是全面使用固定功能硬件,功能特性和硬件单元绝对应,这样的利益是性能、功耗、核心面积都大大优 化,丧失则是缺少弹性.显然,Intel世界的核心仍然是CPU,不能让GPU过火强大,这和NVIDIA 的理念正好相反.
科学运算能力测试:wPrime
为了和新酷睿i平台作对照,我们精心筛选了两款笔记本:索尼S138EC和神舟精盾K580-i7.先来看一下他们的配置.
2011年一季度首批Sandy Bridge移动平台处理器前瞻
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464967.jpg?? 142 />
Super PI测试成绩
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464952.jpg?? 127 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464978.jpg?? 153 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464968.jpg?? 143 />
形象数学运算由EU内的硬件负责,性能得以同步提高.Intel表示,正弦(sine)、余弦(cosin e)操作的速度比现在的HD Graphics提升了几个数量级.
R10版能榨干系统的最后一点潜能,正确体现系统性能指标.CINEBENCH R10支持Windows XP和vista的X86/X64系统,以及PowerPC和Intel架构Mac平台,最高支持16个处理器核心.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464965.jpg?? 140 />
wPrime测试结果(数值越小越好)
三、环形总线与三级缓存
目前国内厂商中能和英特尔最新处理器的发布同步上市的只有:联想、华硕和宏碁.而今天我们拿到的就是鼎鼎大 名的联想Y460P和华硕N53S.两者都采用了英特尔酷睿二代智能处理器,下面我们就来看一下他们的配置 表.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464980.jpg?? 155 />
Intel此前的图形架构中,寄存器文件都是即时从新分配的.如果一个线程需要的寄存器较少,剩余寄存器j iuihui调配给其余线程.这样虽能节俭核心面积,但也会限制性能,很多时候线程可能会见临没有寄存器可 用的为难.在芯片组集成时期,每个线程平均64个寄存器,Westmere HD Graphics提高到均匀80个,SNB则每个线程固定为120个.
一、缓存
可编程着色硬件被称为EU,包括着色器、核心、履行单元等,可以从多个线程双发射时取指令.内部ISA映射 和绝大多数DX10 API指令逐一对应,架构很像CISC,成果就是有效扩展了EU的宽度,IPC也明显提升.
从以上的比较测试结果可以看到,英特尔第二代智能酷睿处理器在各项性能指标上都秒杀旧酷睿处理器.作为世界 上第一款真正意思上融会了核芯显卡的移动处理器,它的架构和新功能上的提升才是支持他性能上奔腾的最大能源 ,下面我就来总结一下这一周的测试心得.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464963.jpg?? 138 />
华硕N53S处理器信息
处理器缓存带宽测试
第二代智能酷睿i处理器在32M和1024M情况下已经迫近10秒和300秒的大关,这得益于其优良的最新 架构外,其所支持的第二代睿频加速功能也功不可没.
CineBench R10测试成就
除了GPU图形核心,SNB中还有一个媒体处理器,专门负责视频解码、编码.
Sandy Bridge内核架构解析:环形总线、三级缓存和系统助手
重新设计的双通道DDR3内存控制器,内存延迟也恢复了畸形水平(Westmere将内存控制器移出CPU 、放到了GPU上);
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464957.jpg?? 132 />
索尼S138EC采用了一颗酷睿i5-560M处理器,它采用32nm
缓存带宽的测试中,第二代智能英特尔酷睿处理器所带来的提升还长短常明显,这得益于其环形总线设计,同时改 进的L3缓存也为缓存带来了更大幅度的性能提升.在同上代产品的比较中可以看出,濒临50%的提升为处理器 的性能飞跃奠定了基础.
类似于AMD的推土机、山猫,Intel SNB也使用了物理寄存器文件.Core 2、Nehalem架构中,
christian louboutin bridal shoes,每个微指令需要的每个操作数都有一份拷贝,这就意味着乱序执行硬件(调度器/重排序缓存/关系队列)必需要非常大,以便容纳微指令和相关数据.Core Duo时代是80-bit,参加SSE指令集后增至128-bit,现在又有了AVX指令集,按照趋势会翻番至256-bit.
值得一提的是,现在CPU核心数量发展敏捷,短短的多少年间4核心处理器开端趋于遍及,售价千元左右的四核 产品已经浮出水面,这样对CPU测试软件就必需要对多线程和多核心进行优化.其实,在多任务下也是花费者们 最为关怀的.
在核心能力运算性能测试方面,第二代智能酷睿表现非常抢眼,在i7平等级下是旧款酷睿的两倍有 余.
之前我们也已经说过了,SNB GPU图形核心也可以独破动态加速,最高可达惊人的1.35GHz.如果软件须要更多CPU资源,那么CP U就会加速、GPU同时减速,反之亦然.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464955.jpg?? 130 />
Super PI纯为单线程应用,主要考察CPU核心的运算能力,在这个环节中新旧两代酷睿处理器的成绩差别不是很大. 酷睿i7-2630M和i7-640M的成绩相当.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464953.jpg?? 128 />
2011年1月6日,是一个值得留念的日子,因为英特尔公司在这一天正式发布了其第二代智能英特尔酷睿处理 器家族(产品研发代号:Sandy Bridge),全新的产品和特性将为用户提供前所未有的高智能化和新视觉休会.同时,在遥远的美国拉斯维 加斯,英特尔新平台在国际消费电子展(CES)长进行了全球同步发布.
不难发现,此次发布的第二代智能英特尔酷睿处理器的频率都设定较高,这与采用的32纳米工艺制程不无关系. 32纳米所带来的更小体积为制造商在等同芯片面积内包容更多功能提供了方便与基本,在Sandybrige 上,我们能看到处理器与显示核心以及内存控制器的共存,同时基于环形总线架构的处理器设计也为性能的提升奠 定了坚实的基础.
第二,分支目标同样做了翻新.之前的架构中分支目标的大小都是固定的,但是大多数量标都是相对近似的.SN B现在支持多个不同的分支目的大小,而不是一味扩大寻址能力、保留所有分支目标,因而挥霍的空间更少,CP U能够跟踪更多目标、加快预测速度.
评测软件选用
Sandy Bridge移动平台命名及根本信息
Lynnfield Core i7/i5首次引入了智能动态加速技术"Turbo Boost"(睿频),能够根据工作负载,自动以恰当速度开启全部核心,或者关闭部分限制核心、提高剩余核 心的速度,比方一颗热设计功耗(TDP)为 95W的四核心处理器,可能会三个核心完全关闭,最后一个大幅提速,
ferragamo cufflinks,始终达到95W TDP的限制. 现有处理器都是假设一旦开启动态加速,就会达到TDP限制,但事实上并非如斯,处理器不会即时变得很热,而 是有一段时间发热量间隔TDP还差很多.
SNB答应256-bit AVX指令借用128-bit的整数SIMD数据路径,这就使用最小的核心面积实现了双倍的浮点吞吐量,每个时钟可以进行两个25 6-bit AVX操作.另外执行硬件和路径的上位128-bit是受电源栅极(Power Gate)控制的,标准128-bit SSE操作不会因为256-bit扩展而增加功耗.
图形渲染测试:Cinebench
Nehalem/Westmere每个核心都与三级缓存单独相连,都需要大约1000条连线,而这种做法的毛病是如果频繁访 问三级缓存,后果可能不会太好.
旧酷睿平台配置表
根据上述情况我们将测试项目分为基准测试、科学运算能力测试、内存及缓存效能测试、图形渲染性能测试.所使 用的软件我们也尽量做到能公平客观地反映CPU各项参数的性能.
架构升级带来性能提升:
测试里面共分为,32m和1024m两个测试名目,根据前面设置的线程数来对CPU数学运行性能考察.wP rime能够很大水平上反应出CPU在多义务下的实际运算能力,而且再多核心CPU测试成绩的精确性远远高 于Super Pi,是目前比拟风行的一款圆周率多线程计算软件.
科学运算测试:Fritz Chess Benchmark
SiSoftware Sandra (the System ANalyser, Diagnostic and Reporting Assistant)一套功能强大的系统分析、诊断、测试和呈文工具,包括众多的分析与测试模组.它的最新 版本支持多核心、多线程处理器,让我们可以更好地用它来考察PC的总体性能.与Everest相比,San dra更为准确牢靠,它可以对整个CPU的缓存带宽进行测试.这里将测试CPU的缓存带宽.
处理器缓存带宽测试结果
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464964.jpg?? 139 />
测试软件选择
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464971.jpg?? 146 />
多媒体性能测试揭秘
这样,SNB每个核心的三级缓存带宽都是96GB/s,堪比高端Westmere,而四核心系统更是能达到384GB/s,由于每个核心都在环上有一个接入点.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464961.jpg?? 136 />
Westmere虽然也自带了图形核心,但与CPU是双内核封装,只是通过45nm工艺、更多着色硬件、更 高频率提升了性能,SNB则将CPU、GPU封装在统一内核中,全部采用32nm工艺,特别是显著提高了I PC(指令/时钟).
第一,尺度的BPU都是2-bit预测器,每个分支都使用相干可信度(强/弱)进行标志.Intel发现,这种双模猜测器所预测的分支简直都是强可信度的,因此SNB里多个分支都使 用一个可托度位,而不是每个分支对应一个可信度位,结果就是在分支历史表中同样的位可以对应更多分支,进而 进步预测准确度.
处理器的核心数目极大的影响着多核成绩.在测试中,酷睿i7 2820QM处理器得分达到了4.85分的高分,可见其多核心利用率较高,能够取得不错的成绩.而在测试酷 睿i7 2630QM中我们发明,其CPU得分同样也超过了4分,达到了4.85,这样的执行效力已经堪比上代具备 了超线程功能的酷睿i7处理器.
第二代智能英特尔酷睿处理器的全新特性包括英特尔高速视频同步技术、加强的英特尔睿频加速2.0技术以及英 特尔(WiDi)无线显示技术等.
从上表可知,挪动级处理器编号中均会有"M"字母做标识,同时沿用"QM"与"XM"标识,分辨表现四核心 和至尊版处理器.
不外这么做并没有说起来这么简单.NVIDIA GF100核心费了九牛二虎之力,SNB实在也差未几,同样进行了全新设计.
缓存架构的改进:
Sandy Bridge平台汇总
六、媒体引擎
架构进级带来性能提升
SNB利用这一点特征,容许单元掌握单元(PCU)在短时间内将活泼核心加速到TDP以上,而后缓缓降下来 .PCU会在闲暇时跟踪散热残余空间,在系统负载加大时予以应用.处理器空闲的时间越长,能够超出TDP的 时间就越长,但最长不超过25秒钟.
Sandy Bridge内核架构解析:核芯显卡、媒体引擎和睿频2.0
SiSoftware Sandra (the System ANalyser, Diagnostic and Reporting Assistant)一套功效强盛的体系剖析、诊断、测试和讲演工具,包含众多的分析与测试模组.它的最新 版本支撑多中心、多线程处理器,让咱们可以更好地用它来考核PC的总体机能.这里将测试CPU的基础运算能 力效力.
上一代酷睿i平台简介
Fritz Chess Benchmark是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款获得国际认可 的国际象棋程序中的一个测试性能部分.它可以让我们的X86计算机也能实现IBM"深蓝"当初所做的事件, 那就是计算国际象棋的步法预测和计算,虽然现在我们的个人电脑仍然无奈与10年前IBM的"深蓝"等量齐观 ,并且无论是在处理器架构方面、节点方面仍是AIX操作系统方面都有很大的差距,但是Fritz Chess Benchmark依然是目前在个人计算机方面最好的步法计算和预测软件,同时也可以让我们平等的看到目前 我们所使用的个人计算机到底达到了一个什么样子的程度.同时该软件还给出了一个基准参数,就是 在P3 1.0G处理器下,其可以每秒运算48万步.
作为Intel首款采用32nm工艺的四核心处理器,Core i7 2630QM/2820QM的功耗表示优于上代产品,别忘了这是在处理器性能有着大幅提升的条件下.这象征着SandyB ridge岂但性能更强劲,也更加节能、环保.
Intel的集成显卡仿佛老是个笑话,但这次确切不一样了.SNB的CPU性能相比现在提升了10-30%,进化到第六代的GPU图形性能则会轻松翻好几番.
二、物理存放器文件(PRF)和执行改进
Super PI是一款专用于检测CPU稳定性的软件,软件通过计算圆周率让CPU高负荷运作,以到达考验CPU计算才 能与稳定性的作用.该软件的应用很简略,下载运行后,单击软件主界面"计算"菜单,软件将弹出对话框让你取 舍要盘算的圆周率位数,计算的位数越多,检测时光越长,对CPU的考验也越大.通常个别情形下能够抉择10 4万位的运算,如果请求较高则可以挑选419万位的运算.假如CPU可能在最高的3355万位的检测中通过 ,则该CPU将可以在十分刻薄的环境下稳固运行.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464959.jpg?? 134 />
本次发布会英特尔共发布了桌面级、移动级范畴的20多款处理器、无线适配器和芯片组,包括英特尔酷睿i7、 i5和i3处理器、英特尔6芯片组系列、英特尔迅驰Wi-Fi与WiMAX适配器.寰球各大电脑制作商将基于上述产品推出500多款笔记本和台式机平台的新产品.据 悉,第二代智能英特尔酷睿处理器的四核产品将于1月9日正式上市,双核产品将于2月上市.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464973.jpg?? 148 />
在评测中无疑会呈现大量测试数据,虽然这些测试数据可以从侧面的反映出测试产品的实际性能,信任绝大部门消 费者对这些数据的发生并不了解甚至概念可言.作为评测数据涌现比较频繁的处理器来说,评测数据很大程度上可 以反映出这款产品在某些方面的实际性能.其实,CPU评测软件的工作原理都是不尽相同的,不同的CPU测试 软件对CPU不同方面的性能评估也是不尽相同的.
Sandy Bridge家族仍旧沿用酷睿i3/i5/i7的品牌+子系列的命名方法,编号上采取四位数字,其中第一位均为"2",表示第二代Core i系列,编号末尾往往有一个代表不同含意的字母:K代表不锁定倍频,均为高端产品;S代表性能优化,原始频 率比没有字母后缀的低良多,但是单核心加速最高频率基原形同,另外热设计功耗都是65W;T代表功耗优化, 热设计功耗只有45W或35W,但是频率也是各产品中最低的.
WinRAR作为一款目前非常流行的紧缩软件,我们使用了它内置的测试功能.测试的结果可以有效的反映CP U的性能.
联想Y460P采用了一颗酷睿i7-2630M处理器,它采用32nm制造工艺,更加省电,主频为2GHz.酷睿i7 2630QM处理器拥有原生4个核心,具备超线程技术,能够模拟8核心运行.其共享6MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存,另外还为每颗核心装备了与Core架构极为相似 的32KB L1缓存.
CineBench是业界公认的基准测试软件,在海内外主流媒体的多数系统性能测试中都能看到它的身影.它 使用该公司针对片子电视行业开发的Cinema 4D殊效软件引擎,可以测试CPU和显卡的性能.
系统助手的频率要低于其他部分,有自己独立的电源层.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464975.jpg?? 150 />
WinRAR测试成绩
RPF在寄存器文件中存储微指令操作数,而微指令在乱序执行引擎中只会携带指向操作数的指针,而非数据自身 .这就大大降低了乱序执行硬件的功耗(转移大量数据很费电的),同时也减小了流水线的核心面积,数据流窗口 也增大了三分之一.
每当处理器平台的更新换代,都会带来更强劲的性能和更加丰盛的功能,有的产品只是提升一个等级,而有的产品 则会是带来里程碑式的变更,而在相关的报道中,英特尔则将此次序二代智能酷睿处理器的发布归类于第二者.堪 比当年经典飞跃处理器的出生.那么下面我们就来看一下这个第二代智能酷睿处理器到底有什么过人 之处.
华硕N53S采用了一颗酷睿i7-2820M处理器,它采用32nm制造工艺,更加省电,主频为2.3GHz.酷睿i7 2820QM处理器拥有原生4个核心,具备超线程技术,能够模拟8核心运行.其共享8MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存,另外还为每颗核心配备了与Core架构极为类似 的32KB L1缓存.
PCI-E控制器,可供给16条PCI-E 2.0信道,支持单条PCI-E x16或者两条PCI-E x8插槽;
杨叙先生讲授新平台架构
英特尔发布会
SNB里又增加了一个微指令缓存,用于在指令解码时常设寄存.这里没有什么严厉的算法,指令只有在解码就会 放入缓存.预取硬件失掉一个新指令的时候,会首先检讨它是否存在于微指令缓存中,如是则由缓存为其余的管线 服务,前端随之封闭.解码硬件是x86管线里无比庞杂的局部,关闭它能够节俭大批的功耗.如果这种技术也能 引入到Atom处理器架构中,无疑也能使之受益匪浅.
CineBench R11.5测试成绩
在发布会上,英特尔公司中国区总裁杨叙表示:"英特尔公司致力于以立异推进产业发展,并联袂产业协作搭档为 用户带来一日千里的计算体验和使用模式,更智能化的计算,更个性化的体验,是宽大消费者的需要,也是各种计 算装备发展的趋势和方向.第二代智能英特尔酷睿处理器是英特尔公司钟摆模式(Tick-Tock)产品发展策略在微架构上实现的又一次革新,智能化程度更高,计算能力更出色,尤其是在视觉体验方 面实现了冲破性的提高,将为用户'创立、编纂和观赏'包括高清和3D在内的多种内容带来全新的 使用体验."
这看起来有点儿像Pentium 4的追踪缓存,但最大的不同是它并不缓存追踪,而更像是一个指令缓存,存储的是微指令,而非x86指令(m acro-ops). 与此同时,Intel还完全重新了一个分支预测单元(BPU),精确度更高,并在三个方面进行 了翻新.
这个缓存是直接映射的,能存储大概1.5K微指令,相称于6KB指令缓存.它位于一级指令缓存内,大多数程 序的命中率都能达到80%左右,而且带宽也比拟一级指令缓存更高、更稳定.真正的一级指令跟数据缓存并不变 ,依然都是32KB,共计64KB.
AMD推土机架构对AVX的支持则有所不同,使用了两个128-bit SSE门路来合并成256-bit AVX操作,即使八核心(四模块)推土机的256-bit AVX吞吐量也要比四核心SNB少一半,不过实际影响完整取决于利用程序如何利用AVX. SNB的峰值浮点性能翻了一番,这就对载入和存储单元提出了更高要求.Nehalem/Westmere架构中有三个载入和存储端口:载入、存储地址、存储数据.
wPrime是一款与Super Pi雷同的圆周率计算软件,但与Super Pi只能支持单线程不同的是,wPrime可以支持多个线程同时计算,也就是说可以支持更多核心处理器,并 且测试多核心处理器性能时比Super Pi更加准确.
在这个环节中,我们分别用新旧两个版本10和11.5的Cinebench进行测试.
联想Y460P处理器信息
七、新一代Turbo Boost
对于多媒体性能而言,缓存大小及主频频率对性能表现都有着一定的影响.不过我们也可以看出来,核心数量的影 响对处理器多媒体的表现也有着必定的决定作用.可以看出,第二代智能英特尔酷睿处理器在多媒体表现里有着很 大幅度的提升,产品性能有着极大地先进.可见架构的变化对其性能有着极大的帮助.
SNB又整合了GPU图形核心、视频转码引擎,并共享三级缓存.Intel并没有沿用此前的做法,再增添2 000条连线,而是像服务器版的Nehalem-EX、Westmere-EX那样,引入了环形总线(Ring Bus),每个核心、每一块三级缓存(LLC)、集成图形核心、媒体引擎、系统助手(System Agent)都在这条线上领有自己的接入点,形象地说就是个"站台".
<img alt=src= 46464981.jpg?? 714 145 156 hv1 pics digi img1.gtimg.com http: />
解压缩性能测试
经由环形总线、三级缓存的变化,非核心(Uncore)概念还在,但是Intel改称之为系统助手,基本就 相当于曾经的北桥芯片:
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464966.jpg?? 141 />
媒体处理器
核心面积的精简恰是AVX指令(SNB最重要改革之一)集得以实现并保障良好性能的要害所在.以最小的核心 面积代价,Intel将所有SIMD单元都转向了256-bit.
Sandy Bridge内核架构解析:缓存
下面我们通过表格来懂得一下其相关信息:
索尼S138EC处理器信息
神舟精盾K580-i7采用了一颗酷睿i7-640M处理器,它采用32nm制造工艺,主频为2.80GHz.酷睿i7-640M处理器拥有原生2个核心,具备超线程技术,能够模拟4核心运行.其共享4MB L3缓存外,每颗核心内部还单独具备256KB的L2缓存.
SiSoftware Sandra算数处理器测试(数值越大越好)
酷睿二代参测产品配置表
Fritz Chess Benchmark测试成绩
SNB架构中载入和存储地址端口是对称的,都可以执行载入或者存储地址,载入带宽因而翻倍. SNB的整数执行也有了改良,只是比较有限.ADC指令吞吐量翻番,乘法运算可加速25%.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464954.jpg?? 129 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464974.jpg?? 149 />
Fritz Chess Benchmark
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464972.jpg?? 147 />
SandyBridge的环形总线
SNB集成的GPU图形核心分为两大版本,
sale christian louboutin pumps,分离占有6个、12个EU.首批宣布的移动版全体是12个EU,桌面版则依据型号不同而有两种配置,可能 是高端12个、低端6个.得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特色,即便只有六个的时 候性能也会相称令人满足.
所有这些改进加起来,SNB里每个EU的指令吞吐量都比现在的HD Graphics增加了一倍.
迷信运算测试:Super PI
此外还有DMI总线接口、显示引擎、电源把持单元(PCU).
内存控制器性能大幅提升:
SNB GPU有本人的电源岛和时钟域,也支持Turbo Boost技巧,可以独立加速或降频,并共享三级缓存.显卡驱动会节制拜访三级缓存的权限,甚至可以限度G PU使用多少缓存.将图形数据放在缓存里就不必绕道去遥远而"迟缓"的内存了,这对晋升性能、下降功耗都大 有裨益.
Intel与软件工业配合亲密,相信这种视频转码技术会很快得到广泛支持.
CPU测试软件随着CPU核心数量的增加而在一直的优化,随着CPU测试软件的发展速度还不能追上目前CP U的发展速度,特殊是对CPU新的指令集没有进行优化.对CPU来说决议CPU性能的除了主频外,核心架构 才是影响其性能症结的所在.就像当时的奔跑4固然主频高达3G甚至更高,但是因为核心架构问题,造成CPU 的执行效率异常之低下.因此,在性能方面却远不迭现在的酷睿2架构.
二代酷睿处理器性能对比测试总结
不过在稳定性方面,PCU不会许可超过任何制约.
神舟精盾K580-i7处置器信息
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464958.jpg?? 133 />
SandyBridge革命性的环形总线与三级缓存构造,使得处理器缓存的效率大大提升.只管目前还没有软 件可以明白测试其性能,但是其带来的影响是可以通过测试软件成绩看到的.
这不得不说是SandyBridge最显著,也最令人惊喜的处所,内存读写性能和带宽都大幅增加,由此带来 的是CPU效能的直接提升,在诸多应用和测试中都有体现.
wPrime测试结果(数值越小越好)
其实,我们在电脑的日常运用中都分开WinRAR这款功能壮大的软件,但是这款软件自带的硬件性能测试也是 能够非常好的反映出CPU的实际性能,除此之外,WinRAR还可以反映出内存与CPU之间的 带宽速度.
多媒体性能测试(数值越大越好)
现在CineBench已经更新到R11.5版本,由于旧版本已经可以说非常轻松而且运行时间也非常短,所 以在新版本中需要加大测试量,这样渲染时间也长出许多,对于硬件性能的对比更有利.
第三,提高分枝预测器精度的传统方式是使用更多的历史位,但这只对要求长指令的特定类型分支有效,SNB于 是将分支依照是非不同历史进行划分,从而提高预测精度.
Nehalem架构中有三个执行端口和三个执行单元堆栈:
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464960.jpg?? 135 />
四、系统助手
三级缓存的延迟也从大约36个周期减少到26-31个周期.此前预览的时候我们就已经感到到了这一点,现在终于有了确实的数字.三级缓存现在被划分成多个 区块,分别对应一个CPU核心,都在环形总线上有自己的接入点和完全缓存管线.每个核心都可以访问全部三级 缓存,只是延迟不同.此前三级缓存只有一条缓存管线,所有核心的要求都必须通过它,现在很大程度上分而治之 了. 和以前不同的是,三级缓存的频率现在也和核心频率同步,
tory burch flip flops sale,因而速度更快,不过缺陷是三级缓存也会随着核心而降频,所以如果CPU降频的时候GPU又正好需要访问三 级缓存,速度就慢下来了.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464970.jpg?? />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464976.jpg?? 151 />
因为在WinRAR压缩过程中不仅对CPU的性能是个重大的考量,同时也对CPU同内存之间的数据交流有着 比较准确的评估.而且WinRAR可以支持多核心处理,并且在多核心和单核心测试中差距比较显著,能够非常 准确地反映出CPU实际性能.第二代智能酷睿处理器当先旧酷睿一倍有余,提升非常显明.
多媒体指令集测试我们同样的使用SiSoftware Sandra这款软件来进行评测.这里将测试CPU的多媒体指令集效能.
Fritz Chess Benchmark的特点也是可以根据CPU的核心数量自动检测出测测试的线程数,将CPU的最后一滴潜能 都施展得酣畅淋漓.其更加着重于CPU的逻辑运行能力,测试结果还将与P3 1G的测试性能进行比较,最后得出CPU与P3 1G处理器之间的关联.
新的硬件加速解码引擎中,全部视频管线都通过固定功能单元进行解码,和当初正好相反.Intel据此声称, SNB在播放视频的时候功耗可降低一半. 视频编码引擎则是全新的.详细细节没有颁布,然而Intel现场拿出了一段3分钟长的1080 p 30Mbps高清视频,将其转换成640*360 iPhone格局,结果整个进程耗时仅仅14秒钟,转换速度高达400FPS左右,而这只破费了大约3平方 毫米的核心面积.
五、整合图形核心
第二代智能酷睿i参测产品简介
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464962.jpg?? 137 />
Fritz 10针对了多核心处理器进行了优化,比较能够凸显产品的多线程能力.拥有4核心8线程的第二代智能酷睿处理 器毫无疑难地领先2核心4线程的旧酷睿一大截.
更低的功耗和发烧:
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464977.jpg?? 152 />
制造工艺,主频为2.67GHz.酷睿i5-560M处理器拥有原生2个核心,具备超线程技术,能够模仿4核心运行.其共享3MB L3缓存外,每颗核心内部还独自具备256KB的L2缓存.
这条环形总线由四条独立的环组成,分别是数据环(DT)、恳求环(QT)、响应环(RSP)、侦听环(SN P).每条环的每个站台在每个时钟周期内都能接收32字节数据,而且环的访问总会主动选择最短的路径,以缩 短延迟.跟着核心数量、缓存容量的增多,缓存带宽也随时同步增长,因此能够很好地扩大到更多核心、更大服务 器集群.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464982.jpg?? 157 />
Sandy Bridge内核架构解析:物理寄存器文件
英特尔公司中国区总裁杨叙先生展现Sandy Bridge平台芯片
AVX支持256-bit操作数,相当耗费晶体管与核心面积,而RPF的使用加大了乱序执行缓冲,能够很好地满意更高吞吐量的 浮点引擎.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464979.jpg?? 154 />
从高等层面角度看,SNB架构只是一次进化,但是如果看看Nehalem/Westmere以来晶体管变化的范围,相对是一次革命. Core 2引入了一种叫作循环流检测器(LSD)的逻辑块,检测到CPU执行软件循环的时候就会关闭分枝预测器、预 取/解码引擎,然后通过本身缓存的微指令(micro-ops)供应执行单元.这种做法通过在轮回执行的时候关闭前端节省了功耗,并改进了性能.
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464956.jpg?? 131 />
<img alt=src= 714 145 hv1 pics digi img1.gtimg.com http: 46464969.jpg?? 144 />