您的位置:新闻 >最近更新 >正文

Intel这次玩真的 Larrabee图形核心详解
来源:ZOL.COM.CN | 2008年08月05日 | 作者:

导言:

  intel低调的开始利用它的Larrabee进入图形芯片市场。对此,NVIDIA并没有大肆批评虚无的Larrabee,也只是偶尔低调地回应。不过,随着这几个月来我们所看到的回回的互讽。intel Larrabee GPU 的核心架构终于第一次出现在了大众眼前。


  当然很重要的一点,就是要谨记,这首先不是一个GPU,但又确确实实是GPU。此时,读者肯定会想,它和一个数据平行处理优化的多核CPU有什么区别呢? 嗯,有一个微妙的固定功能硬件来尽可能简单地运转一般的编码。底线就是intel可以制造成这个应用广泛的多核CPU,使它看起来像通过执行软件程序库来处理DirectX 和OpenGL的GPU。

  这不是一个仿真GPU,因为它直接在数据平行的CPU上执行函数性,而这种CPU一般在专门的硬件上操作。开发者们也都不会仅仅局限于DirectX 和OpenGL,这类硬件可以操作纯粹的渲染程序并运作,如同量身定做一般。



设计实验:英特尔可以建立一个图形处理器吗?

  Larrabee以现存的intel x86的核心技术为基础制作出来的,这不仅意味着intel对芯片设计熟之又熟,而且对以后的桌面微处理器会采取更认真的蕴含式。但是Larrabee并不是在酷睿架构---intel 现有的所需---- 基础上制造出来的, 而是基于最初的.Pentium.。

  最初的.Pentium.是在 0.80μm的处理器上制作而成的, 之后提升为0.60μm. intel的问题就是: 拥有现代处理以及广泛的向量组装备的.Pentium. 酷睿的更新版, 可以成为终极GPU吗?

  首先来检测一下intel理论的标准Core 2 Duo,4MB L2 缓存 频率(可能有些地方在1.8-2.9GHz 之间). 然后,在同一制作过程当中,大致相同的死机区域,以及动量消耗,intel试图找到有多少这种修正过的.Pentium. cores它可以适合。

  因此,在空间的双核心Core 2 Duo处理器,英特尔可以兴建这个假设性的10核心芯片。下面我们先来看看这些数据:


 intel Core 2 DuoHypothetical Larrabee
# of CPU Cores2 out of order10 in-order
Instructions per Issue4 per clock2 per clock
VPU Lanes per Core4-wide SSE16-wide
L2 Cache Size4MB4MB
Single-Stream Throughput4 per clock2 per clock
Vector Throughput8 per clock160 per clock

  如此 Larrabee 出生。

larrabee核心:不完全是.Pentium.,也不完全是Atom


架构简图 

 intel Larrabee Coreintel .Pentium. Core (P54C)intel Atom Core
Manufacturing Process45nm0.60µm45nm
Simultaneous Multi-Threading4-way1-way2-way
Issue Widthdual-issuedual-issuedual-issue
Pipeline Depth5-stages (?)5-stages16-stages
Scalar Execution Resources2 x Integer ALUs (?)
1 x FPU (?)
2 x Integer ALUs
1 x FPU
2 x Integer ALUs
1 x FPU
Vector Execution Resources16-wide Vector ALUNone1 x SIMD SSE
L1 Cache (I/D)32KB/32KB8KB/8KB32KB/24KB
L2 Cache256KBNone (External)512KB
.ISA.64-bit x86
SSEn support?
Parallel/Graphics?
32-bit x8664-bit x86
Full Merom .ISA. compatibility
Larrabee与不同的核心架构对比数据

Larrabee同AMD/NVIDIA的比较:


左边是larrabee核心

Putting it all Together - Return of the Ring Bus:

一个Larrabee有多少个内核?



设计为低延迟运作:


 AMD RV770NVIDIA GT200intel Larrabee
Scalar ops per L1 Cache802416
L1 Cache Size16KBunknown32KB
Scalar ops per L2 Cache1003016
L2 Cache Sizeunknownunknown256KB

线程及数据管理:

larrabee的shader:

多核是larrabee的发展之路: