NVIDIA®(英伟达™)Tesla™ C2050与C2070计算处理器能够推动整个行业向并行计算的过渡,为台式机带来了小型集群般的性能。Tesla GPU的20系列产品家族基于代号为“Fermi”的下一代CUDA架构,支持技术与企业计算所“必备”的诸多特性,其中包括C++支持、可实现极高精度与可扩展性的ECC存储器以及7倍于Tesla 10系列GPU的双精度性能。Tesla™ C2050与C2070 GPU旨在重新定义高性能计算并实现超级计算的平民化。
与最新的四核CPU相比,Tesla C2050与C2070计算处理器以十分之一的成本和二十分之一的功耗即可实现同等超级计算
基于新一代Fermi CUDA架构的GPU |
与基于最新四核CPU的纯CPU系统相比,该GPU以十分之一的成本和二十分之一的功耗即可实现同等的集群性能。 |
448个CUDA核心 |
每颗GPU最高可实现515 Gigaflop双精度峰值性能,从而让一台工作站即可实现Teraflop级甚至更高的性能。每颗GPU的单精度峰值性能超过1 Teraflop。 |
ECC存储器 |
能够满足工作站计算精度与可靠性方面的关键需求。能够为存储器中的数据提供保护功能,从而为应用程序增强数据完整性和可靠性。寄存器文件、L1/L2高速缓存、共享存储器以及DRAM均受ECC的保护。 |
台式机上的集群性能 |
与一个小型服务器集群相比,配备多颗GPU的单台工作站能够更快地解决大型难题。 |
每颗GPU最多配备6GB GDDR5存储器 |
更大的数据集能够保存在直接附属于GPU的本地存储器上,从而实现了性能的最大化并减少了数据传输的情况。 |
NVIDIA®(英伟达™)并行DataCache™ |
能够为物理效果解算器、光线追踪以及稀疏矩阵乘法等诸多算法加速,在这些算法中,数据地址事先都是未知的。每个流式多处理器模块均包含一个可配置的L1高速缓存,所有处理器核心使用统一的L2高速缓存。 |
NVIDIA®(英伟达™)GigaThread™引擎 |
通过多项技术实现了吞吐量的最大化,其中包括10倍于上一代架构的高速上下文切换、并发内核执行以及改良的线程块调度。 |
异步传输 |
计算核心在PCIe总线上传输数据的同时还能够处理其它数据,因而增强了系统性能。即便是地震处理这类需要大量数据传输的应用程序,也能够通过事先将数据传输至本地存储器的方法来最大限度提升计算效率。 |
CUDA编程环境受到各种编程语言与API的广泛支持 |
开发人员无论选择C语言、C++、OpenCL、DirectCompute还是选择Fortran语言,都能够实现应用程序的并行机制,进而利用“Fermi”GPU的创新架构。Microsoft Visual Studio开发人员可以使用NVIDIA®(英伟达™)Parallel Nsight工具。 |
高速PCIe Gen 2.0数据传输率 |
实现了主系统与Tesla处理器之间带宽的最大化。让Tesla系统能够应用于几乎所有具备一条开放式PCIe x16插槽且符合PCIe规范的主系统。 |
3规格
尺寸规格 |
9.75英寸PCIe x16规格 |
Tesla GPU的数量 |
1 |
CUDA核心数量 |
448 |
CUDA核心频率 |
1.15 GHz |
双精度浮点性能(峰值) |
515 Gflops |
单精度浮点性能(峰值) |
1.03 Tflops |
专用存储器总容量* Tesla C2050 Tesla C2070 |
3GB GDDR5 6GB GDDR5 |
存储器频率 |
1.5 GHz |
存储器接口 |
384位 |
存储器带宽 |
144 GB/秒 |
功耗 Tesla C2050 |
238W热设计功耗 |
系统接口 |
PCIe x16 Gen2 |
散热解决方案 |
主动式风扇散热器 |
显示器支持 Dual- 显示器最大分辨率@ 60Hz |
1 2560x1600 |
软件开发工具 |
CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。 针对Visual Studio的NVIDIA®(英伟达™)Parallel Nsight™ |
*注:在开启ECC功能的情况下,专用存储器中的一部分将用于ECC数据,因此用户可用存储器容量将减少12.5%。(例如总容量为3 GB的存储器将仅能为用户提供2.68 GB的可用容量。)
1. NVIDIA Tesla C2070并非是GTX 590这样的显卡, 正确的名称叫作"运算GPU", 它本身就已经拥有CPU的功能, 所以它搭建的平台"可以不再"需要INTEL, AMD这样的传统CPU作为中央处理器(如图)
2. 如果和传统超级图形工作站(服务器)相比, 他的价格明显要便宜很多, 如图, 如果用四个nVIDIA Tesla C2070 组成的平台(实现了四核心+4GPU+4X6G GDDR5内存+显存的超级图形平台), 只要人民币10万左右, 而如果是性能相当的同等级的普通平台(一个4核心SNB架构的至强CPU, 2个NVIDIA QUADRO 6000专业显卡组成SLI, 24G 内存), 价格明显要贵很多.
3. TESLA C2070也可以当作普通的显卡一样插在普通电脑的PCI-E 16X插槽上来当普通显卡用, 但是它作为以专业图形显卡为基准的设计, 游戏性能比GTX 590要慢很多, 但是图形渲染能力(AUTOCAD 3D, 3DS MAX, MAYA这些)比GTX 590快10倍以上