NVIDIA要出Tesla K80的传闻之前就有了,8月份就有人从NVIDIA的驱动程序中发现了Tesla K80的蛛丝马迹,当时认为K80是基于双芯的GTX Titan Z,拥有5760个CUDA核心,显存容量甚至高达24GB,不过NVIDIA现在推出的Tesla K80有些奇怪,显存容量24GB倒是准了,但是核心并不是完整的GK110,而是全新的GK210,CUDA核心数量为2496个,不同于之前Titan显卡的2668个,也不同于GTX 780 Ti的2880个,也不是GTX 780的2304个。
Anandtech网站列出的Tesla K80规格表
从规格上来看,GK210核心的Tesla K80核心频率降低到了562MHz,加速频率875MHz,但性能要比之前的Tesla K40强,单精度浮点性能8.74TFLOPS,双精度浮点性能2.91FLOPS,即便是砍掉一半,GK210核心的性能看起来也要比GK110核心更强。
其他规格上,Tesla K80确实拥有2x12GB显存,位宽384bit,频率5GHz,带宽240GB/s,也有所降低,TDP功耗300W,被动散热,发布售价为5000美元,约合人民币30620元,比Tesla K40的5499美元还要便宜。
Tesla K80规格及亮点
黄总又在PPT上欺负Intel处理器了
GK210核心之谜
算上现在的这个GK210核心,NVIDIA在GK110家族中一共出了3个不同的GK110核心了,他们的完整版都是15组SMX单元,2880个CUDA核心,不过细节上有所不同,NVIDIA做了不同程度的调整。
Anandtech网站的GK110家族核心规格表
总的来说,NVIDIA并没有改变CUDA核心数或者CUDA的架构,他们改进的只是SMX单元之间的内存子系统,GK110(B)的SMX单元拥有256KB寄存器文件,64KB共享缓存,GK210的规模翻倍,拥有512KB寄存器文件,128KB共享缓存,因此它改进了SMX单元的数据吞吐量,提高了效率,确保CUDA核心的更容易频繁使用。
NVIDIA以前没有这么做过,这也是第一次看到GPU往这个方向改进。这也就是说,这反应了GPU市场的变化,而这也意味着Kepler在未来一段时间还会继续陪伴着我们。(Maxwell架构虽然高效,不过双精度设计上GK110还是更强,估计得到GM210之后再说更强的Tesla加速卡了。)
Anandtech网站自制的GK210核心示意图,非官方表格
NVIDIA这么做是希望针对HPC市场改进他们的GPU,修正勘误表,降低功耗(同时也是提升性能),这也是他们为何能在300W TDP下作出双芯的Tesla K80(作为对比,GTX Titan Z使用的是完整版GK110核心,TDP为375W)。
还有一个问题就是GPU Boost技术,之前的Tesla K40加速卡上的GPU加速技术相比消费级GPU效果有限,严重受限于TDP,通常只有特定的3个加速频率,而Tesla K80上NVIDIA使用了与消费级GPU相同的GPU加速技术,只要TDP允许,K80会尽可能地加速。
Tesla K80是双芯设计,它的性能指标看起来比K40高得多,不过实际上不一定总是超过K40,因为单个GPU的规格比K40低,而且它的基础频率更低,不过K80主要的应用环境显然都是对多路GPU优化较好的,所以Tesla K80还是要快得多。
此外,高密度应用也会很有趣,300W的TDP是个挑战,不过在1U机架内还是可以放下8个GK210显卡的,这样一来其FP64双精度浮点性能将超过10TFLOPS。