Quadro超级工作站方案

来源: 作者:

  

 

一、行业发展趋势

CUDA飞速发展催生了OpenCLDirectCompute通用计算标准。尤其是近年来GPU已经在科学研究和超级计算领域取得突破性进展,随着数百万支持CUDAGPU已经遍布全球计算机,软件开发人员、科学人士和研究人员正在利用CUDA探测到更多更广的领域中,包括图像和视频编辑、计算生物学和计算化学、流体力学模拟、CT图像重组、地震分析、光线追踪以及其它更多。近年来超级计算机的突飞猛进很大程度上也是得益于强大的GPU加盟。

通用计算之所以如此热门,根本原因在于tesla卡核心GPU的多流处理器(相当于数百核心)架构:GPU强大的并行浮点运算能力是仅仅拥有个位数核心的中央处理器CPU无法望其项背的。而通用计算技术可以发挥GPU的长处,让其电脑运算速度飙升,一些应用程序的速度可以提高数倍甚至数十倍,让原来因为运算量巨大而不可完成的任务变得可行。因此,可以说谁拥有了GPU运算,谁就向未来领域的大门又迈进了一步。

二、科卓高性能计算工作站方案

                                   

产品俯视图                                                           产品后视图

1、 产品特点和优势

  Quadro-U4“Quadro”高性能计算产品系列中的高端产品,专为大型数据和复杂的多线程应用程序而设计,可提供极致的横向扩展能力与性能

  支持4Tesla C2050/C2070/C2075 计算处理器,每个处理器有448个核心,共1792个计算核心

  可提供4.12 Teraflops的单精度浮点运算性能和2.06 Teraflops的双精度浮点运算性能

  Windows操作系统上具有更大数据集的技术类应用程序上可实现更高性能

  可实现极高数据可靠性的ECC保护,在最严苛的条件下,通过了数百次零故障允差长时间测试

  完全针对并行计算而设计,可提供广泛的计算特性,为专业人士提供最强劲的性能

  提供GPU温度监控、风扇转速、功率以及负载,随时掌握高性能计算运行状况

  CUDA程序环境,支持多种编程语言和API,包括CC++OpenCL

  通过中间件Parallels WS VirtualizationExtreme支持多操作系统(MULTI-OS)虚拟化技术

 

 2Quadro-U4产品加速真实测试

在图像处理方面的应用

Musemage突破传统的全新图像处理软件,它完全采用了GPU强大的并行处理能力运算加速功能,在照片处理速度上性能有质的提升。下面我们就看看在Quadro-U4平台上使用GPU和不使用GPU处理同一张照片的性能表现对比

   

还是那张5184*3456JPG图片,使用Quadro-U4加速做一下径向模糊,用时3.271秒完成,而未使用GPU加速用了整整87.7秒。

3D、倍线方面的应用

TotalMediaThertre使用GPU的并行计算能力来实时倍线视频,将标清视频插值扩充至高清分辨率,大幅提升画面细节与品质。

 

    未用GPU                                              启用GPU

由此可见,启用了Quadro-U4平台的GPU加速大幅提升了画面细节与品质

 

视频修复与增强

 “vReveal”的视频修复软件。软件主要用来去掉视频中的颗粒、色块等视频瑕疵,还能有效增强晃动视频的稳定性。但是,这种技术如果使用传统的CPU来进行运算的话,那么顶级的CPU也难以满足其庞大的计算量要求。

   

在支持CUDA之后,vReveal的速度有了质的提升,下面是一些视频处理前后的效果对比。

原始视频与处理后的效果对比:

      

                                 原始视频                   采用GPU处理后的视频

 

三、科卓高性能产品应用案例

石油天然气物探

  SeismicCity公司软件在科卓Quadro-U4产品上可以达到CPU配置30倍的性能提升

 

医学成像

  

 

 

●分子动力学程序          

UIUC大学NAMD和VMD程序在18个CPU的机群上有100倍的加速。

科卓Quadro-U4的工作站实际达到2.06Teraflops计算能力

           

   

 


  

脑神经网络仿真案例

 

   仿真一条单独的神需要每秒解200,000,000个微积分方程一条神经需40亿次浮点运算

   这就意味着要处理一个感觉神经数组,需要进行超过10万亿次的浮点运算

用科卓Quadro-U4实现模拟X86 CPU相比要快130

 四、科卓高性能产品适用行业