FPGA云服务器是什么,阿里云FPGA云服务器介绍
FPGA云服务器是什么
FPGA云服务器是一款提供现场可编程门阵列(FPGA)的计算实例,基于阿里云弹性计算框架,用户可以几分钟内轻松创建FPGA实例,创建自定义的专用硬件加速器。由于FPGA硬件的可重配特性,用户可以对已创建的FPGA硬件加速应用,进行快速擦写和重配,达到低时延硬件与弹性伸缩最好的结合。
阿里云FPGA云服务器介绍
FPGA云服务器具有独特优越的加速性能和经济实惠的性价比,并且易于复用已有的FPGA设计。
1、分钟级交付
基于阿里云弹性计算框架,您可以几分钟内轻松创建FPGA实例,创建自定义的专用硬件加速器。
2、独特优越的加速性能
FPGA器件通过PCIe 3.0接口与上层应用程序通信。对应用中消耗大量的CPU计算,系统可以选择性的交给FPGA专用硬件进行加速计算。释放CPU资源用于支持更大的应用访问量和吞吐量。您可选高配FPGA特性,共同使用一个地址空间相互通信速度高达48 Gbit/s。
3、经济实惠的性价比
购买FPGA实例时,无需单独购买FPGA器件和板卡。FPGA实例支持按量付费,可随时释放,实现轻资产开发,降低项目研发期间的投入成本。
4、可复用已有的设计
如果您已经有现成的FPGA工程,可以利用阿里云提供的开发环境和硬件支持包(BSP)轻松地将已有工程导入云端,并在FPGA实例中使用。阿里云提供了Intel、Xilinx主流的开发软件工具链,FPGA实例中的FPGA器件也兼顾两家,方便您根据原设计的具体情况进行合理选择,无缝迁移。
阿里云FPGA云服务器介绍应用场景
FPGA云服务器的典型应用场景。
1、直播实时视频转码
阿里云异构GPU/FPGA服务器重点支持2019年双11猫晚直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务猫晚当天直播业务4K、2K、1080P等各个分辨率的转码。其中FPGA H.265高清编码、720P节省带宽21.6%,GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过洪峰。异构GPU云服务器还参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。异构FPGA图片转码业务则以3K+片的超大集群,为淘宝图片空间提供高达数百万QPS的处理能力,承担了双十一淘宝图片85%的流量,预计节省计算成本3亿。
2、人工智能
目前,GPU是人工智能技术方案的首选,原因在于两个方面:
GPU具有完善的生态和高并行度的计算力,能很好地帮助您实现方案和部署上线。
人工智能的发展仍处于早期阶段,各个行业正在从算法层面尝试寻找商业落地的可能性,是一个从0到1的过程。
可以预见在未来几年,人工智能落地应用越来越多,大规模商业部署渐渐成为可能。这时对于更低功耗、更低成本、更低处理延时、更多定制化等方面的需求将会逐渐凸显。在人工智能大规模商业部署(推理应用)中,f3实例将具备独特的性能优势和广阔的潜在空间。
GPU计算的处理优势在于拥有众多专用的并行计算单元以及超高的显存带宽,让多路大规模数据搬移和快速并行计算成为典型的计算模式,但该模式也导致了每路数据的处理延迟增加。在具有低延迟需求的在线业务场景中,例如语音识别等,在Batch值较小的情况下,f3实例的处理延时仅为GPU的1/10。
深度神经网络计算的一个发展趋势是降低数据表示的精度,降低网络对于计算力的需求,以提高计算吞吐量。从双精度浮点到单精度浮点,再到定点处理,而定点运算是FPGA的传统优势。与GPU相比,FPGA内部配备了众多的定点处理单元,甚至可以将整个FPGA芯片的内部逻辑资源配置成定点处理单元,进而具备了超高的定点运算能力。
3、基因测序
基因测序是一种新型基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性。基因测序技术能锁定个人病变基因,提前预防和治疗,目前一个广为人知的用途是针对唐氏综合征的无创产前基因检测。随着基因测序技术的快速发展,基因数据的生成呈现指数级增长,应用也越来越广泛,对分析能力提出更高要求。
传统的计算系统通过采用多个高端CPU搭建HPC系统实现了缩短时间的目的,但导致成本增加,行业应用规模以及基因企业发展规模受限。目前中国内地基因企业面临基因计算成本偏高,但业务需求旺盛的行业困境,急需高性价比的算力资源。
以人类全基因组(WGS)分析为例,使用一台16 vCPU、64 GiB的CPU实例,完成单个WGS分析耗时近100小时,而f3实例可以在30分钟以内完成,极大地缩减了计算时间,降低了成本。
4、IC设计原型验证
在传统的数字IC设计流程中,使用FPGA搭建芯片原型验证平台测试功能是一个重要环节,验证过程需要大量的FPGA逻辑单元。而对于传统数字芯片设计公司,购买或者自研复杂的FPGA验证单板或平台,不仅耗时耗力,而且本不是公司主要业务方案。加之FPGA平台升级换代速度快过芯片设计周期,大型数字芯片设计中追求更大逻辑量FGPA板卡,需要不断研制最新fpga板卡一直是个痛点。
f3实例选用单芯片逻辑单元达250万个的VU9P,支持双芯片600 Gbit/s互联以及多板卡间的100 Gbit/s互联。f3实例最多支持16个VU9P芯片,充分满足了数字芯片原型验证阶段对于大逻辑量的需求。同时选择f3实例还可以避免维护复杂FPGA板卡,缩减了验证平台的维护成本。
5、云端压缩的计算加速
云上用户在进行大数据存储、高速网络传输时,常常因为实例性能需要在效率和成本之间做出取舍。gzip是一种广泛用于互联网服务的压缩工具,但传统的CPU实现gzip效率低、耗时长、难以支撑较大流量。使用带有FPGA的计算实例进行gzip压缩,性能比仅用CPU的普通实例提升8~10倍,充分满足用户的数据压缩需求。
在后台服务日志压缩、网站静态资源文件压缩、批量计算任务压缩、分布式存储压缩等方面均可使用FPGA进行加速。
6、数据库加速
以大型互联网公司为例,每天处理的数据量级都在PB,每天更新的网页以亿计,每24小时更新的日志超过PB,因此需要大型的集群处理大规模的数据。在处理大规模数据时,数据仓库的性能直接影响数据本身的处理能力。
f3实例得益于FPGA细颗粒度的数据处理能力、高并发度的并行计算能力,能够大幅提升数据库产品的性能。
以数据库处理中的排序单元为例,在PostgreSQL的核心处理单元加速中,f3实例的性能比只使用CPU提升10倍以上。
以时序数据处理为例,时序数据广泛应用于物联网(IoT)设备监控系统、企业能源管理系统(EMS)、生产安全监控系统、电力检测系统等行业场景,f3实例单路数据吞吐性能是单核CPU的30倍以上。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:niceseo99@gmail.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
评论