国产亚洲综合精品一区二区三区_亚洲永久网址在线观看_亚洲色大成网站www久久九_国产亚洲AV夜间福利香蕉149

云棲大會浪潮發布FPGA加速方案演講全文

2017-10-16 09:22 來源:美通社 作者:Janet

10月11日, 2017阿里云棲大會在杭州云棲小鎮舉行,這次大會吸引了來自全球近5萬名嘉賓參會,堪稱史上最強。作為阿里在數據中心與AI計算基礎設施的重要合作伙伴,浪潮在阿里展臺發布了基于F10A的AI線上推理、GZip算法與WebP圖片轉碼三大云場景FPGA加速方案,在擴充FPGA生態的同時,也將為從事AI開發與應用的公司以及大型數據中心用戶,提供更高性能功耗比的專用加速芯片選擇。

以下為發布現場的演講實錄。

面向FAAS服務的FPGA加速卡

我們看到,應用逐步向云環境遷移,2020年,預計65%-85%的應用遷移到云環境中,對公有云、私有云和傳統云數據中心來說,公有云具有最高的負載密度和性價比,將成為云服務應用的主流形態。

當前一些以深度學習為代表的新興計算應用給云數據中心和云服務帶來了重大挑戰,異構計算成為解決這一挑戰的關鍵要素,成為一種新常態。異構計算云服務也給我們帶來一個新的盈利模式,對于云應用租戶來說,感受的是時間,時間就是金錢。如果通過異構加速,縮短服務所需的時間,可以節省很多的費用支出。對于面向云應用租戶提供SaaS服務的廠商來說,單位時間內生產效率的提升可以給他們帶來更多的收益,也提升了他們的提供云服務的積極性。對于公有云廠商來說,一方面,通過異構計算,可以顯著降低系統的能耗,節約成本,另一方面,異構計算給云應用租戶和SaaS服務商帶來更多的好處,使得大家更踴躍的參與,這將形成多贏的局面。對于異構計算加速部件,可以有GPU、FPGA、ASIC或者以TPU為代表的專用加速器等多種選擇。其中,GPU使用最廣,生態系統最成熟,在深度學習方面取得了良好效果。

與CPU和GPU不同,FPGA是一種典型的非諾依曼架構,是硬件適配軟件的模式,它能夠根據系統資源和算法特征靈活的調整并行度,達到最優的適配,因此能效比高于CPU和GPU。對于ASIC專用加速器來說,它們在專用算法的加速方面會有比較好的效果,但難以滿足云服務對計算部件具有廣泛適用性的需求。

以TPU為代表的各種PU們在深度學習加速方面取得了較好的效果,通常拿來與FPGA競爭、比較,這讓我們想起了20年前計算機體系結構超標量(Supersclar)和超長指令字(VLIW)之爭,超標量架構通過硬件發掘程序的并行性,但在4發射(4-issue)以上遇到了很大的困難,為了發掘程序的并行性并消除數據相關性和流水線沖突,付出了很大的硬件代價,同時使得處理器的工作主頻難以提升。而超長指令字將程序并行性發掘任務交給了編譯器,同時簡化了數據相關性、流水線沖突處理單元設計,以期望實現更高的工作主頻和更好的性能。但是理想很美好,現實很殘酷,編譯器很難從現有的編程模式下發掘更高的并行性。超長指令字并不能發揮,因此現在的主流CPU依然采用超標量架構。FPGA更像一種類似超標量的架構,提升算法并行性的模式,對于TPU來說,其Tensorcore采用的脈動陣列架構處理方式,對數據復用性很敏感,對于像殘差神經網絡(Resnet)這種小規模矩陣運算(如1*1矩陣)效果存在折扣。另一方面,TPU類似于超長指令字架構,簡化了數據控制邏輯單元,需要通過框架優化和編譯器優化來發掘并行性,消除數據相關性,應用場景受到限制,短時間內難以滿足云服務通用性的要求。因為,我們認為,FPGA 是繼GPU之后,第二種具有更高能效比、更好通用性云服務加速部件。

其實FPGA不僅在計算的加速具有良好效果,其也可以應用于數據中心存儲和網絡的加速,FPGA可為云服務計算、存儲、網絡帶來綜合的提升。

FPGA作為一個加速卡,已經有幾十年的歷史。但是在數據中心應用有所不同,FPGA首先要提供云服務,能夠滿足大規模部署和運維的需求,滿足云服務的特性,包括遠程監控管理、在線動靜態邏輯的重構,也需要支持各種虛擬機訪問以及支持各種驅動兼容性,整個加速卡也需要有更高的RAS特性,這些在服務器里面,可能是比較通用的性質,但是先前的FPGA加速卡,并沒有這類應用場景需求,也不具備這些特性,存在很大缺失。我們認為,FPGA更重要的是一種FaaS(FPGAas a Service)服務。

在這里介紹一下浪潮研制的面向 FaaS(FPGA as a Service)服務的FPGA加速卡。它是業界功能密度最高的半高半長加速卡,它與其他卡的顯著不同之處在于在半高半寬的尺寸下支持雙DIMM模式,而不是內存貼片。采用內存貼片的方式,將會帶來較好的散熱效果,但內存容量受限,同時,現在內存存在一些良率問題,采用貼片內存就需要篩選,如果篩選不好的話,FPGA卡,可能如果發生內存的故障,會不可修復,可能會帶來FPGA里頭的通道,或者很大一塊(08:卡可能發成內存故障,不可修復,可能會帶來FPGA內存訪問通道的缺失,或者一大塊內存空間失效,影響整個板卡的使用,因為浪潮采用DIMM的方式,并克服了DIMM方式帶來的一些問題,如信號完成性和散熱要求高要求。浪潮的FPGA卡每個DIMM最大可支持16GB,所以我們半高半長的板卡最大可以支持32GB內存,比其他板卡高出一倍以上,它的峰值浮點性能可以達到1.5TFlops。浪潮作為服務器廠商,其FPGA加速卡不僅僅是一個板卡,而是將很多的服務器技術轉移至其中,構建了一個支持FaaS服務的FPGA生態系統。

板卡能夠支持動態邏輯的在線可重構、靜態邏輯的遠程更新,采用帶內(CPU-PCIE-FPGA)帶外(BMC-SMBUS-CPLD)雙環監控管理機制,大大提升了板卡遠程監控管理的可靠性,通過它們可以實時的監控FPGA芯片的溫度、板卡風扇轉速、板卡序列號、板卡內存特性并可以調整FPGA的工作頻率。

同時也支持虛擬機的直接訪問,板卡本身也加入了很多RAS特性,如高可靠內存訪問等。板卡支持并行(FPP)和串行(AS)雙加載模式,任何一種模式加載出現故障,都可以快速切換到另一種模式加載,保證了板卡大規模服務的可用性。

基于OpenCL高級語言的FPGA一體化解決方案

傳統的FPGA的開發類似于芯片的開發,采用硬件描述(RTL)語言開發,RTL開發帶來的問題就會像芯片設計一樣周期會比較長。一個典型的應用開發,我們首先要進行架構設計,然后我們要寫算法的C模型,C模型做完驗證之后,RTL工程師使用RTL語言改寫一遍,寫后需要仿真綜合,如果我們發現時序達不了標,可能要調整時序,甚至要推倒重來重新優化設計,時序達標后,首先要跟C模型進行聯合仿真驗證,驗證完畢還要上板卡進行測試驗證,板卡級的測試驗證會有很多問題,尤其是人工開發引入的時序、時鐘問題,發現難驗證難。因此,要開發一個大型應用可能需要一年的時間。當然,現在有一些HLS(HighLevel Synthsis)的工具,它可以把C模型直接翻譯成RTL模型,但是它的主要問題是開發不是特別友好,它僅僅把算法實現了,但是算法周邊,包括總線接口、訪存單元、驅動、上層的調用都存在著空白需要額外開發。因為RTL工程師僅僅把它當成一個輔助的開發工具,整體開發時間并不能節省太多。

互聯網存在快速開發和迭代開發的特性,以滿足線上應用快速變化的需求,RTL或HLS開發模式動輒以半年或年為單位的開發周期難以滿足需求,迫切需要更高層次的開發模型。OpenCL高級語言開發方式為我們打開了一扇窗戶,它把底層的硬件如總線、IO接口、訪存控制器等和底層軟件如驅動、函數調用等全部封裝在BSP中,變成標準單元提供上層支持。用戶只需要關注算法本身,OpenCL的開發的邏輯通過編譯工具直接映射到FPGA中,開發周期大大縮短,也符合互聯網應用的需求。

Gzip數據壓縮

基于OpenCL語言浪潮開發了一些解決方案,下面我們講一些案例,以數據壓縮Gzip為例,存儲面臨的壓力遠遠高于計算,數據產生可以分為兩類,一類是人類產生的數據,比方說,文本、圖片和視頻等,它的特點是隨機性高、重復率低,另一類是機器產生的數據,包括交易記錄、編譯報告和日志等,這類的數據其實比我們人類產生的要多的多,它的特點是隨機性比較低,重復率非常高。對于壓縮來說,怎么樣把各類數據都進行很好的壓縮,是個很大的挑戰。

對于FPGA壓縮方案業內通用的是一種簡化方案,它把Gzip最重要的兩個部件LZ77壓縮、Huffman并行執行,犧牲了壓縮率,不兼容Gzip標準算法。

針對這些問題,浪潮推出了完全兼容Gzip標準的FPGA壓縮算法,并且提供兩種方案,一種是高性能的(High Performance)的方案,另一種是高壓縮率的方案。數據對比表明,采用簡化方案雖然性能可以達到2.5GB每秒,但壓縮率只有45%,浪潮的高性能方案和高壓縮率方案性能可以到1-1.5GB每秒,壓縮率可達25%-28%,比簡化方案提升了50%以上。    另外,在機器產生的日志文件壓縮中效果更加明顯,壓縮率能到5%,而簡化的方案只能到26%-27%左右,浪潮的方案提升了5倍,這是非常顯著的一個數據,因為現在很多互聯網廠商,他們每天的日志文件,都是TB級的,所以減少5倍存儲開銷是非??捎^的數字。

與CPU軟件方案相比,在文本上面壓縮上與其接近,在日志文件壓縮上與其差距不大,但性能提升了10-20倍?,F在最快的SSD數據寫入速度大約在1GB每秒左右,浪潮FPGA加速方案可以實現實時壓縮和存儲。  

圖片轉碼FPGA加速

WebP是谷歌提出的一種圖片編碼格式,它能夠在保證圖象質量的同時,進一步壓縮圖片存儲空間,比PNG、JPG、GIF格式有25%-60%的存儲空間減少。對于數據中心來說,網絡帶寬其實是很大的一塊運營成本。谷歌的數據表明,Webp格式可減少33%的網頁傳輸時間,同時整體加載時間可以減少10%。騰訊的數據表明,采用Webp格式,其新聞客戶端、QQ空間等,流量峰值帶寬降低9GB,圖片延時和數據下載延時降低100ms。因此采用WebP的方式不僅僅能夠數據每天節省TB級的數據存儲空間,同時也能有效降低網絡帶寬的開銷,從而降低整個數據中心的運營成本。從VGA(640*480)到4K高清各種尺度下的測試表明,浪潮FPGA的WebP編碼性能可提升10倍以上。

深度學習

浪潮FPGA在深度學習線上推理應用也做了很多嘗試。首先是AlexNet深度學習網絡,單機單卡性能可達到848楨每秒的線上識別率。我們也嘗試單機雙卡、三卡到四卡性能加速,在單機四卡情況下,可達到2971幀每秒的線上識別率。而且,從單機到單卡到四卡,它們的性能提升線性度非常好。

另外,我們也構建了兩種殘差深度學習網絡加速模型,一種是采用CIFAR-10的57層神經網絡,另一種采用ImageNet數據集的50層神經網絡。浪潮作為一家服務器廠商,可以提供包含FPGA板卡、BSP和驅動、IP算法,同時可以集成在我們的服務器中給客戶提供一體化的解決方案。

云棲大會 浪潮 FPGA加速方案

相關閱讀

暫無數據

一周熱門

国产亚洲综合精品一区二区三区_亚洲永久网址在线观看_亚洲色大成网站www久久九_国产亚洲AV夜间福利香蕉149

    免费视频一区二区| 成人综合日日夜夜| 成人小视频在线| 久久久精品天堂| 一区二区三区在线视频播放| 欧美日韩另类一区| 国产偷国产偷精品高清尤物 | 亚洲国产va精品久久久不卡综合 | 2017欧美狠狠色| 一区二区三区日韩欧美| 韩国成人精品a∨在线观看| 国产精品高潮久久久久无| 欧美日韩国产影片| 亚洲男女一区二区三区| 国产不卡免费视频| 中文字幕在线不卡一区| 欧美日韩你懂的| 一区免费观看视频| 日韩精品一二三| 26uuu亚洲综合色欧美| 亚洲在线视频一区| 精品国产一区二区三区久久影院 | 欧美无人高清视频在线观看| 精品国产一区二区三区忘忧草| 一区二区三区鲁丝不卡| 成人小视频免费在线观看| 亚洲美女在线一区| 欧美电影免费观看高清完整版| 国产精品家庭影院| 国产毛片精品一区| 亚洲欧洲一区二区在线播放| 777午夜精品视频在线播放| 综合网在线视频| 国产大陆a不卡| 一区二区不卡在线播放| wwwwxxxxx欧美| 日本午夜精品一区二区三区电影| www.欧美色图| 色一情一乱一乱一91av| 欧美激情综合五月色丁香小说| 蜜臀av亚洲一区中文字幕| 国产精品天干天干在线综合| 欧美一区二区在线播放| 日韩和欧美一区二区三区| 国产精品天美传媒| 久久综合五月天婷婷伊人| 国产在线一区观看| 五月婷婷色综合| 亚洲黄色av一区| 国产免费观看久久| 欧美va在线播放| 国内外成人在线| 亚洲电影第三页| 亚洲欧美日本韩国| 国产蜜臀av在线一区二区三区| 欧美一区二区三区在线视频| 麻豆视频观看网址久久| 一区二区三区波多野结衣在线观看| 国产亚洲精品精华液| 懂色av一区二区夜夜嗨| 欧美日韩一级片在线观看| 婷婷久久综合九色综合绿巨人| 中文字幕亚洲一区二区va在线| 久久久天堂av| 成人av电影在线| 91麻豆精品国产91久久久使用方法 | 一区二区三区欧美日韩| 欧美激情一区在线| 久久久久久一二三区| 国产.欧美.日韩| 欧美人牲a欧美精品| 久久国产精品区| 日本伦理一区二区| 图片区日韩欧美亚洲| 一区二区国产盗摄色噜噜| 亚洲黄网站在线观看| 亚洲欧洲精品一区二区精品久久久| 国产欧美日韩视频一区二区| 99亚偷拍自图区亚洲| 日韩欧美第一区| 成人性生交大片免费看中文 | 亚洲精品亚洲人成人网在线播放| 国产拍欧美日韩视频二区| 国产午夜久久久久| 99久久精品免费看| 精品理论电影在线观看| 大白屁股一区二区视频| 欧美一区二区不卡视频| 国产不卡在线一区| 欧美一区二区三区爱爱| 国产成人av电影在线| 6080午夜不卡| 成人午夜视频福利| 精品国产一区二区三区忘忧草| 99热这里都是精品| 久久久久久影视| 国产亚洲美州欧州综合国| 中文字幕久久午夜不卡| 欧美国产综合一区二区| 国产精品短视频| 亚洲免费观看高清在线观看| 亚洲精品视频在线观看免费| 综合精品久久久| 亚洲成人777| 91久久免费观看| 九九九久久久精品| 4438x亚洲最大成人网| 不卡一区二区三区四区| 久久午夜免费电影| 国产日韩欧美麻豆| 亚洲欧洲制服丝袜| 亚洲综合无码一区二区| 日本欧美肥老太交大片| 欧美日韩情趣电影| www.欧美.com| 欧美国产日韩在线观看| 国产精品夫妻自拍| 亚洲高清免费在线| 欧美中文一区二区三区| 国产乱对白刺激视频不卡| 欧美mv和日韩mv国产网站| 国产无人区一区二区三区| 日韩理论片一区二区| 亚洲自拍偷拍综合| 蜜臀av在线播放一区二区三区 | 亚洲欧美日韩人成在线播放| 亚洲自拍偷拍欧美| 玖玖九九国产精品| 日韩欧美成人午夜| 欧美国产日产图区| 亚洲电影在线免费观看| 欧美在线观看一区二区| 成人小视频免费在线观看| 国产清纯美女被跳蛋高潮一区二区久久w | 亚洲丝袜另类动漫二区| 日韩国产精品91| 欧美日韩久久一区| 99国产精品久久久久久久久久| 一区在线观看视频| 一本色道久久综合亚洲91| 国产精品99久久久久久久vr| 久久精品综合网| 亚洲欧美日韩国产一区二区三区 | 国产精品久久久久久久久免费相片| 亚洲亚洲人成综合网络| 欧美午夜精品久久久久久孕妇| 99久久er热在这里只有精品15| 亚洲丝袜另类动漫二区| 色嗨嗨av一区二区三区| 成人福利视频网站| 亚洲日本在线观看| 欧美亚洲愉拍一区二区| 久久一区二区视频| 亚洲成人免费电影| 欧美一级电影网站| 亚洲欧洲精品一区二区精品久久久 | 婷婷国产v国产偷v亚洲高清| 丁香婷婷综合色啪| 亚洲日本韩国一区| 欧美色倩网站大全免费| 久久久久久久综合| 视频一区中文字幕国产| 日韩欧美不卡在线观看视频| 日韩久久一区二区| 国产毛片精品视频| 亚洲日本在线看| 欧美人伦禁忌dvd放荡欲情| 亚洲国产成人一区二区三区| 免费一级欧美片在线观看| 亚洲精品在线免费播放| 亚洲国产一区二区视频| a亚洲天堂av| 亚洲电影视频在线| 久久一区二区三区国产精品| 亚洲综合视频网| 99v久久综合狠狠综合久久| 婷婷激情综合网| 久久精品亚洲乱码伦伦中文| 性感美女久久精品| 久久综合九色综合97_久久久| 日韩电影一二三区| 国产日韩欧美电影| 欧洲精品视频在线观看| 欧美韩日一区二区三区四区| 狠狠色丁香久久婷婷综合丁香| 国产精品无码永久免费888| 欧美色图12p| 《视频一区视频二区| 丰满少妇久久久久久久| 亚洲国产精品影院| 久久久国际精品| 欧美性猛交xxxxxx富婆| 国产精品久久久久久户外露出 | 亚洲一区二区三区四区的| 精品乱码亚洲一区二区不卡| 色综合久久久网| 国产精品乱人伦| 成人av在线资源网| 日本欧美加勒比视频| 亚洲欧洲av一区二区三区久久|