您現(xiàn)在的位置是:首頁 >綜合 > 2021-05-02 00:15:38 來源:
Nvidia推進(jìn)了2018年GTC的深度學(xué)習(xí)生態(tài)系統(tǒng)
在很多方面,Nvidia是在人工智能方面適時在適當(dāng)?shù)牡胤绞芤娴氖芤嬲?。計算,?shù)據(jù)和算法的進(jìn)步導(dǎo)致了對深度神經(jīng)網(wǎng)絡(luò)的爆炸性興趣,而我們目前的訓(xùn)練方法在很大程度上取決于Nvidia的圖形卡真正有效的數(shù)學(xué)運(yùn)算。
這并不是說一旦機(jī)會出現(xiàn),Nvidia就沒有表現(xiàn)得非常好。值得贊揚(yáng)的是,該公司很早就意識到了這一趨勢,并且在真正有意義之前進(jìn)行了大量投資,擊敗了“創(chuàng)新者的困境”,導(dǎo)致許多偉大的(或以前很棒的)公司錯失良機(jī)。
幾周前,我參加了Nvidia的GPU技術(shù)大會(GTC)2018年, 并提出了一些想法。Nvidia真正擅長的兩個領(lǐng)域是開發(fā)軟件和生態(tài)系統(tǒng),利用其硬件并將其深深地定制到用戶應(yīng)用它的不同領(lǐng)域。這在2018年的GTC上得到了充分證明,該公司為其深度學(xué)習(xí)客戶推出了許多有趣的新硬件,軟件,應(yīng)用程序和生態(tài)系統(tǒng)公告。
新型DGX-2深度學(xué)習(xí)超級計算機(jī)
在宣布將V100 GPU內(nèi)存增加一倍至32GB之后,Nvidia推出了DGX-2,這是一款深度學(xué)習(xí)優(yōu)化的服務(wù)器,包含16個V100和一個名為NVSwitch的新型高性能互連。該DGX-2提供2個千萬億次計算能力,并提供顯著成本和能源節(jié)約相對于傳統(tǒng)的服務(wù)器架構(gòu)。在具有挑戰(zhàn)性的代表性任務(wù)中,DGX-2在一天半內(nèi)訓(xùn)練了一個FairSeq神經(jīng)機(jī)器翻譯(NMT)模型,與上一代DGX-1的15天相比。
深度學(xué)習(xí)推理和TensorRT 4
推理(使用DL模型與訓(xùn)練他們)是Nvidia首席執(zhí)行官Jensen Huang的重點(diǎn)關(guān)注領(lǐng)域。在他的主題演講中,Huang談到了AI模型復(fù)雜性的迅速增加,并提供了一個思考數(shù)據(jù)中心和邊緣推理系統(tǒng)需求的助記符:PLASTER,可編程性,延遲,準(zhǔn)確性,大小,吞吐量,能量/效率和學(xué)習(xí)率。為了滿足這些需求,他宣布推出TensorRT 4,這是用于優(yōu)化GPU核心推理性能的Nvidia軟件的最新版本。
新版TensorRT已與TensorFlow集成,還包括對ONNX互操作性框架的支持,允許與使用PyTorch,Caffe2,MxNet,CNTK和Chainer框架開發(fā)的模型一起使用。Huang還強(qiáng)調(diào)了新版本的性能提升,包括TensorFlow-TensorRT與TensorFlow相比性能提升8倍,某些網(wǎng)絡(luò)架構(gòu)的CPU吞吐量提高了45倍。
新的Kubernetes支持
Kubernetes(K8s)是一個開源平臺,用于編排公共云和私有云上的工作負(fù)載。它來自Google,并且發(fā)展非常迅速。雖然大多數(shù)Kubernetes部署都專注于Web應(yīng)用程序工作負(fù)載,但該軟件在深度學(xué)習(xí)用戶中越來越受歡迎。(查看我對Matroid的Reza Zadeh和OpenAI的Jonas Schneider的采訪了解更多。)
到目前為止,使用GPU非常令人沮喪。根據(jù)官方的K8s文檔,“在v1.6中增加了對NVIDIA GPU的支持,并且經(jīng)歷了多次向后兼容的迭代。”哎呀!Nvidia希望其新的GPU設(shè)備插件(在Huang的主題演講中令人困惑地稱為“Kubernetes on GPU”)將允許工作負(fù)載更輕松地針對Kubernetes集群中的GPU。
新應(yīng)用程序:Project Clara和Drive Sim
結(jié)合其在圖形和深度學(xué)習(xí)方面的優(yōu)勢,Nvidia分享了它開發(fā)的幾個有趣的新應(yīng)用程序。Project Clara能夠創(chuàng)建豐富的醫(yī)學(xué)影像電影渲染,讓醫(yī)生更容易診斷醫(yī)療狀況。令人驚訝的是,它在云中使用深度神經(jīng)網(wǎng)絡(luò)來增強(qiáng)傳統(tǒng)圖像,而無需更新目前安裝在醫(yī)療機(jī)構(gòu)的300萬個成像儀器。
Drive Sim是一款自動駕駛汽車的仿真平臺。已經(jīng)進(jìn)行了許多努力來使用模擬來訓(xùn)練用于自動駕駛汽車的深度學(xué)習(xí)模型,包括使用諸如俠盜獵車手之類的商業(yè)游戲。(事實(shí)上??,出于版權(quán)原因,GTA出版商已關(guān)閉了其中一些努力)。然而,在合成道路和城市景觀上訓(xùn)練學(xué)習(xí)算法并不是一個大問題。相反,挑戰(zhàn)一直是在合成道路上訓(xùn)練的模型并沒有很好地推廣到現(xiàn)實(shí)世界。
我與Nvidia首席科學(xué)家Bill Dally談到了這一點(diǎn),他說公司通過結(jié)合一些研究支持的技術(shù)看到了很好的概括:即在訓(xùn)練集中結(jié)合實(shí)際數(shù)據(jù)和模擬數(shù)據(jù),并使用領(lǐng)域適應(yīng)技術(shù),包括這個來自NIPS 2017基于耦合的GANS。(另請參閱第一次TWiML在線聚會上發(fā)表的相關(guān)Apple論文的討論。)
令人印象深刻的是,就像Nvidia宣布為深度學(xué)習(xí)用戶所做的那樣,會議和主題演講也提供了大量的圖形,機(jī)器人和自動駕駛汽車用戶,以及醫(yī)療保健,金融服務(wù)和石油等行業(yè)的用戶和天然氣。
正如我之前所寫的那樣,Nvidia在深度學(xué)習(xí)硬件領(lǐng)域并非沒有挑戰(zhàn),但該公司似乎正在做所有正確的事情。我期待看到公司能夠在未來12個月內(nèi)實(shí)現(xiàn)這一目標(biāo)。
這個故事最初出現(xiàn)在 本周的機(jī)器學(xué)習(xí)和人工智能 新聞通訊中。版權(quán)2018。
Sam Charrington是播客 本周機(jī)器學(xué)習(xí)和人工智能 (TWiML&AI)以及CloudPulse Strategies創(chuàng)始人的 主持人。