您現(xiàn)在的位置是:首頁 >互聯(lián)網(wǎng) > 2021-01-15 11:24:40 來源:
Databricks的MLflow機器學(xué)習(xí)工具包增加了對R語言的支持
大數(shù)據(jù)公司Databricks Inc. 今天更新了其MLflow機器學(xué)習(xí)工具包,以支持R編程語言和旨在提高其實用性的其他新功能。
Databricks 僅在6月才發(fā)布MLflow,以幫助標準化開發(fā)流程并將機器學(xué)習(xí)應(yīng)用程序投入生產(chǎn)。該公司認為,訓(xùn)練機器學(xué)習(xí)算法的過程在很大程度上是不一致的,并且?guī)缀鯖]有可用的工具來再現(xiàn)結(jié)果,跟蹤實驗和管理模型。
MLflow旨在幫助公司更好地打包他們的機器學(xué)習(xí)代碼,執(zhí)行,測試它并將其部署到生產(chǎn)中。通過標準化跨通用部署方法的現(xiàn)有ML工具包和框架,它使開發(fā)人員可以完全控制端到端管理機器學(xué)習(xí)培訓(xùn)生命周期。
“ MLflow是一個統(tǒng)一的工具包,用于以可重復(fù)的方式開發(fā)機器學(xué)習(xí)應(yīng)用程序,同時具有在多個云環(huán)境中可靠地在生產(chǎn)環(huán)境中進行可靠部署的靈活性,” MLflow啟動時,Databricks首席技術(shù)專家Matei Zaharia說。
通過今天的更新,Databricks與RStudio Inc.合作,后者為R提供了開源和集成開發(fā)環(huán)境,以幫助集成編程語言。現(xiàn)在,使用RStudio和R來構(gòu)建新應(yīng)用程序的大型數(shù)據(jù)科學(xué)家社區(qū)都可以使用MLflow。
RStudio首席執(zhí)行官JJ Allaire在一份聲明中說:“ R與MLflow的集成將允許更廣泛的社區(qū)使用并為MLflow做出貢獻,從而大大拓寬該項目的范圍。”
除R外,MLflow還獲得對編程語言(包括Python,Java和Scale)的支持,以及一個REST服務(wù)器接口,使其可以與其他語言一起使用。
MLflow還與流行的機器學(xué)習(xí)庫和框架集成在一起,例如SciKit-Learn,TensorFlow,Keras,PyTorch,H2O和Apache Spark Mllib,Databricks說。
最后,Databricks添加了對MLflow工具包的跨云支持,這意味著使用它構(gòu)建的模型可以部署在云服務(wù)上,例如Microsoft Corp.的Azure ML平臺,Amazon Web Services Inc.的SageMaker和Databricks自己的Unified數(shù)據(jù)分析平臺。
公司官員說:“ MLflow利用了AWS S3,Google Cloud Storage和Azure Blob Storage,使團隊可以輕松地跟蹤和共享其代碼中的工件。”
“使用MLflow,數(shù)據(jù)科學(xué)團隊可以跨框架系統(tǒng)地打包和重用模型,在本地或云中跟蹤和共享實驗,并在幾乎任何地方部署模型,” Zaharia在一份新聲明中補充說。“我們從數(shù)據(jù)科學(xué)界看到的一連串的興趣和貢獻證實了對開放源代碼框架以簡化機器學(xué)習(xí)生命周期的需求。”