硬核科普|深度学习主流开发框架解读和比较(中篇)
专题推荐:金博士AI技术干货分享
【资料图】
文章推荐:硬核科普|深度学习主流开发框架解读和比较
本文的知识点
通过本文,读者可以从中学习和掌握的关键知识点,包括:
1. 深度学习框架:了解不同的深度学习框架,如PyTorch、TensorFlow和Keras,并理解每个框架的特定优势和使用场景。
2. 每个框架的技术细节:了解每个框架的技术规格,如所用的编程语言、操作的API级别,以及架构类型
3. 性能比较:理解这些框架在性能上的差异,如速度和处理大数据集的能力,例如Keras适合较小的数据集,而PyTorch和TensorFlow适合处理大数据集并提供高性能。
4. 如何选择合适自己或行业的框架:学习在选择深度学习框架时应考虑的因素,如数据集的大小和类型、可用性的模型集,社区支持以及部署相关的流程和工具等。
大应用对开发框架的要求
PyTorch 和 TensorFlow 都有其独特的开发历程和复杂的设计决策历史。之前,这使得比较两者变得是一个关于它们当前特点和未来特点的复杂技术讨论。鉴于两个框架自从创立以来都已迅速成熟,许多这些技术差异现在已经不再重要。
幸运的是,对于那些不希望听得昏昏欲睡的人来说,当前的 PyTorch 与 TensorFlow 的争论主要围绕三方面实践所需考虑的因素:
1. 模型可用性:随着深度学习领域的逐年扩大和模型相应地变得更大,从零开始训练最先进的模型已经不再可行。幸运的是,现在有许多最先进的模型公开可用,使用它们在可能的地方很重要。
2. 部署基础设施:如果训练出的性能良好的模型不能被利用,那训练它们就没有意义。降低部署时间至关重要,尤其是随着微服务业务模型越来越受欢迎;高效的部署有可能决定许多以机器学习为中心的业务的成败。
3. 生态系统:深度学习不再只是在高度控制的环境中的特定用例。AI正在为众多行业注入新的能量,因此,一个位于更大生态系统中的框架,可以为移动设备、本地和服务器应用程序提供开发支持变得很重要。此外,专用机器学习硬件的出现,如 Google 的 Edge TPU,意味着成功的实践者需要使用能够与这种硬件很好地集成的框架。
我们将依次探讨这三个实际考虑因素,然后提供我们对在不同领域使用哪个框架的建议。
模型可用性比较
从零开始实现一个成功的深度学习模型可能是一项非常棘手的任务,特别是对于如 NLP 这样的应用,其中工程和优化都很困难。SOTA(State-of-the-Art,最新的、最先进的)模型日益复杂,这对于小规模企业来,模型训练和微调都不太实际,甚至近乎不可能。初创公司和研究人员都没有计算资源来自己利用和探索这样的模型,因此,能够使用预训练模型进行迁移学习、微调或开箱即用的推理就显得非常宝贵了。
在模型可用性方面,PyTorch 和 TensorFlow 有着明显的差异。PyTorch 和 TensorFlow 都有自己的官方模型仓库,我们将在下面的生态系统部分探讨,但实践者可能希望使用其他来源的模型。
我们下面从三个维度来比较模型可用性:1)在 HuggingFace 上公开的模型所支持的框架类型数量, 2)出版的科研论文其研究所基于的框架类型, 3)基于网站 Paper-with-Code,对提供代码的论文所采用的框架类型进行统计分析。
HuggingFace
HuggingFace 是一家领先的人工智能公司,致力于开发和提供一流的自然语言处理(NLP)技术。它是名为Transformers库的开发者,该库是一个开源项目,提供了各种最新的深度学习模型,如BERT、GPT-2、GPT-3和T5等,供研究人员和开发者使用。这些模型广泛应用于文本分类、信息抽取、语义理解、自然语言生成等任务。
HuggingFace的Transformers库是NLP领域的一个重要资源,提供了丰富的预训练模型和相关工具,帮助开发者和研究人员简化开发过程,快速实现各类NLP任务。此外,Transformers库也是一个活跃的社区,研究者和开发者可以在其中相互学习,分享知识和经验。
除了Transformers库,HuggingFace还提供了一个在线模型库,用户可以在其中找到、分享和使用各种预训练模型。此外,HuggingFace还开发了一些其他工具,如Datasets库,这是一个开源的数据集库,用于处理和加载各种NLP数据集。总的来说,HuggingFace是推动当前NLP领域发展的重要力量,为研究和应用提供了极大的便利。
HuggingFace可以让你只用几行代码就将训练有素、调整优化过的 SOTA 模型纳入你的开发流程中。
当我们比较 HuggingFace 对 PyTorch 和 TensorFlow 模型的可用性时,结果有点令人惊讶。下面我们看到的是在 HuggingFace 上可用的模型总数的图表,这些模型要么仅限于 PyTorch 或 TensorFlow,要么适用于两种框架。可以看到,只能在 PyTorch 中使用的模型数量绝对压倒了竞争对手。几乎有92% 的模型仅支持 PyTorch,比2022 年的 85% 还要多。相反,只有大约 8% 的模型仅支持 TensorFlow,所有可用模型中只有大约 14% 支持 TensorFlow ,比2022年的 16%还要少。此外,2022 年新增了超过4.5 万个仅支持 PyTorch 的模型,而只增加了约 4 千个仅支持 TensorFlow 的模型。
图 1 HuggingFace 上的模型数量
如果我们把注意力集中在 HuggingFace 最受欢迎的 30 个模型上,我们会看到有趣的结果。所有模型都可在 PyTorch 中使用,和去年一样,没有任何模型只支持 TensorFlow。不过同时支持两种框架的模型数量已经从 19 增加到 23。
图 2 HuggingFace 上排名前 30 的模型
研究论文
关键词:
相关阅读
-
硬核科普|深度学习主流开发框架解读和比...
专题推荐:金博士AI技术干货分享文章推荐:硬核科普|深度学习主流开发 -
PPT | 2023年中国虚拟电厂行业研究报告
虚拟电厂VPP研究范畴界定虚拟电厂既是电力交易市场的重要组成,也是能 -
法拉利表示:超25%中国买家为女性
据外媒报道,在中国街头,每四辆法拉利汽车中,就有一辆是由女性驾驶的 -
哈密瓜地区区别?
哈密瓜在不同的地区生长,受到不同环境因素的影响,因此存在一些区别: -
侵权杨幂商家被限消 商家侵权杨幂被限消
天眼查App显示,近日,因未按执行通知书指定的期间履行生效法律文书确 -
3C品类受挫 阿里自营业务寻找新增长
猫享自营店首页,店内仅有少量产品在售 商报记者王彬彬实习生陈中明 -
热火晒韦德篮球生涯成就:3总冠军75大球...
北京时间8月11日,热火官方晒出韦德篮球生涯成就,庆祝韦德即将进入名 -
江西省乐平市发布高温橙色预警
乐平市气象台2023年08月11日09时18分发布高温橙色预警信号:预计未来24 -
数字人民币绿色贷款 广东首笔已发出 ...
数字人民币绿色贷款广东首笔已发出将扩大应用场景,邮储,央行,广东,信贷 -
中药板块异动拉升 众生药业涨超7%
中药板块异动拉升,众生药业(002317)涨超7%,万年青)href= 301111粤 -
迎酷暑、战高温,炎炎夏日送清凉
炎炎夏日送清凉丝丝关怀暖人心持续高温闷热天气给坚守一线的工作人员带 -
甘肃省清水县发布暴雨黄色预警
清水县气象台2023年08月11日09时02分发布暴雨黄色预警信号:目前我县松 -
商务部发布电子商务示范企业名单
App8月8日消息,商务部公告,确定北京京东世纪贸易有限公司、北京快手 -
“律师未到庭,庭审已结束”?来宾中院...
近日,“冯波律师涉黑案”因辩护律师未进入法庭参加庭审在网上引发... -
只是近黄昏的全诗_只是近黄昏
1、唐·李商隐《登乐游原》[原作]向晚意不适,驱车登古原 夕阳无限... -
洛阳销毁近1吨过期药品
我市回收的近1吨过期药品已经全部销毁!昨日上午,在位于新郑市的河南 -
Canalys:Q2全球云基础设施服务支出增长...
Canalys发布的数据显示,2023年第二季度,全球云基础设施服务支出增长1 -
东方雨虹(002271)零售与多品类增长良好...
事项:公司发布2023年半年报,实现营收168 5亿元,同比增长10 1%,归母 -
7月份甘肃省法定传染病疫情公布
8月10日,甘肃省卫生健康委通报了7月份全省法定传染病疫情。通报显示: -
台盟市委赴黔调研
本报讯(通讯员刘绍川)8月3日至6日,围绕“数字经济发展”主题,台...