俗话说:工欲善其事,必先利其器!在开始深度学习之前,选择一个合适的框架,不仅让你赢在起跑线,更能够令你事半功倍。
话不多说,接下来小课给大家介绍介绍目前市面上流行的几款深度学习框架!
Caffe
和TensorFlow名气一样大的是深度学习框架Caffe,由加州大学伯克利的Phd贾扬清开发,全称是Convolutional Architecture for Fast Feature Embedding,是一个清晰而高效的开源深度学习框架,目前由伯克利视觉学中心(Brekeley Vision and Learning Center)进行维护。
从其名字就可以看出它对卷积网络的支持特别好,同时也是用C++写的,但是并没有提供Python接口,只提供C++的接口。
Caffe之所以流行,是因为之前很多ImageNet比赛里面使用的网络都是用Caffe写的,所以如果你想使用这些比赛里面的网络模型就只能使用Caffe,这也就导致了很多人直接转到Caffe这个框架下面。
Caffe的缺点是不够灵活,同时内存占用高,只提供C++接口。目前Caffe的升级版本Caffe2已经开源了,修复了一些问题,同时工程水平得到了进一步提供。
TensorFlow
Google开源的TensorFlow,这是一款使用C++语言开发的开源数学计算软件,使用数据流图(Data Flow Graph)的形式进行计算。图中的节点代表数学运算,而图中的线条标识多维数据数组(tensor)之间的交互。TensorFlow灵活的架构可以部署在一个或多个CPU、GPU的台式及服务器中,或者使用单一的API应用在移动设备中。TensorFlow初是由研究人员和Google Brain团队针对机器学习和深度神经网络进行研究而开发的,目前开源之后几乎可以在各种领域使用。
目前TensorFlow是全世界使用人数多、社区为庞大的一个框架,因为Google公司出品,所有维护和更新也比较频繁,并且有着Python和C++的接口,教程也非常完善。同时很多论文复现的第一个版本都是基于TensorFlow写的,所以是深度学习界框架默认的老大。
由于其语言太过于底层,目前有很多基于TensorFlow的第三方抽象库将TensorFlow的函数进行封装,使其变得简洁。目前比较有名的几个是Keras、Tflearn、tfslim以及TensorLayer。
Theano
Theano于2008年诞生于蒙特利尔理工学校,其派生出来大量深度学习Python软件包,著名的包括Blocks和Keras。Theano的核心是一个数学表达式的编译器,他知道如何获取你的结构,并使之成为一个使用numpy、高效本地库的高效代码,如BLAS和本地代码(C++),在CPU或GPU上尽可能快地运行。它是为深度学习中处理大型神经网络算法所学的计算而专门设计的,是这类库的首创之一(发展始于2007年),被认为是深度学习研究和开发的行业标准。
但目前开发Theano的研究人员大多去了Google参与TensorFlow的开发,所以从某种程度来讲TensorFlow就像是Theano的孩子。
Torch
Torch是一个有大量机器学习算法支持的科学计算框架,其诞生已经有十年之久,但真正起势得益于Facebook开源了大量的Torch的深度学习模块和扩展。Torch的特点在于特别灵活,但是另外一个特殊之处是采用Lua,在目前深度学习大部分以Python为编程语言的大环境之下,一个以Lua为编程语言的框架有着更多的劣势,这一小众语言增加了学习使用Torch这个框架的成本。
PyTorch的前身便是Torch,其底层和Torch框架一样,但是使用Python重写了很多内容,不仅更加灵活,支持动态图,也提供了Python接口。
PyTorch
PyTorch是由Torch7团队开发的,从名字就可以看出,它跟Torch的不同之处在于PyTorch使用了Python作为开发语言。所谓“Python first”,同样说明它是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络,这是现在很多驻留框架比如TensorFlow等都不支持的。
PyTorch既可以看做加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。
特点
PyTorch有以下特点:
支持GPU
动态神经网络
Python优先
命令式体验
轻松扩展
MXNet
MXNet的主要作者是李沐,早就是几个人抱着纯粹对技术和开发的热情做起来的兴趣项目,如今成为了亚马逊的官方框架,有着非常好的分布式支持,而且性能特别好,占用显存低,同时其开发的语言接口不仅仅有Python和C++,还有R、MATLAB、Scala、JavaScript等等,可以说能够满足使用任何语言的人。
但MXNet的缺点也很明显,教程不够完善,使用的人不够多导致社区不大,同时每年很少有比赛和论文是基于MXNet实现的,这就使得MXNet的推广力度和知名度不高。
除了上述介绍的框架,目前流行的深度学习框架还有很多很多,如Apache MXnet、Microsoft Cognitive Toolkit、DeepLearning4J等等。
研究者们使用各种不同的框架来达到不同的研究目的,很难说哪种好哪种不好。这也从侧面印证了深度学习领域真的是万紫千红、百花齐放。相信通过我的介绍,让你对深度学习的框架做到心中有数,能够选择好自己手中的格斗武器。