PyTorch 是学术界和工业界用来研究和开发深度学习模型的常用工具之一,自 2016 年 9 月 PyTorch 在 GitHub 上开放了 pytorch alpha-1 版本以来,至今已有整整 6 年时间。从一开始只有 PyTorch 的 Tutorial 至今,很多网站和博客都介绍过 PyTorch 的安装和使用方法。
最近,国内的人民邮电出版社推出了一本关于 PyTorch 的教材《PyTorch 深度学习实战》,作者是:Eli Stevens,Luca Antiga,Thomas Viehmann,译者是:牟大恩。本书适用于学校的学生和想了解 PyTorch 的公司开发人员,通过学习这本书,大家都能够掌握使用 PyTorch 开发深度学习模型。
本书的章节分成三个部分:
- 第一部分:PyTorch 核心,介绍了深度学习的基础概念和一些简单的神经网络,张量等知识;
- 第二部分:使用现实数据来学习,包括肺癌的早期检测,训练分类器,增强学习,语义分割等知识;
- 第三部分:模型的部署,使用 Flask 服务来部署模型,导出模型等知识。
通常情况下,很多 Tutorial 和网络上的博客只会介绍前两部分,毕竟学会了前两部分就可以正常的开发模型,清洗数据。在学术界的绝大部分工作一般也只需要掌握前两部分,在工业界的一些 AI Labs 前两部分也能够满足绝大部分的需求。但是对于业务部门而言,只有前两部分的知识可能就不太够了,还需要有在线上部署模型,提供模型使用的能力。
在移动设备被大家大量使用的今天,很多情况下需要将模型部署在移动设备上,那么仅仅学会离线训练模型,进行数据的预测是远远不够的。有的情况下需要进行必要的模型压缩。除了 Python 之外,可能还需要掌握一些 C++ 的使用方法,同时掌握多个技能,才能够在工业界的业务部门完成各种各样的工作。
除了 Linux 和 macOS 之外,PyTorch 在 2018 年开始逐渐支持 Windows 系统。对于学生党而言,如果只有 Windows 系统,也能够基于现有的电脑进行深度学习的模型开发。
本书会教会读者如何使用 PyTorch 创建神经网络和深度学习系统,它帮助读者快速从零开始构建一个真实示例:肿瘤图像分类器。在构建模型过程中,它涵盖了整个深度学习管道的关键实践,包括 PyTorch 张量 API,用 Python 加载数据,监控训练以及将结果进行可视化展示。
本书主要内容会包括以下几个部分:
- 训练深层神经网络;
- 实现模块和损失函数;
- 使用 PyTorch Hub 预先训练的模型;
- 探索在 Jupyter Notebooks 中编写示例代码。
本书适用于对深度学习感兴趣的 Python 程序员,了解深度学习的基础知识对阅读本书有一定的帮助,但读者无须具有使用 PyTorch 或其他深度学习框架的经验。本书也有配套的 Python 源代码,方便读者进行下载和学习。