深度学习是一类对计算资源有着高度要求的领域,而 GPU 的选择将从根本上决定你的深度学习体验。如果没有 GPU,你可能需要等上几个月才能拿到实验结果,或者在单一实验步骤上耗费整整一天乃至更久,甚至有可能在苦等许久之后只得到“所选参数关闭”以及模型分歧等错误。
有了良好且可靠的 GPU,我们将能够对深层网络的设计方案与参数进行快速迭代,且能够将原本长达数月或者数天的处理过程压缩至数小时甚至数分钟。因此,在购买 GPU 时做出正确的选择对深度学习而言至关重要。
Time Dettmers 是瑞士卢加诺大学信息学硕士,热衷于开发自己的 GPU 集群和算法来加速深度学习。以下是他对包括 2018 年薪发布的 RTX GPU 的选型与建议。
总的来说,我认为选择 GPU 有两个主要策略:首先,使用 RTX 20 系列 GPU 进行快速升级,或者使用便宜的 GTX 10 系列 GPU,并在 RTX Titan 上市后进行升级。如果你对性能要求不高,例如对于 Kaggle、初创公司、原型设计或学习深度学习,廉价的 GTX 10 系列 GPU 就可以让你受益匪浅。如果你选择 GTX 10 系列 GPU,请确认 GPU 内存大小可以满足你的要求。
具体选择推荐如下:
- 整体最佳:GPU:RTX 2080 Ti
- 经济实惠但价格昂贵:RTX 2080,GTX 1080
- 经济实惠且便宜:GTX 1070,GTX 1070 Ti,GTX 1060
- 数据集> 250GB:RTX 2080 Ti 或 RTX 2080
- 不差钱:GTX 1060(6GB)
- 穷:GTX 1050 Ti(4GB)或 CPU(原型设计)+ AWS / TPU(训练)
- Kaggle 竞赛:GTX 1060(6GB)用于原型设计,AWS 用于最终训练;使用 FastAI 库
- 有竞争力的计算机视觉研究员:GTX 2080 Ti;在 2019 年升级到 RTX Titan
- 研究员:RTX 2080 Ti 或 GTX 10XX – > RTX Titan —— 检查当前型号的内存要求
- 想构建一个 GPU 集群:这非常复杂,参见该文章
- 认真想学深度学习的人:用 GTX 1060(6GB)或便宜的 GTX 1070 或 GTX 1070 Ti 起步
- 就是想尝试一下深度学习的人:GTX 1050 Ti(4 或 2GB)最重要的建议