算法效率系列
技术来源:
PyTorch 官方文档:https://docs.pytorch.ac.cn/tutorials/recipes/recipes/tuning_guide.html
阿里云社区:https://developer.aliyun.com/article/1661613
知乎博文:
A:
https://zhuanlan.zhihu.com/p/359720877
B:
https://zhuanlan.zhihu.com/p/538605620
C:
https://zhuanlan.zhihu.com/p/345279772
D:
https://zhuanlan.zhihu.com/p/595318436
个人博客:
A:
https://sebastianraschka.com/blog/2023/pytorch-faster.html)
B:
C:
涉及的方案及实验:
混合精度、编译优化、深度可分离卷积、向量维度对齐、内存分配器、Last Channel、卷积偏置的去除、CUDNN 自动调优器、推理模式、算子融合、梯度 None 替代归零、Trainer and Fabric、Dataset/DataLoader 相关、其余优化方案(未实验未确定不常用)
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Ephemeral!