模型量化(4): Pytorch 量化工具包介绍
创始人
2025-05-30 08:46:02

1. pytorch quantization介绍

在实际开发过程中,单独开发量化的工具进行PTQ或者QAT量化,同时去适配TensorRT, onnxruntime,openvion等推理引擎。Pytorch官方推出了量化工具:Pytorch Quantization库,方便大家使用。

在这里插入图片描述
文档: pytorch-quantization’s documentation:https://docs.nvidia.com/deeplearning/tensorrt/pytorch-quantization-toolkit/docs/index.html

  • PyTorch Quantization是一个工具包,用于训练和评估具有模拟量化的PyTorch模型。PyTorch Quantization API支持将 PyTorch 模块自动转换为其量化版本。转换也可以使用 API 手动完成,这允许在不想量化所有模块的情况下进行部分量化。例如,一些层可能对量化比较敏感,对其不进行量化可提高任务精度。
  • PyTorch Quantization的量化模型可以直接导出ONNX,并由TensorRT 8.0或者更高版本导入进行

相关内容

热门资讯

魏建军回应“九年八换CEO”:... 出品丨虎嗅汽车组作者丨魏微头图丨长城汽车“有人说我们(魏牌)换了不少的CEO了,的的确确是这么回事,...
东方雨虹子公司疑遭电诈被骗逾千... 12月23日晚,东方雨虹公告,公司近日获悉,公司下属美国全资子公司OYH建材公司疑遭电信诈骗,涉案金...
造孽,挖了个大大坑 图: Antоn Gudim 年底了。 我一个女朋友给我晒她的账户,她买了几个ETF,基本都持有3-...
21天翻倍!溢价近60%,白银... 白银的火热,正以一种近乎疯狂的方式在二级市场上演。12月23日,国投白银LOF再度斩获涨停,实现两连...
快手不是我朋友 马上就要元旦了,那一天不但有元旦,还有新修订的《中华人民共和国治安管理处罚法》。那里面不但有前一段热...