- N +

PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率

PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率原标题:PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率

导读:

电影传说顶着成龙的名号上映天票房却只有万豆瓣评分更是低至延续了成龙近些年来的烂片成绩岁的成龙这个曾经被片方当作噱头来吸引观众入场的技术之家月日消息据新闻稿旗下架构优化库现已正式...

电影《传说》顶着成龙的名号,上映7天票房却只有7279万,豆瓣评分更是低至5.4,延续了成龙近些年来的烂片成绩。27岁的AI成龙,这个曾经被片方当作噱头来吸引观众入场的技术

IT之家 10 月 2 日消息,据 PyTorch 新闻稿,PyTorch 旗下架构优化库 torchao 现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和 RAM 用量,从而提升模型运行效率,IT之家附 GitHub 页面地址(点此访问)。

据介绍,torchao 提供了一系列优化工具集,可以帮助 LLaMA 3 等流行的 AI 模型提升性能,其支持 flo 8、int4 等低精度数据类型,能够有效减少硬件开销和 RAM 用量。

举例,在 LLaMA 3 70B 模型的预训练中,torchao 提供的 flo 8 训练流程可将模型计算速度提升 1.5 倍。开发者只需利用 convert_to_flo 8_training 函数,即可将模型训练转换为 flo 8,从而轻松实现模型 训练。

在推理方面,torchao 提供多种量化方法,包括权重量化(Weight-Only Quantiz ion)和动态 量化(Dynamic Activ ion Quantiz ion),用户可以自有选择适合的量化策略,以获得最佳的模型推理性能。

PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率

在稀疏性优化方面, torchao 可以优化模型参数计算效率,据称可让 ViT-H 模型的推理速度提升 5%。torchao 还可以将权重量化为 int4,并将键值缓存量化为 int8,可令 LLaMA 3.1 8B 在完整的 128K 上下文长度下仅占用 18.9GB 的显存

返回列表
上一篇:
下一篇: