- N +

Intel首批通过AISBench大模型性能测试!5代至强可达每秒2493 token

Intel首批通过AISBench大模型性能测试!5代至强可达每秒2493 token原标题:Intel首批通过AISBench大模型性能测试!5代至强可达每秒2493 token

导读:

三言科技月日消息月日淘宝宣布自年月日正式向平台卖家收取基础软件服务费费率具体收费细则为对交易状态为交易成功即买家完成确认收货的订单淘&...

三言科技 7月27日消息,7月26日,淘宝宣布自2024年9月1日正式向平台卖家收取基础软件服务费,费率0.6%。具体收费细则为:对交易状态为“交易成功”(即买家完成确认收货)的订单,淘宝按“成交额 x 0.6%”收取基础软件服务费。“成交额”是指“确认收货时交易订单的交易额(以平台交易系统记...

快科技9月5日消息,近日,第五代,以优秀的表现通过了中国电子技术标准化研究院组织的系统性能测试(AISBench)。

借此,英特尔也成为首批通过AISBench大语言模型(LLM)推理性能测试的企业。

在AISBench 2.0测试工具的评估下,第五代英特尔至强处理器在ChatGLM V2-6B(60亿参数)和Llama2-13B(130亿参数)两个模型上均展现了卓越的性能,能够满足轻量级大语言模型的实时推理要求。

Intel首批通过AISBench大模型性能测试!5代至强可达每秒2493 token

测试结果显示,在60亿参数的ChatGLM V2模型通用推理中,当输入输出序列为256时,处理器可达每秒2493 token的性能;当输入输出序列为2048时,性能为每秒926 token。

在130亿参数的Llama2模型通用推理中,当输入输出为256时,性能为每秒513 token;当输入输出序列为2048时,性能为每秒132 token。

AISBench 2.0的测试结果,验证了英特尔至强在运行轻量级大语言模型时展现出的优异推理性能。

也使得客户可以通过基于至强的服务器,构建一个通用AI系统进行数据预处理、模型推理和部署,从而获得兼具AI性能、效率、准确性和可扩展性的组合。

同时还彰显了英特尔至强可以为企业提供开箱即用”的功能,即可以在通用系统上部署一部分AI工作负载,从而为客户带来更佳的总体拥有成本(TCO)优势。

返回列表
上一篇:
下一篇: