英特尔推Extension for Transformers工具包大模型推理性能提升40倍

来源：网络　浏览：34次　时间：2023-11-30

11月30日消息:在当前技术发展的背景下，英特尔公司推出的Extension for Transformers工具包成为一个重要创新，实现了在CPU上对大型语言模型（LLM）推理性能的显著加速。该工具包通过LLM Runtime技术，优化了内核，支持多种量化选择，提供更优的KV缓存访问和内存分配策略，使得首个token和下一个token的推理速度分别提升多达40倍和2.68倍。这一技术的推出，极大地满足了不同场景对于LLM推理性能的需求。

项目地址:https://github.com/intel/intel-extension-for-transformers

在性能测试方面，通过与llama.cpp进行比较，LLM Runtime在输入大小为1024时能够实现3.58到21.5倍的性能提升，而在输入大小为32时，提升为1.76到3.43倍。同时，工具包还通过验证了多个模型的INT4推理准确性，表明在性能提升的同时准确性损失微小。

然而，不仅仅是性能的提升，工具包还在聊天场景中应用方面取得了显著成果。通过引入流式LLM技术，解决了对话历史、输出长度有限和效率低下等应用难题，使得LLM在聊天场景中更加实用。这一技术的特性，包括对话历史的纳入和输出长度的优化，使得工具包在解决聊天场景难题方面具有先进性和前瞻性。

英特尔® Extension for Transformers工具包在大型语言模型推理性能的提升以及聊天场景应用方面的创新成果，标志着对于人工智能领域的进一步推动。通过不断引入先进的技术和解决实际问题的能力，该工具包展现了英特尔在人工智能领域的领先地位，为未来的发展提供了强有力的支持。

上一篇： ChatGPT发布一周年了，开源大模型都迎头赶上了吗？
下一篇： Kimi Chat官网体验入口 AI智能聊天机器人免费软件app下载(kimico)

推荐站点

88分类目录
88分类目录专业提供网站网址免费提交收录,88分类目录是采用开放导航式的网站大全,收录国内外各行业优秀的网站网址,让网站在各大搜索引擎收录快排名靠前。
www.88dir.com
66网站目录
66网站目录是免费收录各行业优秀网站,提供网站分类目录检索,关键字搜索,提交网站即可免费推广,增加外链,提升网站流量。
www.66dir.com
265分类目录
网址目录网站网址大全,收集正规的中文官方网站,用户自主提交网站,265分类目录努力打造互动新颖的网站分类目录导航收录平台
www.265dir.com
YY分类目录
YY分类目录全人工编辑的开放式网站分类目录，收录国内外、各行业优秀网站，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.yydir.com
名人百科网
名人百科网(mrenbaike.net)--为大家提供各行各业的名人资料、资讯、图片等,致力于打造国内专业的名人百科平台！
www.mrenbaike.net
菜鸟教程
菜鸟教程提供了基础编程技术教程。菜鸟教程的 Slogan 为：学的不仅是技术，更是梦想！记住：再牛逼的梦想也抵不住傻逼似的坚持！本站域名为 runoob.com, runoob 为 Running Noob 的缩写，意为：奔跑吧！菜鸟。本站包括了HTML、CSS、Javascript、PHP、C、Python等各种基础编程教程。同时本站中也提供了大量的在线实例，通过实例，您可以更好地学习如何建站。本站致力于推广各种编程语言技.
www.runoob.com
中国社会公益网
陕西省社会公益基金会是经陕西省民政厅批准的公募基金会，下设秘书处、公益项目部、筹款募捐部、宣传策划部、社会活动部、专项基金部、资金管理部、公关联络部、青年志愿者工作委员会、青年志愿者爱心乐团等部门机构
www.cpf.net.cn
CNMO科技新媒体
CNMO=Connect More,致力于通过内容成为人与科技、人与产品、人与品牌、人与服务对接的桥梁,让产业、产品的价值与服务得到专业且有趣的解读和适配,引领用户畅享科技带来的美好生活!
www.cnmo.com
国外主机测评
国外主机测评，国外VPS、云服务器，国外服务器，国外主机的相关优惠信息、商家背景、网络带宽、线路走法、售前和售后技术支持等，是目前最好的一家国外主机评测平台。
www.zhujiceping.com

英特尔推Extension for Transformers工具包 大模型推理性能提升40倍

推荐文章

推荐站点

英特尔推Extension for Transformers工具包大模型推理性能提升40倍