华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。 在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。 推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。 据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。 责任编辑:郭栩彤 海量资讯、精准解读,尽在新浪财经APP
- 最近发表
- 随机阅读
-
- 《侏罗纪世界:重生》今日上线流媒体 票房超7.6亿美元
- 2025精英童模超级联赛特邀主持人周杨 荣获礼服赛冠军
- 电影《长安的荔枝》郑州路演全场齐呼“太中了”大鹏白客庄达菲刘俊谦常远给“荔”互动
- 仓库主管半年工作总结合集8篇
- 心中有爱,小剪刀传递大温暖
- 高温+暴雨+强对流三预警齐发 这些区域需防范8级以上雷暴大风
- 扩大文旅服务产业发展朋友圈!长宁区文旅行业党建联盟暨“虹桥文旅荟”成立
- 2023年中考英语作文范文
- 名人励志故事:宋濂读书
- 山东好汉喝酒的喝法
- 我的错误 My Fault
- 森林保险上半年工作总结
- 药明合联2025年上半年财报:业务强劲增长,高质量盈利,持续巩固行业龙头地位
- 泥泞的路才能留下脚印
- 写作方法:古今纵横选材
- 王贷晨和龚仪婕分获长三角马术青少年联赛100CM公开组和青少年组冠军
- 泥泞的路才能留下脚印
- 【七月浅谈】生命的价值
- 仓库主管半年工作总结合集8篇
- 网飞公布真人剧集《海贼王》第二季剧照 预计2026年上线
- 搜索
-
- 友情链接
-
- 吃不完的车厘子怎么保存
- 药品可以寄到国外吗
- 击剑是什么梗污
- 6英寸是多少厘米蛋糕够几个人
- 粉皮怎么做
- 适合在家做的有氧运动
- 螃蟹流出来的黄东西是什么
- 男士衬衫39相当于什么尺码
- 最近有什么绘画比赛
- 最近有什么绘画比赛
- 在开学前夕倍感压力,应该如何克服?
- 你家里有没有小霉点?这些防霉妙招请收!
- “悟空”爆火!专家提醒:当心光敏性癫痫
- 法甲夺冠赔率:巴黎断档领先 摩纳哥马赛争2
- 精选双色球:缪彭明中一等877万!仨专家中118万
- 新疆霍尔果斯口岸客流爆棚!互免签证助力跨境游
- 八部门:探索建立长江经济带重点行业企业和个人碳账户
- 我国建造最大国际海洋油气平台完工交付
- 东盟智运会云南越南棋手个人折桂 泰国队获团体冠军
- 裸眼3D、VR齐上阵 博博会展现博物馆数智融合新成果