
近日,由中国电信云计算研究院团队独立完成的论文《Mercury:TowardsOptimalAccuracy-LatencyTrade-offforCollaborativeTransformerinference》被计算机网络与分布式系统领域的顶级国际会议IEEEINFOCOM2026录用。该工作由研究员梁雨萌、常建慧、臧明远及实习生李斯嘉在中国电信首席科学家、云计算研究院院长吴杰教授的指导下完成炒股配资网站识必选,聚焦VisionTransformer(ViT)在资源受限移动设备上的推理性能瓶颈,创新提出低时延、高性能的端云协同解决方案,进一步夯实中国电信在云边端智能协同领域的技术优势。
IEEEInternationalConferenceonComputerCommunications(INFOCOM)是国际通信与网络领域的顶级学术会议,位列中国计算机学会(CCF)A类列表,与SIGCOMM、MobiCom、NSDI并称为计算机网络领域四大顶会。本次会议共收到全球1740篇高水平论文投稿,录用329篇,录用率约为18.9%。
ViT凭借卓越性能,已成为智能监控、移动视觉分析等IoT应用的核心支撑,但模型庞大的计算量与移动设备有限的算力、能耗形成尖锐矛盾。端云协同推理虽为有效方案,却面临ViT各层token规模固定导致的移动端负载过重、早期token修剪降低精度显著,以及有限无线带宽导致传输时延高的挑战。

图1Mercury框架图
针对上述痛点,该论文提出Mercury框架,构建“移动端高效修剪,云端轻量重构”的端云协同新范式。其核心创新包括:一是相似性驱动的区域分散token修剪技术,在移动端ViT初始层单轮大规模修剪,仅保留各图像区域语义代表性最强的token,减轻端侧负担;二是元参数驱动的低开销token重构技术,在云端以轻量化方式恢复语义特征,避免引入复杂开销。
实验证明,Mercury相比主流方法能够实现最高2.27倍的推理加速,移动端能耗减半,且保持与原生模型相当的推理精度,高带宽波动场景下端到端时延比现有方案降低26%,对复杂网络环境的适应性极强。该成果为ViT在IoT场景规模化部署提供关键支撑,可广泛应用于智能安防、边缘AI监控等实时性要求高、资源受限的场景。依托中国电信“息壤”算力调度平台优势,Mercury有望进一步赋能千行百业智能升级,推动端云协同推理技术广泛落地,提供高可靠、低时延的智能泛在云服务。
本次论文入选IEEEINFOCOM2026炒股配资网站识必选,标志着团队在云边端协同领域的技术创新得到国际学术界的高度认可,也彰显了中国电信在“云改数转智惠”战略指引下,持续深耕前沿技术、赋能高质量发展的坚定决心。
联美配资提示:文章来自网络,不代表本站观点。