云计算研究院获ICME 2025唯一最佳论文奖,领奖者竟是她
云计算研究院获ICME 2025唯一最佳论文奖

作者/ IT时报记者 郝俊慧
编辑/ 郝俊慧 孙妍
7月3日,在法国南特,这座被誉为儒勒·凡尔纳故乡的城市,2025国际多媒体与博览会议(ICME 2025)颁奖仪式上,响起了一阵低沉的疑问:“这,究竟是谁代表中国电信?”台上的获奖者,是经过三轮严谨的匿名评审,从全球3737篇投稿中脱颖而出,最终夺得本届唯一“最佳论文奖”的青年才俊常建慧。她的所属单位,赫然标注着“中国电信”。
ICME,作为图像、视频以及AI生成等多媒体技术领域的国际顶尖盛会,由IEEE承办,一直以来都被视为“AI+视觉”领域交叉研究的引领者。今年,无论是投稿数量还是与会学者的规模,都创下了历史新高。
常建慧走下领奖台,周围立刻被一群人包围,他们来自世界各地,都显得十分好奇:这次最高荣誉的获得者,竟然既不是顶尖高校的精英实验室,也不是硅谷那些知名大厂的研究室,而是我国的一家电信运营商研究院。
中国电信在ICME上以首单位身份荣获奖项,这标志着其首次取得如此成就。尽管它早已成为全球最早宣称自己是“科技型企业”的电信运营商,但在传统的通信业务之外,特别是在ICME所涉及的多媒体领域,中国电信仍然显得相对陌生。
此次获奖不仅表明电信运营商正逐渐成为更具主动性和远见的科研领导者,同时也展现了中央企业科研体系在技术创新领域的强大潜力。值得关注的是,常建慧,这位仅在中国电信云计算研究院工作一年的北大博士,她的经历更是一段充满技术、理想与央企创新精神的故事。
一次视觉世界的“重生”
“我们不是传统意义上的压图,而是在重画世界。”常建慧说道。
要领悟这篇顶级会议最佳论文的内涵,我们首先必须追溯到一个既普遍又复杂的问题:我们日常在手机上所浏览的图片和所观看的视频,究竟是如何实现压缩并在网络中实现传输的?
长期以来,为了节省传输的带宽资源,传统编码技术运用多种数学方法对图像中的多余信息进行剔除,以此达到减小文件大小的目的。然而,在高倍压缩的过程中,这种方法所导致的信息损失在接收端无法得到有效补充,进而引发图像变得模糊、失真,甚至出现马赛克现象。
近年来,AI技术的日益成熟催生了基于GAN(生成对抗网络)和VAE(变分自编码器)的生成式编码技术。然而,这些技术在控制力、稳定性以及重建质量等方面仍存在一定的局限性。在极低的码率条件下,系统对于许多图像的原始数据并不了解,只能通过推测来处理;许多看似完美的画面,在放大后却暴露出边缘的模糊和纹理的失真;有时甚至会出现不必要的细节,让人感觉画蛇添足。
您可以将之视为一个“知识库”。常建慧提出了一种创新的方法,该方法基于预训练的扩散模型。当接收到一幅高度压缩且信息严重受损的图像数据时,该模型能够依据其对“真实世界原本面貌”的认知,智能地补充缺失的细节,进而重新构建出一幅高清图像。
与生成对抗网络(GAN)的生成方式不同,扩散模型采取的是逐步消除噪声的手段,从随机噪声中逐步恢复图像;这种模型所生成的图像在结构上更为规整,纹理更加细腻,且保真度显著提升。为了达到“高保真”的效果,常建慧特别研发了“交叉注意力机制模块”以及“分布重整化”技术,该技术使得压缩潜变量与扩散模型的中间特征得以相互交融,解码后对图像的色彩分布进行修正,这样不仅增强了纹理细节的对齐效果,还显著提高了重建的精确度,有效防止了图像出现“模糊”或“伪造”的情况。
这条技术路线并非无人涉足,然而,我采用的途径在视觉保真度方面确实更胜一筹。领奖之际,一位评委向常建慧透露,他的见解与常建慧不期而遇,自首轮评审起,该评委便坚定地支持常建慧。这种同行的赞誉,极大地激励了常建慧。
实验结果揭示,在0.01至0.2比特/像素的范围内,常建慧所采用的技术相较于国际上最新的H.266/VVC标准,能够实现高达79%的码率节约。在论文的定性对比实验中,当VVC所呈现的画面已出现明显的块状干扰,而其他先进算法生成的画面变得模糊不清时,依照常建慧论文提出的方法进行图像重建,得到的图像依然保持了纹理的清晰度和细节的锐利度,无论是人物肌肤的纹理还是自然风景中的枝叶脉络,均实现了高度逼真的再现。
一次恰逢其时的获奖
对于中国电信而言,这项前沿性技术成果来得恰逢其时。
长期以来,通信网络追求的始终是速度的极致、高度的飞跃以及稳定性的保障。然而,随着5G技术的广泛应用和物联网的迅猛发展,全球正面临着一场“数据洪流”的挑战。据IDC的调研报告指出,到2025年,我国市场预计将产出高达51.78 ZB的数据量,而到了2029年,这一数字将飙升至136.12 ZB。
视频数据呈现出指数级膨胀态势。无论是高清监控、视频会议,还是智慧城市中的万物互联,乃至未来低空经济的发展,各行各业正逐步走向“视频化”,由此引发了海量的数据洪流。这一趋势对中国电信这一国家信息基础设施的建设与运营者来说,构成了巨大的挑战:网络带宽承受的压力急剧上升,互联网企业和城市运营者的成本不断攀升,进而影响了终端用户的体验。
通过高效的压缩技术,即便是在带宽受限的网络环境中,视频内容依然能够达到高清且流畅的播放效果。与此同时,那些访问频率较低的所谓“冷数据”,经过超高倍率的高保真压缩处理后,其占用的存储空间将变得极其微小,这样便能够帮助企业大幅度减少存储成本。吴杰,中国电信的首席科学家兼云计算研究院院长,向《IT时报》的记者透露,新型应用场景正促使基础设施形态经历根本性的转变。众多人工智能应用迫切需要实现跨区域部署,边缘计算场景则对快速响应提出了要求。在单一资源优化已不足以应对业务动态性和复杂性的背景下,中国电信正致力于研发新一代云计算架构——“智能泛在云”。常建慧的研究成果对于实现计算资源与网络资源的统一协同调度,对于推动这一“云”的发展,具有至关重要的意义。
城市治理领域是一个应用视觉大模型的典型例子。然而,在近年来,尽管这类模型在城市管理系统中得到了广泛的应用,但高质量数据集的获取却常常成为制约治理效果的关键因素:部分摄像头已经投入使用多年,其图像的清晰度并不理想;另一方面,新兴的无人机航拍监测技术虽然能产生大量数据,但其传输和存储成本却相对较高。
常建慧的研究成果专注于解决这些难题,实际测试结果表明,即便在高度压缩的条件下,航拍场景中的目标识别率依旧高达89%。
特别是论文所阐述的“轻量级适配器与预训练扩散模型”相结合的机制,该机制能够使编码器便捷地融入多种预训练的大型模型之中,无需对庞大的模型进行重新训练,显著增强了编码的灵活性与效率,并且显著减少了训练及迁移过程中的算力消耗。
在AI时代,云网正经历从“数据搬运”向“数据理解”的转变,这一转变的典型体现;放眼全球,下一代通信标准,包括6G、未来的AVS以及ITU-T视频标准,也在无声中向“模型驱动编码”和“语义压缩”的方向发展;这一领域已成为全球学术界的研究焦点。
会议结束后,众多外国专家与学者纷纷向常建慧请教,就论文中的技术要点进行了深入探讨。即便常建慧因时间紧迫无法逐一解答,仍有学者热心地为她向他人阐释,展现出他们对她的论文及研究方法的重视与认真态度。
据相关消息,IMT-2030(即6G)的标准化工作已经步入第二个阶段,预计在2026年之前完成需求评估。与此同时,多媒体编码的相关标准也预计将在2030年之前正式公布。在全球电信云服务领域占据领先地位的中国电信,正致力于将传统网络逐步转型为AI原生网络。
一所“非典型”的研究院
此次获奖标志着中国电信云计算研究院在原创性基础研究、攻克关键核心技术、前瞻性布局战略性新兴技术以及研发领域的一次初步探索。作为中国电信旗下最年轻的研究机构,它已成为这家历史悠久电信运营商面向未来科技创新的关键力量之一。
2024年1月,吴杰教授,当时担任美国天普大学讲席教授及计算研究中心主任,应中国电信集团之邀请,重返祖国。在此,他担任了中国电信的首席科学家和云计算研究院院长的职务,致力于下一代云计算与云网融合领域的先导性、战略性基础研究。
吴杰
学术界存在一种被誉为经典的“磁石效应”,该效应描述的是那些享有极高专业声誉和全球影响力的科学家,他们能够如同强大的磁铁一般,吸引杰出人才、汇聚优质资源,并催生出高质量的科研成果,从而对整个研究院产生强大的核心凝聚力和辐射力。
常建慧的到来,源于其师承背景。她得以拜入名门,跟随高文院士和马思伟教授学习,并且在2023年荣获了字节跳动奖学金,这一荣誉在全国范围内仅授予了13位学子。常建慧在2024年从北京大学数字视频编解码技术国家工程实验室顺利毕业后,她手中握着来自高校和互联网公司的录用通知。吴杰的广阔国际视野以及对学术研究的无限热情深深吸引了她,“院长的学术造诣十分深厚,他对我们的研究毫无限制,始终激励我们投身于最前沿的学术探索和基础研究。”
常建慧
该新机构由中国电信赋予了相当程度的自主管理权限,特别是在吸引高端人才方面,其提供的待遇在中央企业研究院中堪称最优。吴杰亲自担纲,不仅成功吸纳了诸如常建慧等一流高校的杰出毕业生,还聘请了与他本人相似的、拥有丰富海外科研与管理经验的行业领军人才,此外,研究院正与北京大学、上海交通大学等国内顶级学府共同探讨合作培养工程博士的可行途径,“这标志着中国电信向科技型企业转型的重要试验田”。
尤为重要的是,云计算研究院打造了一个与众不同的科研氛围——这种氛围恰似高校与企业的桥梁,呈现出一种独特的“中间态”。
若我身处互联网企业,我所探讨的问题或许会更为细致入微。常建慧直言,在电信云计算研究院这个规模虽小但精干的小团队中,她不仅享有宽广的学术领域,而且作为央企旗下的学术机构,研究院还提供了令人激动的产业平台,以便成果得以验证。
这种“中间态”,对一个热爱科研的年轻人来说,极具吸引力。
常建慧荣获奖项后,研究院迅速启动了成果转化流程。吴杰迅速与集团科创部、天翼云以及天翼视联网等关键专业公司建立了联系,常建慧回国后也迅速前往天翼云公司,与当地的科研团队共同探讨如何将论文成果有效应用于中国电信全球范围内的云网基础设施。
常建慧表示,在这里工作让她深感价值所在,她所从事的“纸上谈兵”工作,未来有望借助中国电信的云网基础设施,为智慧城市、公共安全、物联网等多个行业提供服务,或许还会走进千家万户,甚至成为每个人手机上不可或缺的“外挂”应用,这种成就感和满足感是与众不同的。
实验室与市场间的无缝过渡,是传统学术机构难以企及的显著优势;央企研究院依托其背后强大的产业生态系统,为学术成果的迅速转化提供了便捷途径,“这对我们来说至关重要。”吴杰如此表示。
这个平均年龄不足三十岁的“创新特区”成员群体,正不断吸引并汇聚着众多如常建慧那般年轻的才俊。今年新加入的两名博士,分别来自复旦大学和上海交通大学,他们均放弃了那些大公司提供的更为优厚的待遇,毅然决然地选择了加入云计算研究院。在这里,他们不仅能够仰望星空,自由地开展学术研究,而且能够脚踏实地,将他们的智慧融入各行各业数字化转型的脉络之中。
我们坚信,人工智能对于云网未来的发展具有全局性、战略性的核心地位,它将引发网络结构、运营方式以及用户体验的全新变革。在今年的6月19日,于上海举办的2025 WBBA云网宽带发展大会上,中国电信的董事长柯瑞文发表了这样的观点。
“AI+通信”的崭新范式正迅速涌现,其动力并非仅仅是公式与算法,而是一家央企面向未来的全新战略布局:该布局旨在构建一个以科研为引领、以人才为基石、以成果为目标的创新体系,从而实现我国主动设定未来标准、构筑核心技术的科技飞跃。
中国电信,终不再是那个的“陌生人”。
排版/ 季嘉颖
图片/ 中国电信 采访对象
来源/《IT时报》公众号vittimes
E N D