多模态媒资难题破解之路;当虹科技联合攻关项目获浙江省科学技术进步奖。
网络视听内容正以惊人的速度膨胀。每天涌现的视频、音频、图像和文本素材堆积如山,媒体从业者常常陷入‘有料却找不到’的尴尬境地。如何让这些多模态资产从杂乱无章的仓库,转变为随时可调用的宝贵资源?这不仅是技术层面的挑战,更是整个行业转型升级的必经之路。当虹科技正是瞄准这一痛点,联合高校和头部媒体机构,展开了长期而深入的研发探索。
2024年度浙江省科学技术奖的公布,为这段探索画上阶段性句号。在全省科技创新大会现场,浙江省科学技术厅揭晓获奖名单,由当虹科技、浙江传媒学院以及浙江广播电视集团联合申报的‘海量多模态媒体资产的高效安全管理关键技术及应用’项目,成功摘得科学技术进步奖。作为省级政府设立的最高科技荣誉之一,这一奖项历来重视那些真正解决产业卡点、产生实际效益的成果。此次获奖项目,正是典型代表。
(来源:浙江省科学技术厅)
回顾项目研发历程,可以清晰看到一条从问题导向到技术落地的完整路径。起初,团队面对的是海量媒资带来的双重压力:存储与管理成本居高不下,检索与再利用效率低下。传统方法依赖人工标注,耗时长、成本高、准确率受限,无法匹配内容爆炸式增长的节奏。为此,项目组将目光投向AI多模态智能处理,逐步构建起一套覆盖全生命周期的解决方案。
首先是智能编目与内容拆解。系统能自动解析视频中的多重信息维度,包括人物识别、语音转录、字幕提取以及画面语义理解。原本需要数小时手动浏览的长视频,经过处理后迅速分解为一个个独立、可搜索的片段单元。这些单元携带丰富的元数据标签,让后续调用变得异常便捷。运营人员只需简单描述需求,系统便能快速返回匹配结果,极大解放了生产力。
其次,在安全审核领域实现了质的飞跃。技术不再局限于关键词过滤或人工抽查,而是建立起融合语义分析与质量评估的综合模型。它能同时考量内容的合规风险、视觉质量以及传播适宜性,避免了低价值重复审核,显著提升了整体处理吞吐量。这种智能化审核方式,既守住了安全底线,又为高效生产腾出了空间。
再者,跨模态检索成为系统的一大杀手锏。过去定位某段特定内容的画面或台词,往往需要反复试错;现在,多模态特征向量匹配技术让检索跨越文本、图像、音频等多重边界。无论用户想找人物特写、情绪高潮片段还是关键事件节点,都能在瞬间得到响应。这种能力直接转化为内容价值的放大效应,推动媒资从被动存储向主动赋能转变。
经过严谨验证,该技术已在实际生产环境中大规模落地。浙江广播电视集团的媒资平台率先引入,多个县级融媒体中心也相继跟进。应用数据显示,内容定位速度加快,复用比例上升,整体运营成本得到有效控制。这些成果不仅体现在数据指标上,更体现在从业者的切实获得感:从繁琐重复劳动中解脱,转而专注于创意表达与价值挖掘。
展望前方,多模态媒资管理的智能化浪潮才刚刚起步。当虹科技的此次获奖,既是技术实力的阶段性总结,也是对行业未来方向的积极回应。在AI持续赋能的加持下,媒体资产将真正成为可流动、可增值的核心资源,助力整个视听产业迈向更高阶的数字化转型。浙江的这一创新实践,也为全国同类机构提供了值得借鉴的样本,推动区域乃至全国传媒科技水平的整体跃升。
