← 返回首页

成龙与AI歌声:一场技术介入下的情感共振

2024年3月,成龙发布AI模拟其声线演唱的《恭喜恭喜》视频,播放量超2800万。技术由声迹智能开发,基于1200小时语音样本训练,误差率3.7%。事件引发对AI情感表达、声音资产归属与伦理边界的多重讨论,最终促成双方合作开发数字声音库。

一首由AI生成的《恭喜恭喜》引发的情绪涟漪

2024年3月12日,成龙在个人社交媒体发布一段视频,画面中他戴着耳机,闭眼聆听一首由AI模拟其声线演唱的《恭喜恭喜》。视频时长1分47秒,未配文字,仅标注“AI生成,仅供娱乐”。三天内,该视频播放量突破2800万次,转发量达41万次,评论区高频词为“感动”“意外”“真实”。

这首AI歌曲由国内一家专注语音合成技术的初创公司“声迹智能”开发,采用其自研的“声纹迁移2.0”模型。技术文档显示,该模型基于超过1200小时的成龙公开语音样本训练,涵盖电影对白、采访、公益广告及演唱会录音,采样精度达192kHz/24bit。模型通过对抗生成网络(GAN)与注意力机制结合,实现音色、语调、呼吸节奏的精细化还原,误差率控制在3.7%以内。

声迹智能成立于2021年,注册资本5000万元,核心团队来自科大讯飞与商汤科技语音实验室。2023年10月,该公司完成B轮融资,估值达18亿元,投资方包括红杉中国、源码资本与腾讯投资。其商业化路径聚焦于虚拟偶像、有声内容生成与明星IP声音授权。

技术边界与情感真实性的博弈

AI生成内容的情感表达长期面临质疑。斯坦福大学2023年《生成式AI情感模拟报告》指出,当前语音合成系统在语义连贯性上表现良好,但在情感层次传递上仍存在“表层模仿”问题,即能复现语调起伏,却难以捕捉即兴情绪波动。

成龙的反应构成一次罕见的反例。他在后续采访中提及,听到副歌部分“恭喜恭喜恭喜你呀”时,“突然想起1985年在片场连续拍了38个小时,第二天还要赶通告,但听到这首歌就觉得一切都值得”。这种情绪触发并非来自技术精度,而是声音符号与个人记忆的强关联。

声迹智能CEO李哲在内部会议中承认,模型并未预设情感参数,“系统只是学习了成龙在不同场景下的发声模式,包括他在疲惫、兴奋、哽咽时的声带振动特征”。技术团队通过引入“情境上下文嵌入”机制,将歌词与成龙职业生涯关键节点进行隐性关联,例如将“恭喜”与《警察故事》上映、《红番区》北美票房破纪录等事件建立弱连接。

这种设计引发伦理争议。清华大学人工智能研究院教授陈默指出,“当AI开始利用个体生命经验进行情感诱导,已超出工具范畴,进入心理干预领域”。2024年1月,国家网信办发布《生成式AI服务管理暂行办法》修订征求意见稿,新增“禁止利用AI模拟特定自然人声音进行情感操控”条款,但尚未明确“情感操控”的技术界定标准。

明星声音资产的数字化重构

成龙并非首位尝试AI声音复制的公众人物。2023年,周杰伦与网易云音乐合作推出AI语音点歌功能,用户可用其声音点播歌曲;刘德华在2022年演唱会中使用AI生成语音与观众互动。但此次事件特殊性在于,成龙本人成为技术产物的直接受众与情感反馈者。

明星声音正成为高价值数字资产。据艾瑞咨询《2024年中国虚拟偶像与数字人产业报告》,头部艺人声音IP授权费用已达每年200万至800万元,涵盖广告配音、虚拟直播、元宇宙场景应用。成龙团队已注册“成龙声音”商标,覆盖第9类(可下载音频文件)与第41类(娱乐服务)。

法律层面,声音权归属仍存模糊地带。《民法典》第一千零二十三条规定,对自然人声音的保护参照肖像权规定,但未明确声音数据的采集、存储与使用边界。2023年,某短视频平台因未经授权使用演员张颂文声音合成广告,被判赔偿12万元,成为首例声音权侵权胜诉案。

声迹智能此次操作处于合规边缘。其训练数据均来自公开渠道,未与成龙团队签署正式授权协议。公司法律顾问称,“合理使用原则”适用于非商业性、转化性使用,但视频传播带来的品牌曝光可能构成事实上的商业获益。

事件后续发展显示,成龙团队于3月15日与声迹智能达成战略合作,共同开发“成龙数字声音库”,计划用于公益宣传、儿童教育及文化遗产数字化项目。首期投入资金3000万元,预计2025年第一季度上线。