科普时报记者张英贤
AI正在渗透我们的生活。如果数字科技与声乐艺术深度融合,又会擦出什么样的火花呢?结果还是很有意思的,人类可以利用AI作曲、编曲、即兴演奏辅助,完成一首歌曲的创作。人类还通过AI提取片段式声音进行声音克隆。自然,由于声音可以被“造”出来,给我们带来了极大的不安全感,声音水印技术也随之而产生……
7月5日,由全球数字经济大会组委会主办、北京市科协支持,北京乐器学会、北京声学学会等协办的“为未来做好准备——数字音乐科技创新发展论坛”在北京石景山首钢园举办。北京乐器学会⾳乐科技⼯作委员会在会上揭牌。与会专家介绍了AI在音乐、声学方面给生活带来的精彩改变以及可能伴随的种种挑战。
在⽯景⼭⾸钢园中关村科幻创新中⼼⼀层报告厅,一阵阵歌声、笛声时不时地传来。中国科学院声学所⾸席专家、中国科学院⼤学特聘教授王秀明在现场惟妙惟肖地学起了二胡的声音,并唱起了谱子,为大家形象地解释了音高、音色、音强等名词背后的科学原理。
“音高就是频率的高低,音强是由乐器共振体振幅大小决定的。由于发音材料不同,振动会有影响,因此音色就会有所不同。”王秀明介绍,在科学家的眼里,音调是由频率决定的。比如,通常所说的1(dao)的频率是C(大致是262赫兹)时,表明曲式是C,其高八度的频率约为523;而1(dao)为a1时,频率是440赫兹,曲调是A。
在活动现场,王秀明通过一组视频向观众展示了声音的拆分和合成,并提出了一个严肃的话题。在音乐原理中,除了发音体整体振动产生的最低的音是基音,其他均为泛音。泛音的幅度和组合决定了特定的音色。“抓住了基音和泛音的声音特征,再结合声音的频率分析,就意味着我们可以‘造声音’。”
中国社会科学院中国⽂化中⼼副主任张晓明表示,随着技术的不断进步,音乐领域正处于一个变革的时代。人工智能、虚拟现实等新兴技术正在重塑音乐的创作、传播和消费方式,为音乐行业带来前所未有的机遇和挑战。
“AI为音乐创作和生产带来了新的可能,AI作曲、智能混音、自动编曲等技术让音乐创作变得更加便捷和多样化。但与此同时,我们也必须正视这些技术带来的伦理和法律问题。”张晓明介绍,通过大数据分析,我们可以了解听众的偏好,定制个性化的音乐体验。然而,如何有效的收集、管理和利用这些数据,是我们面临的巨大挑战。
中国科学院⼤学企业导师,声智科技创始⼈陈孝良表示认同,目前结合大模型,人们可以通过一段很短的声音片段,抓取声音的主要特征进行声音克隆,由此带来的数据安全风险不容小觑。此外,由于声音分类、音乐合成等技术的出现,音乐产品的数字版权问题有待关注。
“目前,声音水印已经成为一个新的研究方向。”陈孝良介绍,“声音水印技术通过在声音信号中嵌入不可察觉的标识信息,从而实现对声音的追踪和验证。这种技术不仅可以有效防止声音数据的非法复制和传播,还能为声音内容的版权保护提供强有力的技术支持。”
声音水印可以应用于多种场景,如音乐版权保护、广播监控、音频文件的防伪溯源等。“未来,随着大模型和深度学习技术的进一步发展,声音水印技术有望变得更加智能化和广泛应用,为声音安全和版权保护提供更加全面的解决方案。”陈孝良说。
张晓明表示,未来,我国需在数据模型和应用上下功夫,特别要重视音乐数据的有效获取与隐私保护,还需建立开放共享的数据平台实现数据的合法、安全利用。同时,人类还要在技术革新与人文关怀之间寻找到恰当的平衡点,以推动音乐科技行业的健康持续发展。