近年来深度伪造(Deep Fake)技术迅速发展,有不法分子利用 AI 语音合成技术进行语音诈财,对社会造成重大隐患。针对这一问题,国立台湾科技大学信息管理系学生王玟雅、蔡婷玗、陈俞缊及毛世鑫共同开发「应用音频浮水印于对抗式攻击与深度学习之数字护声符系统」,提供语音防护与真伪辨识。他们设计的「护声符 APP」在第29届大专院校信息应用服务创新竞赛中也荣获资安应用组第二名及信息应用组第三名的佳绩。
王玟雅表示,亲友曾经接过陌生来电,被诱导进行对话的经历,再加上看到关于语音诈骗的新闻,让她萌生设计语音防护系统的想法,希望以科技手段保障声音权益。「护声符APP」具备语音真伪辨别及数字音频防护两大功能,除了可以分辨语音是AI还是真人,还能为声音加上特殊的「音频浮水印」,也就是人类听不见的音频或标记,防止声音被AI软件进行二次合成利用,音频浮水印也能作为保障声音版权的依据。
在语音真伪辨识方面,团队搜集公开的真人语音数据库与AI合成音频,利用侦测模型集成与分类,分析真实语音与合成语音的特征与差异,最终训练出辨识系统。在背景音干净的情况下,该系统对真人语音的辨识准确率高达99.99%,对AI合成音的辨识准确率则为99.94%。王玟雅表示,此次团队的共同合作开发也在软硬实力上带给她比预期中更多的成长与收获。
目前APP支持音档上传与录制功能,用户可借此辨别语音真伪或添加浮水印。王玟雅也将规划完整开发即时通话中的语音辨识与防护功能。同时,因为目前训练模型用的语音数据大多为英文,团队也预计扩展模型的语音数据库,搜集更多中文语音样本进行模型训练,增强对中文语音的支持,以符合台湾民众的使用需求。未来,希望可以将「护声符APP」发展成合规性工具,应用于通信、声音版权保障、生物特征验证、影视制作等领域,成为具有公信力、保障声音版权的工具。
团队成员毛世鑫分享,尽管他原本对语音相关的资安技术不熟悉,但为了完成语音模型的开发,他也特意去进修相关课程,拓展知识层面。来自印尼的成员陈俞缊一开始对于得奖并没有抱太大的期待,听到获奖的消息时,她感到相当惊喜,「得奖对我来说是一种鼓励,让我更坚定想要朝资安的领域继续努力。」成员蔡婷玗也说,竞赛得奖让她更有动力去面对未来的各种挑战,能更有信心迎难而上。
指导老师黄政嘉助理教授指出,声音权益在近年逐渐受到重视。例如,公众人物的声音可能被不法分子利用,制作出虚假言论,严重影响其声誉;日本甚至有声优因声音遭窃取而影响工作权,但目前声音版权保障相关法规仍不完善。
黄政嘉也提到,「护声符APP」使用的技术具有高度市场需求,但开发具公信力的系统面临诸多挑战,包括语音样本的搜集与模型建构等。黄政嘉通过引导的方式,鼓励学生从日常生活中发掘问题与解决方案,保持创造力与热忱,逐步实现构想,成为业界亟需的专业即战人才。
图说:台科大资管系学生王玟雅、蔡婷玗、陈俞缊及毛世鑫开发「应用音频浮水印于对抗式攻击与深度学习之数字护声符系统」,荣获第29届大专院校信息应用服务创新竞赛资安应用组第二名及信息应用组第三名。
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除