听听这段音频,你可以仅凭音频辨认哪句话是谁说的吗?
网易AI Lab可以!
借助人工智能声纹识别技术,“只闻其声,便识其人”就可以轻松实现。
在日常生活中,身份证、护照等证件可以作为识别一个人的凭证,一张证件对应一个人。
在虚拟世界中,识别一个人的方式主要依靠一些人们与生俱来的特征。比如,大家熟悉的指纹识别、人脸识别、虹膜识别、静脉识别等。
声纹,也是其中的一种识别方式。
就像,没有两个人的指纹是相同的,也没有两个人的声纹是完全相同的。大家可以用指纹作为密码登陆账户、解锁手机等,同样也可以用声纹当作钥匙,进行相同的操作。
在声纹识别的世界里,最大的难点之一来自环境因素的影响。声音在传播过程中会有噪声,在有噪音的情况下,如何准确识别人的声纹是非常大的挑战。
其次,一段声音有长有短。如果用来识别的语音比较短,里面能够提取的表征声纹的信息就更有限,鉴定也更困难。
因此,声纹识别领域每年都会举行各种各样的竞赛,鼓励科研团队们不断实现技术突破。
近日,在全球最大的语音会议INTERSPEECH 2020上,网易AI Lab拿下了 SdSV声纹识别比赛——文本相关声纹识别赛道的综合排名第一、单模型第一的双料大奖。
数值越小,代表能力越强哦
在语音领域,INTERSPEECH绝对是业界的顶级盛会。本次声纹比赛也是高手如云。
参赛选手包括美国约翰霍普金斯大学、捷克布尔诺工业大学、新加坡通信研究院、厦门大学语音实验室、西班牙ViVoLab等知名高校和企业派出的代表队。其中,约翰霍普金斯大学、布尔诺工业大学、新加坡通信研究院曾在近两年的国际大赛中取得过冠亚军的好成绩。
在一众高手中脱颖而出,证明了网易AI Lab过硬的技术实力,给攻城狮、程序媛们点个大大的赞!
技术要通过产品,服务于社会,才能实现更大的价值。目前,声纹识别技术已经被广泛应用在安防、司法调查取证等场景中,未来的前景和想象空间十分广阔。
举两个例子,
声纹技术运用在游戏中,除了可以实现身份验证的功能外,还可以丰富用户画像、提高好友推荐质量、提升游戏体验等。
就像下面这个视频中演示的,提前存储招式相关的语音指令,那么放大招的时候只要喊出招式的名字,就可以发动技能。
“上上下下左左右右AABB”这样的复古操作,再也不需要啦!而且,只有声音的主人,才可以启动技能哦。
声纹识别在游戏中的模拟应用视频
声纹技术应用在直播场景中,可以用于识别用户的性别和年龄层。进一步延展,可以起到防沉迷的作用。假如某个未成年用户大量打赏女主播,通过声纹识别和配套的操作,就可以制止这样的行为。
除了声纹识别外,网易AI Lab还在AI领域进行着更多的研究,包括计算机视觉和图形学、语音处理、自然语言理解和游戏AI等研究。
这个成立于2017年的团队,如今已经是行业领先的人工智能实验室。他们的目标是通过AI黑科技帮助网易旗下热门产品实现技术升级。
大家熟悉的《梦幻西游》《大话西游》《天下3》《荒野行动》《阴阳师》《一梦江湖》和《第五人格》等多款游戏,以及网易云音乐等产品中,都融入了网易AI Lab的技术。
人工智能,其实离我们很近、很近。
那么问题来了!
视频中,可以用语音放大招的游戏是哪一款呢?
留言区蹲答案!