首页 科技 正文

Siri和Alexa身后的女科学家去世,是她让AI拥有女音

萧箫 只想说 凹非寺量子位 报导 | 微信公众号 QbitAI

“嘿Siri,你可以给我做点什么?”

“……”

Siri的“柔美女声”,如今早已习以为常了。

但要是没有科学家Ann Syrdal的勤奋,这类“生成女声”很有可能还必须更长的時间。

缺憾的是,7月21日,74岁的Ann Syrdal过世。

这名被网民楷音为“Answer doll”(问与答小孩)的语音识别权威专家,以前是美国电话电报公司(AT&T,有着贝尔实验室)的顶尖技术性研究者。

在美国电话电报公司科学研究期内,她开发设计出了“第一个真实高品质的女士生成响声”,这才拥有之后的Siri和Alexa(amazon的智能语音助手)。

因此《纽约时报》点评说:她是Siri和Alexa身后的那人。

实际上,尽管语音识别技术性早已有之,1939年,AT&T的贝尔实验室就早已开发设计出了第一批生成视频语音。

但,这种语音识别技术性(TTS)基础只有生成男士的响声。

往后面的40年间,电子信息技术飞速发展,生成女士视频语音的技术性却一直止步不前。

Siri的开发人员Tom Gruber以前表明:“这些响声听起来如同智能机器人讲话一样。”

而Ann Syrdal的来临,才让生成女士响声拥有材质的飞越。

让设备传出“当然的”女声

自二十世纪八十年代中后期,Syrdal刚开始产品研发女士语音识别系统软件。

Syrdal的朋友、語言研究者h.s.Gopal曾表明:“那时,任何人都觉得女声仅仅男音的高频率版本号,但这类念头压根失灵。”

实际上,因为女士响声的特性,比如高些的声调和大量的气音,会造成在电話和电子计算机里,女士的响声比男音更为难听得懂。

据研究发现,即便是真人版对讲系统,女士响声被看错的几率要比男士均值高于33%。

举个事例,如果你在做听力时,有木有觉得到,男音英语听力题通常会比女声更非常容易听得懂?

这也是为什么,电話领域中大部分电子计算机生成的响声听起来像男士。

殊不知,语音识别行业不太可能仅有男音。

实际上,一部分有发音阻碍的女士,一直更期待能以女士的生成响声与外部沟通交流;除此之外,也有些人对女声更为比较敏感。

就在1991年,Syrdal开发设计了一种能够生成女声的系统软件,根据提升数据库查询中的响声,将女士生成响声看错的概率从67%降至了40%。

这在其中,一个名叫Julia的女士生成响声,便是Syrdal开发设计出去的。

Julia生成女声.wav来源于量子位00:0000:27

能够听到,不论是音标发音還是顺畅水平,都早已做到了十分非常好的水准,自然,语气也有一点怪异,但是早已十分真实了。

与立即写作视频语音对比,Syrdal挑选将真人版女士的视频语音精彩片段构成一个大中型数据库查询,在精确标识、保证视频语音品质的前提条件下,将他们拼接起來,寻找组成的规律性,有利于构成新词汇和新的语句。

除此之外,她还创建并检测了人们电子计算机实体模型,尝试了解人们是如何识别各种各样视频语音的。

而她一直以来科学研究的总体目标,是将这一差错率降至33%下列,乃至比真人版女士响声被看错的几率也要低。

一九九八年,Syrdal产品研发出的「自然之声」系统软件(Natural Voices),在国际性语音合成器比赛中得到 了第一名,它是此项比赛的一个转折点——因为它应用了女士的响声。

目前,选用此项技术性的Siri和Alexa,早已另外出示了女士和男士的响声。

而在国外与日本国,Siri的女士响声早已变成了“标准配置”,基本上全部iPhone手机上选用的全是Siri的女声。

2008年,Syrdal被任职为英国声学材料学好的研究者,以嘉奖她对女士语音识别行业所作出的奉献。

「自然之声」新项目的责任人Juergen Schoeter表明:“就好像有哪些能量一直驱动器着她,促进她去提升女士响声的品质。”

生成女士视频语音之母

Ann Syrdal于1940年12月13日日生在美国奥克兰(Minneapolis),她的爸爸妈妈于霍尼韦尔了解,它是一家二战前就存有的互联网巨头企业。

她的爸爸是一名开发设计真空电磁阀与电子信息技术的科学家与技术工程师,在她两岁的情况下就离逝了,妈妈将她养育长大了。

实际上,Ann Syrdal考入明尼苏达高校时,并沒有考虑到过从业科学研究工作中,直至一位社会心理学专家教授请她帮助做一个有耗子参加的试验,她才意识到自身喜爱试验室工作中。

接着,她在明尼苏达高校得到 大学本科与博士研究生,自此在麻省理工大学从业博士研究生的科学研究。

也是在麻省理工大学和皇室理工大学,她刚开始科学研究人们語言的体制,自此一刻苦钻研便是半辈子,一直到二零一五年,依然在锲而不舍地论文发表。

实际上,Ann Syrdal发布的毕业论文总数很少,在Researchgate上显示信息的一共有55篇,这种毕业论文一共被引入了1100多次。

殊不知,她在语音识别行业上作出的奉献却众所周知。

针对Ann Syrdal自己而言,挑选科学研究的驱动力,来自于她在MIT工作中的那一段时间

“不管在哪个行业,好像都能在这儿寻找哪个行业的全球权威专家,这类鼓励的觉得基本上令人无法夜寐。”

非特殊说明,本文由骆驼资讯网原创或收集发布。

转载请注明本文地址:http://www.luotuo.cc/kj/1128.html

新疆医药采购管理网 长治城区教育信息网 蔡家坡高级中学 青州教育局 中国音响网 钟山驾校 通辽第五 哈医大新闻网 剧情网 南阳教育信息网 九九影视 北京市第八中学 广州科技职业技术学院 阳光第六小学 连云港交通违章查询网 吉安房产网 九九电影网 路由器之家 乐蛙论坛 乐蛙lewaos 传奇影院 阳泉市招生考试网 六六网 新疆医药采购管理网 长治城区教育信息网 蔡家坡高级中学 青州教育局 中国音响网 钟山驾校 通辽第五 哈医大新闻网 剧情网 南阳教育信息网 九九影视 北京市第八中学 广州科技职业技术学院 阳光第六小学 连云港交通违章查询网 吉安房产网 九九电影网 路由器之家 乐蛙论坛 乐蛙lewaos 传奇影院 阳泉市招生考试网 六六网