继下棋、写作之后,人工智能开始接近人类歌手水平
2018-05-28 09:19:57 来源:中国新闻网
资料图:4月27日,中国围棋职业九段棋手柯洁在福州挑战由中国研制的围棋人工智能“星阵”,弈至145手,柯洁中盘认负。中新社记者 王东明 摄
在微软的科学家看来,小冰唱歌的原理和虚拟歌手“初音未来”或“洛天依”演唱的原理并不一样——虚拟歌手需要录制好的声音库,再通过重新拼接声音库中的片段形成歌曲;而小冰唱歌是根据输入的信号做出发声的反应。
微软(亚洲)互联网工程院微软小冰首席语音科学家栾剑直言,在拿到曲子后,会根据小冰的风格,调整曲子的细节。“如果完全按照简谱的节拍和音符来唱,会非常机械,不好听。这部分我们是有模型来做的。”
资料图:第二十届科博会展会现场,观众体验机器人。 韩海丹 摄
在人工智能识别了曲子后,就需要用到“另一个模型”——用小冰的声音演唱出来。而这个模型并非简单的发声装置。
栾剑告诉记者,这次使用的唱歌模型已经是第四代了。“我们的第一代版本挺像一个普通人唱歌,虽然唱得挺自然,但有时候不太在调上;到第二代时,我们解决了基本音准;后来不断迭代模型、优化算法,在音质、自然度,包括衔接上做改进,升级到第三代。”
“第四代唱歌模型主要改进了三个方面——一个是我们加入了换气的声音。我们跟一些音乐人做了交流,觉得加入这个会提高演唱的自然度;第二是我们让这个模型变得更复杂了一些,加入了控制因素,使得它在字和字之间、转音地方的一些小技巧,能更加流畅、平滑;第三我们加入了更多训练数据,使模型更加稳定,在风格上更加成型。”他说。
“以前小冰在唱主歌和副歌的感情色彩基本是一样的,虚拟歌手唱歌的时候通常会有这样的问题。而现在可以看到,小冰在唱主歌和副歌的感情、音色是有区别的。副歌的地方情绪会更加激烈,音色会更加高亢。”栾剑觉得,这是新版本与此前三个版本区别最大的地方。
【责任编辑:伊宁倩】
相关新闻
- 日新闻排行榜
- 周新闻排行榜
- 月新闻排行榜