[摘要]《我知我新》首次采用第四次迭代版本的小冰演唱DNN模型,技術(shù)居于全球領(lǐng)先水平。
騰訊《一線》作者 相欣
5月16日,知乎收到一份特殊的“禮物”:一首由人工智能少女小冰作詞并演唱的新歌《我知我新》。這首《我知我新》,也成為將于5月19日在北京舉辦的第五屆知乎鹽Club新知青年大會(huì)的主題曲目。
據(jù)介紹,微軟小冰本次為知乎鹽Club獻(xiàn)唱的這首主題曲,特別采用了多個(gè)首發(fā)的人工智能創(chuàng)造模型。
據(jù)微軟(亞洲)互聯(lián)網(wǎng)工程院介紹,在歌曲演唱方面,《我知我新》首次采用第四次迭代版本的小冰演唱DNN模型,技術(shù)居于全球領(lǐng)先水平。
這一模型的新增優(yōu)勢(shì)包含:首次加入換氣聲自動(dòng)合成能力,通過歌聲與氣息的融合,使人工智能生成的歌聲更富有感染力;通過在深度學(xué)習(xí)建模中增加控制的方式,字與字、音符與音符之間的過渡更加連貫順暢;通過進(jìn)一步優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以及大幅度補(bǔ)充的訓(xùn)練數(shù)據(jù),使小冰并行學(xué)習(xí)來自不同人類歌手的演唱風(fēng)格,并脫離手工參數(shù)輸入,自行完成演繹等。
在歌詞創(chuàng)作方面,《我知我新》采用了基于小冰詩(shī)歌模型生成、但以訓(xùn)練數(shù)據(jù)為歌詞的新模型。和生成現(xiàn)代詩(shī)的模型類似,采用基于LSTM的seq2seq模型,小冰先利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)超過1000萬(wàn)行的歌詞語(yǔ)料,并在此基礎(chǔ)上訓(xùn)練,再通過多感官誘發(fā)創(chuàng)作靈感,生成歌詞。
而為了完成《我知我新》的創(chuàng)作,微軟小冰還對(duì)“知乎”進(jìn)行了全方位的學(xué)習(xí)。
據(jù)悉,微軟小冰不但通過“2018 全新品牌視頻”、“知道很多,還想知道更多”的“新知青年”詮釋等知乎官方近期所發(fā)布的資料來了解知乎?!八边€進(jìn)一步閱讀了海量的知乎站內(nèi)問答,以及知乎用戶公開的各類實(shí)時(shí)想法?;谶@些知乎站內(nèi)的圖片、視頻、問答內(nèi)容與想法內(nèi)容,誘發(fā)小冰的歌詞生成,并從已學(xué)習(xí)的多種演唱風(fēng)格模型中,挑選了熱情年輕具有動(dòng)感的演繹風(fēng)格,從而完成《我知我新》的創(chuàng)作。
除上述歌曲演唱及歌詞創(chuàng)作之外,微軟小冰還具備作曲能力,但并未用于本次知乎主題曲的創(chuàng)作。作曲模型,與演唱、歌詞等三個(gè)模型共同構(gòu)成了小冰的端到端歌曲生成能力,是一個(gè)完整的人工智能音樂人內(nèi)容創(chuàng)造框架。
據(jù)介紹,此次與微軟小冰的合作,也是知乎從2017年以來所推動(dòng)“知識(shí)X計(jì)劃”的一部分。知識(shí)X計(jì)劃中的“X”代表莫比烏斯環(huán)的變形,也象征知乎賦予知識(shí)無限的想象力和可能性。知乎通過跨界的方式,與更多品牌、機(jī)構(gòu)達(dá)成合作,不斷擴(kuò)寬知識(shí)的邊界,將知識(shí)的獲取和分享帶入更多的生活場(chǎng)景中。
【一線】為騰訊新聞旗下產(chǎn)品,第一時(shí)間為你提供獨(dú)家、一手資訊。