騰訊科技訊 7月4日百度AI開(kāi)發(fā)者大會(huì)上,百度高級(jí)副總裁王海峰上臺(tái),開(kāi)始介紹百度大腦3.0,指出多模態(tài)深度語(yǔ)義理解是百度大腦3.0最大的變化。
百度大腦3.0 的多模態(tài)深度語(yǔ)義理解包含視覺(jué)、語(yǔ)音、自然語(yǔ)言、數(shù)據(jù)語(yǔ)義以及多元語(yǔ)義這些因素。
王海峰博士指出,基于百度大腦的視覺(jué)語(yǔ)義化技術(shù),機(jī)器可以全面識(shí)別視頻中內(nèi)容。如今年世界杯期間,機(jī)器可以識(shí)別出比賽視頻中的球員、裁判、球、以及球門(mén)、球場(chǎng)線(xiàn)等人、物和場(chǎng)景。那么機(jī)器如何看球?用一句話(huà)概括就是,多模態(tài)深度語(yǔ)義理解。不僅讓機(jī)器聽(tīng)清、看清,更要深入理解其背后的含義,從而更好地支撐各種應(yīng)用。
基于百度大腦的視覺(jué)語(yǔ)義化技術(shù),機(jī)器可以全面識(shí)別視頻中的球員、裁判、球、以及球門(mén)、球場(chǎng)線(xiàn)等人、物和場(chǎng)景,可以捕捉射門(mén)、進(jìn)球、角球、任意球、換人等事件。進(jìn)而提煉出結(jié)構(gòu)化語(yǔ)義信息?;谶@樣的信息,既可以完成機(jī)器人自動(dòng)解說(shuō),還可以進(jìn)行精彩片段集錦、以及各種數(shù)據(jù)統(tǒng)計(jì)分析等等。