騰訊科技訊 7月4日百度AI開大者大會(huì)上,百度高級(jí)副總裁王海峰上臺(tái),開始介紹百度大腦3.0,王海峰表示,百度大腦3.0 的多模態(tài)深度語(yǔ)義理解包含視覺、語(yǔ)音、自然語(yǔ)言、數(shù)據(jù)語(yǔ)義以及多元語(yǔ)義這些因素。
王海峰指出,基于百度大腦的視覺語(yǔ)義化技術(shù),機(jī)器可以全面識(shí)別視頻中內(nèi)容。如今年世界杯期間,機(jī)器可以識(shí)別出比賽視頻中的球員、裁判、球、以及球門、球場(chǎng)線等人、物和場(chǎng)景,可以捕捉射門、進(jìn)球、角球、任意球、換人等事件。進(jìn)而提煉出結(jié)構(gòu)化語(yǔ)義信息?;谶@樣的信息,既可以完成機(jī)器人自動(dòng)解說,還可以進(jìn)行精彩片段集錦、以及各種數(shù)據(jù)統(tǒng)計(jì)分析等等。
百度大腦視覺語(yǔ)義化技術(shù)還能被運(yùn)用到無(wú)人超市中去。王海峰博士指出,在無(wú)人超市等新零售場(chǎng)景中,視覺語(yǔ)義化技術(shù)可以準(zhǔn)確識(shí)別顧客“拿起商品”、“放下商品”、“將商品從A處放到B處”等行為,從而判斷用戶購(gòu)買了哪些商品,并在用戶離店時(shí)通過人臉支付主動(dòng)扣款。這預(yù)示著新的AI技術(shù)未來(lái)將爆發(fā)大規(guī)模應(yīng)用落地場(chǎng)景的可能性。
王海峰開始介紹百度大腦中的語(yǔ)音語(yǔ)義一體化技術(shù),配合WaveNet+拼接 情感語(yǔ)義合成技術(shù),可以大大提高語(yǔ)音識(shí)別的流暢度以及自然度。
王海峰表示,百度大腦的深度學(xué)習(xí)訓(xùn)練,已經(jīng)閱讀了一千億文章,相當(dāng)于六萬(wàn)個(gè)國(guó)家圖書館的容量。同時(shí)百度深度學(xué)習(xí)平臺(tái)paddlepaddle也迎來(lái)的3.0版本。
同時(shí)再次介紹了昆侖芯片,指出該芯片具有高性能、高性價(jià)比以及易用的特點(diǎn)。并且支持paddlepaddle平臺(tái),編程靈活度高并且能夠靈活支持深度學(xué)習(xí)訓(xùn)練和預(yù)測(cè)。最后王海峰博士指出,當(dāng)前百度大腦每天被調(diào)用的次數(shù)超過4090億次,服務(wù)億萬(wàn)用戶。
“百度大腦3.0首次將芯片納入技術(shù)體系,它使百度大腦具備了更完備的軟硬一體化能力,帶動(dòng)百度大腦算力爆發(fā)式增長(zhǎng)。AI芯片還將與百度自主研發(fā)的PaddlePaddle深度學(xué)習(xí)框架深度結(jié)合,推動(dòng)AI行業(yè)生態(tài)快速發(fā)展“,王海峰講到。
百度大腦每天調(diào)用次數(shù)超過4千億次,調(diào)用的人中既有AI工程師,也有零“AI”基礎(chǔ)的初入門者,還有來(lái)自各行各業(yè)希望用AI創(chuàng)新業(yè)務(wù)、為業(yè)務(wù)轉(zhuǎn)型升級(jí)的企業(yè)。他們雖然身份不同、目標(biāo)不同,但都從百度找到了最適合的AI接入方式。