微軟小冰這個萌妹子大家肯定不會陌生,這個智能語音助手不僅會聊天唱歌還有各種有趣的功能,目前已經(jīng)升級到了第五代,是國內(nèi)最為優(yōu)秀的語音助手,小冰將擁有更高的EQ,會和人類產(chǎn)生聯(lián)系,主動找人類聊天,但是很多用戶吐槽的是不能聯(lián)系上下文,感覺聊天跑題現(xiàn)象嚴(yán)重,相信以后這些問題都會解決吧,將會最為優(yōu)秀的聊天機(jī)器人。
第五代小冰介紹
第五代小冰升級了基于EQ的核心對話引擎,率先升級到高級感官,其能夠大幅度地提升交互體驗,更加貼近于人類的自然交互行為。小冰有能力根據(jù)自己的“意愿”與人聯(lián)絡(luò),從而主動保持與人類用戶之間的關(guān)聯(lián)。通過使用生成模型(Generative Model),小冰不再鸚鵡學(xué)舌,而是能夠自創(chuàng)回應(yīng),主動和人類交流。
微軟小冰的發(fā)展階段
微軟將人工智能交互技術(shù)產(chǎn)品的演進(jìn)分為三個階段。
第一階段、是基本的人工智能交互,即擁有某一種或多種交互方式,如文本、語音、圖像、視頻等,但不同交互方式之間是割裂的。擁有人工智能交互,一定程度上實現(xiàn)了新穎的交互體驗。但是,由于不同的交互類型彼此不互通,因而無法通過長程交互數(shù)據(jù)獲得一加一大于二的訓(xùn)練效果。從實際部署上看,這階段的交互(例如純語音、或純文本、或僅具有圖像識別的人工智能系統(tǒng))由于體驗單一,訓(xùn)練提升速度慢等原因,往往會很快被用戶放棄。
第二階段、是初級感官,即在人工智能系統(tǒng)中,用一種核心引擎(如小冰的EQ核心對話引擎)將上述各種交互統(tǒng)一起來,使不同感官可以混合運(yùn)用。例如,在文本對話過程中自然切換至圖像、語音,再切換回文本。小冰從2015年第三代發(fā)布起,進(jìn)入這一階段。
第三階段(高級感官)、高級感官是由多種初級感官有機(jī)融合之后形成的,因而交互能力更強(qiáng),對綜合技術(shù)儲備和數(shù)據(jù)的要求也大幅度提高。例如全雙工語音這一種高級感官,就需要首先同時具備文本、語音(含SR和TTS)兩種能力,同時要求兩種能力均達(dá)到更高的質(zhì)量標(biāo)準(zhǔn)。