丝袜久久亚洲国产毛片,老人AV综合,国产精品日韩av,超碰国产综合,综合av在线草,毛片久久久,精品蜜桃一区三区,99久久久,人妻99在线视频

你知道機(jī)器是怎樣和你“聊天”的么?

2014-11-02 項(xiàng)目

展示量: 3874
你知道機(jī)器是怎樣和你“聊天”的么?

科幻作品中我們經(jīng)常能夠看到與人類(lèi)一樣聰明的機(jī)器人,機(jī)器是如何在這背后存儲(chǔ)知識(shí)的?是如何推理知識(shí)并運(yùn)用知識(shí)的?最后又是如何實(shí)現(xiàn)與人的交互的?此次在的百度BIG大會(huì)上,百度技術(shù)副總王海峰博士總結(jié)了實(shí)現(xiàn)人工智能的三大關(guān)鍵技術(shù),基本回答了這些問(wèn)題,雖然講的比較簡(jiǎn)單,但由于信息量過(guò)大沒(méi)有一定背景的人是很難聽(tīng)懂的,所以我純粹來(lái)給各位科普下。


關(guān)鍵一,讓機(jī)器理解語(yǔ)言的技術(shù)


理解語(yǔ)言是一個(gè)從詞語(yǔ)逐漸遞進(jìn)到事件的過(guò)程。


語(yǔ)言.jpg


1,分詞技術(shù)


讓機(jī)器理解語(yǔ)言,也就是要讓機(jī)器學(xué)會(huì)自己思考,那么就需要讓機(jī)器去理解語(yǔ)言。而漢語(yǔ)的

理解與英語(yǔ)相比起來(lái)就顯得更加困難,在英語(yǔ)中每個(gè)單詞都是基本上可以被機(jī)器直接讀取的,但是漢語(yǔ)在分詞上則更為困難。我們來(lái)舉幾個(gè)列子。


“你|老張|著什么急|啊”

“你|老張著|什么嘴|啊”


上面是一個(gè)簡(jiǎn)單的列子,修改一個(gè)字,意思就相差十萬(wàn)八千里,而機(jī)器根據(jù)字的不同則可以勉強(qiáng)分出來(lái)。但是下面這個(gè)列子就折騰了。


“乒乓球拍賣(mài)完了”


機(jī)器該怎么分?這就困難了,機(jī)器既可以分出兩種意思


“乒乓球|拍賣(mài)|完了”

“乒乓|球拍|賣(mài)完了”


那么困難就來(lái)了,我們?nèi)绾胃嬖V機(jī)器這句話(huà)中的詞該怎么分呢?對(duì)于人來(lái)說(shuō)很簡(jiǎn)單,根據(jù)前后文馬上就能識(shí)別出來(lái),但是對(duì)于機(jī)器來(lái)說(shuō)則極為艱難。



2,句子的分析技術(shù)


分詞問(wèn)題解決之后便是分析句子的問(wèn)題,請(qǐng)看下面兩句


“謝霆鋒|是誰(shuí)|兒子”

“謝霆鋒|兒子|是誰(shuí)”


對(duì)于機(jī)器來(lái)說(shuō),這兩句話(huà)獲得的關(guān)鍵分詞信息是一樣的,都是“謝霆鋒”、“是誰(shuí)”、“兒子”,這三個(gè)關(guān)鍵分詞信息。我們?cè)撊绾胃嬖V計(jì)算機(jī),因?yàn)轫樞蛳群蟮脑蚨鴮?dǎo)致的語(yǔ)義的天差地別呢?


這其中就需要對(duì)語(yǔ)言有很深入的分析,對(duì)語(yǔ)義理解,從而知道他們要找的答案是不一樣。做到這單同樣不容易。



3,上下文相關(guān)的分析技術(shù)


分析完一句話(huà)后,機(jī)器自然要推演到分析一篇文章的內(nèi)容。


在《信息簡(jiǎn)史》中有一個(gè)很重要的信息原理,就是說(shuō)當(dāng)我們需要傳遞信息時(shí),需要大量的冗余信息來(lái)保障信息的準(zhǔn)確性,沒(méi)用的廢話(huà)越多則傳遞信息的準(zhǔn)確性越高,同樣對(duì)于讓機(jī)器理解某句話(huà)也是基于同樣原理。


但問(wèn)題是,人可以依靠直覺(jué)抓取關(guān)鍵信息,而機(jī)器又憑借什么來(lái)抓取關(guān)鍵信息呢?又如何識(shí)別真正的信號(hào)與噪聲?這也是至關(guān)重要的技術(shù)。


我們看以下三個(gè)列子


藍(lán)色天空.png

 


我們看到當(dāng)搜索“天空為什么是藍(lán)色的”時(shí),百度并沒(méi)有把文章前半部分的內(nèi)容放上去,而是自動(dòng)摘取了中間的關(guān)鍵答案,而當(dāng)用搜狗搜索和360搜索時(shí),并沒(méi)有摘要出最優(yōu)答案,只是把文章的前半部分內(nèi)容放了上去。這說(shuō)明搜狗和360搜索還有可以繼續(xù)提升的空間。


4,分析事件的技術(shù)


分析文章的問(wèn)題解決后就必須再攀登更高的高度,讓機(jī)器去系統(tǒng)性的分析一個(gè)事件,也就是再加上時(shí)間的這個(gè)維度,將與某個(gè)事件相關(guān)關(guān)鍵的文章全部集合,就可以還原一個(gè)歷史事件的進(jìn)程。


當(dāng)我們搜索“斯諾登”時(shí),就會(huì)出現(xiàn)以下按照時(shí)間軸展開(kāi)的標(biāo)題。

斯諾登.png


左邊是百度的事件整理,中間是360的事件整理,最右邊是搜狗搜索的結(jié)果。


在事件歸類(lèi)的技術(shù)上,百度與360都已能夠做到識(shí)別,而搜狗目前沒(méi)有做到這點(diǎn)。


事件整理是最高難度的技術(shù),也是如何做到讓機(jī)器理解語(yǔ)言的最高一層。



關(guān)鍵二,知識(shí)挖掘技術(shù)


知識(shí)挖掘.png


1,知識(shí)圖譜的建立技術(shù)


首先假設(shè),我們?cè)跈C(jī)器中存儲(chǔ)了上億個(gè)實(shí)體知識(shí),這對(duì)于機(jī)器來(lái)說(shuō)不是難事,輕而易舉,難就難在存儲(chǔ)實(shí)體的關(guān)系上,一個(gè)實(shí)體對(duì)應(yīng)多個(gè)屬性,比如一張桌子對(duì)應(yīng)了品牌、顏色、木材等等屬性,這些屬性就有上百億級(jí)別,這些關(guān)系錯(cuò)綜復(fù)雜的整合起來(lái),要存儲(chǔ)的數(shù)據(jù)就會(huì)指數(shù)級(jí)的增加,這注定是一張超級(jí)的海量級(jí)圖譜。


如何建立起圖譜?以以下這句話(huà)來(lái)舉例


“奢侈品牌路易威登1854年成立法國(guó)巴黎”


那么機(jī)器該如何進(jìn)行知識(shí)的存儲(chǔ)呢?


1)奢侈品與路易威登(識(shí)別出路易威登是個(gè)品牌并且是奢侈品,存儲(chǔ)該知識(shí))

2)路易威登與1854年成立(識(shí)別出路易威登的成立時(shí)間,存儲(chǔ)該知識(shí))

3)路易威登成立于法國(guó)巴黎(識(shí)別出路易威登成立于發(fā)過(guò),,存儲(chǔ)該知識(shí))

4)法國(guó)巴黎(識(shí)別出法國(guó)與巴黎有關(guān)系,存儲(chǔ)該知識(shí))

5)……


以上只是一種粗略的理想化的情景,王博士也沒(méi)有說(shuō)更細(xì)節(jié)的事情。我這里補(bǔ)充下,實(shí)際上這種只是圖譜一直是動(dòng)態(tài)的,有不斷的增加刪減的過(guò)程,每個(gè)語(yǔ)句中的知識(shí)都是按照時(shí)間線(xiàn)出現(xiàn)的大數(shù)據(jù)關(guān)鍵詞內(nèi)容,根據(jù)統(tǒng)計(jì)后才建立起的知識(shí)圖譜,與人腦一樣,這些關(guān)系知識(shí)圖譜出現(xiàn)又消失,最后那些確鑿無(wú)疑的關(guān)系被留了下來(lái),但是這些依然是動(dòng)態(tài)的,如果哪天法國(guó)的首都不再是巴黎,整個(gè)關(guān)系知識(shí)圖譜數(shù)據(jù)庫(kù)會(huì)將所有數(shù)據(jù)全部更新。


2,知識(shí)推理技術(shù)


當(dāng)知識(shí)圖譜建立后,要做的就是實(shí)際層面的應(yīng)用,將這些知識(shí)圖譜應(yīng)用到真正的實(shí)現(xiàn)中,當(dāng)用戶(hù)搜索某個(gè)問(wèn)題后,去檢索數(shù)據(jù)庫(kù)中的關(guān)系圖譜,然后將關(guān)聯(lián)性最高的精確答案呈現(xiàn)給用戶(hù)


1)直接推理。


我們以搜索“劉德華多少歲了”來(lái)舉例。


當(dāng)我們搜索這個(gè)問(wèn)題后,搜索結(jié)果中就會(huì)直接呈現(xiàn)出了劉德華的年齡,這就是運(yùn)用了知識(shí)的推理能力。這個(gè)53歲是一個(gè)動(dòng)態(tài)結(jié)果,機(jī)器在幕后進(jìn)行了大量的運(yùn)算后知道獲得年齡是一個(gè)動(dòng)態(tài)的算法,需要將此人的生日與當(dāng)前時(shí)間相減,之后才能得出結(jié)論。


同樣的,當(dāng)我們搜索“謝霆鋒兒子的母親的前夫的父親”后得出是“謝賢”的結(jié)果,這也是技術(shù)在背后的推理的作用。


2)分類(lèi)推理


上面談了比較簡(jiǎn)單直觀(guān)的推理模型,但這只是在用戶(hù)提問(wèn)有確定唯一結(jié)果答案的時(shí)候才那么奏效,但當(dāng)用戶(hù)搜索某個(gè)沒(méi)有唯一標(biāo)準(zhǔn)答案的問(wèn)題時(shí)就不再奏效。那么這里就會(huì)用到分類(lèi)推理的技術(shù)。


比如當(dāng)用戶(hù)搜索搜索“觀(guān)賞魚(yú)”。

 

觀(guān)賞魚(yú).png


這種搜索沒(méi)有指定的唯一標(biāo)準(zhǔn)答案,所以機(jī)器從后臺(tái)的知識(shí)體系庫(kù)中提取了關(guān)于“觀(guān)賞魚(yú)”的相關(guān)分類(lèi)內(nèi)容,列出了所有相關(guān)結(jié)果,給出了各個(gè)觀(guān)賞魚(yú)的種類(lèi)結(jié)果,好讓用戶(hù)去找到自己想要的結(jié)果。在這里又順便將三個(gè)搜索結(jié)果做了比較,百度的搜索結(jié)果最為全面,搜狗次之,而360沒(méi)有分類(lèi)。


通過(guò)大數(shù)據(jù),在后臺(tái)為實(shí)體知識(shí)進(jìn)行分類(lèi),這是一種在線(xiàn)性的直接推理之上的高層次整合式的推理。


分類(lèi)推理除了能夠提供直接的結(jié)果之外,還能夠?yàn)橛脩?hù)帶來(lái)額外的相關(guān)性的具有幫助的結(jié)果,當(dāng)我們搜索“關(guān)羽”時(shí),在搜索結(jié)果右側(cè)會(huì)展示出如下結(jié)果。


關(guān)羽.png


左上角是百度的結(jié)果,右上角是360的搜索結(jié)果,左下角是搜狗的搜索結(jié)果。


而這些結(jié)果都不是人工輸入的,全部都是通過(guò)大數(shù)據(jù)挖掘得出的結(jié)果,三家都能夠挖掘出與”關(guān)羽“相關(guān)的信息,但百度挖的更深,把關(guān)羽與劉備以及貂蟬的關(guān)系都挖了出來(lái)。這種對(duì)隱性信息挖掘是大數(shù)據(jù)價(jià)值的核心,大數(shù)據(jù)的價(jià)值不在于大,而在于挖掘有價(jià)值的關(guān)聯(lián),然后拉動(dòng)其他價(jià)值。舉個(gè)簡(jiǎn)單的例子,通過(guò)大數(shù)據(jù)發(fā)掘,發(fā)現(xiàn)下面包店某款面包會(huì)賣(mài)的更好,存在這么一種隱性關(guān)聯(lián),那么店主只需要準(zhǔn)備更多的該蛋糕就能帶來(lái)更多的收益。



關(guān)鍵三,對(duì)人的建模技術(shù)


題圖.jpg


機(jī)器發(fā)展出智能的最終目的是為了與人交互,所以還需要讓機(jī)器能夠理解人的行為,只有當(dāng)理解完人的行為后機(jī)器才有可能將知識(shí)運(yùn)用到與用戶(hù)的交互中,才有最終商業(yè)化落地的價(jià)值。


1,個(gè)體建模


個(gè)體.jpg


所謂個(gè)體建模,就是說(shuō)根據(jù)某單個(gè)用戶(hù)的操作行為為其提供私人定制化的服務(wù)?!敖袢疹^條”就是用的個(gè)體建模技術(shù),當(dāng)用戶(hù)查看新聞時(shí),它會(huì)根據(jù)用戶(hù)的行為軌跡,為用戶(hù)推薦其感興趣的內(nèi)容。同樣的,在百度搜索引擎中同樣如此,當(dāng)用戶(hù)搜索的關(guān)鍵詞越多,百度就越有能力向其推薦其更為感興趣的內(nèi)容。


比如當(dāng)用戶(hù)搜索“SF”關(guān)鍵詞后。


sf.jpg


如果該用戶(hù)經(jīng)常逛百度動(dòng)漫相關(guān)貼吧,搜索相關(guān)動(dòng)漫人物名稱(chēng),音樂(lè)等等操作,那么排序在第一位的就會(huì)是某個(gè)關(guān)于動(dòng)漫的網(wǎng)站,但是如果該用戶(hù)經(jīng)常搜索與快遞相關(guān)的知識(shí),那么排在第一位的就會(huì)是順豐網(wǎng)站。


這種針對(duì)個(gè)人的精準(zhǔn)建模在未來(lái)數(shù)據(jù)更加充足的情況下,每個(gè)人都將獲得數(shù)據(jù)化的留存,我們的一切行為都將數(shù)據(jù)化可視化,進(jìn)而得出自己的一切相關(guān)結(jié)論。當(dāng)前數(shù)據(jù)采集并建模這種技術(shù)已經(jīng)趨于成熟,剩下的就等物聯(lián)網(wǎng)大潮上陣。


2,群體建模


群體模型.jpg

光對(duì)個(gè)人建模還不夠,機(jī)器最重要的是對(duì)群體建模,而對(duì)群體建模也是商業(yè)化價(jià)值的核心所在。


所謂群體建模,就是判斷在某一場(chǎng)景下最多數(shù)人的行為進(jìn)行收集,然后取得各個(gè)場(chǎng)景下的群體交集,進(jìn)而得出擁有某一部分屬性的人經(jīng)常會(huì)做出哪些選擇。


這些人的屬性包括:地域、漫畫(huà)愛(ài)好者、美劇愛(ài)好者、父親、高考學(xué)生……

這些人的行為包括:看動(dòng)漫、看美劇、搜索育兒知識(shí)、搜索高考知識(shí)……


機(jī)器通過(guò)后臺(tái)的判斷將他們進(jìn)行群體人群的屬性與行為的歸類(lèi),然后讓相關(guān)高層找到可以進(jìn)行商業(yè)化決策的支撐。


上面說(shuō)的還是有點(diǎn)抽象,那我們?cè)僬f(shuō)的簡(jiǎn)單點(diǎn),比如我們通過(guò)大數(shù)據(jù)挖掘預(yù)測(cè)某個(gè)地域30歲以上的人在最近一段時(shí)間有很強(qiáng)的購(gòu)買(mǎi)秋褲的需求,那么商家在推廣秋褲的時(shí)候只需要加大在該地區(qū)的廣告投放即可獲得更高的利潤(rùn)回報(bào)。當(dāng)然這里不再是商家主動(dòng)去找答案,而是機(jī)器通過(guò)挖掘后主動(dòng)為其提供一系列選項(xiàng),商家只需要被動(dòng)接受即可。


結(jié)語(yǔ):


從某種意義上來(lái)看,讓機(jī)器理解語(yǔ)言的技術(shù)、知識(shí)挖掘技術(shù)、對(duì)人的建模技術(shù)這三大技術(shù)再經(jīng)過(guò)一段時(shí)間的發(fā)展后,對(duì)破解圖靈測(cè)試是有可能的。


但這種技術(shù)無(wú)論如何進(jìn)步都需要驅(qū)動(dòng)的“電池”,也就是人類(lèi)所產(chǎn)生的數(shù)據(jù),說(shuō)的更確切一些是人類(lèi)的欲望。


在我看來(lái),驅(qū)動(dòng)技術(shù)的唯有商業(yè)與軍事這二者,而這二者分別代表著欲望與恐懼,在這個(gè)和平年代的我們是幸運(yùn)的,我們被免去了戰(zhàn)爭(zhēng)的恐懼,進(jìn)而剩下的就是無(wú)盡的欲望,在技術(shù)與人越來(lái)越緊密不可分割的糾纏中,我們將迎來(lái)一個(gè)欲望與技術(shù)超級(jí)混合的新世界。


未來(lái)會(huì)怎樣?請(qǐng)關(guān)注微信公眾號(hào)“機(jī)器之心”。


文章為作者獨(dú)立觀(guān)點(diǎn),不代表創(chuàng)投分享會(huì)立場(chǎng)
知名風(fēng)險(xiǎn)投資公司
紅杉資本|瑞華投資|同創(chuàng)偉業(yè)|達(dá)晨創(chuàng)投|深創(chuàng)投|IDG|創(chuàng)東方|君聯(lián)資本|中科招商|經(jīng)緯中國(guó)|啟明創(chuàng)投|松禾資本|英特爾投資|優(yōu)勢(shì)資本|東方富海|天堂硅谷|九鼎投資|晨興創(chuàng)投|江蘇高科投|北極光創(chuàng)投|德同資本|凱雷投資|中國(guó)風(fēng)投|天圖資本|真格基金|DCM|IFC|凱鵬華盈|高盛投資|啟迪創(chuàng)投|戈壁|荷多投資|紀(jì)源資本|鼎暉投資|華平投資|金沙江投資|海納亞洲|永宣創(chuàng)投|險(xiǎn)峰華興創(chuàng)投|中投|海通開(kāi)元|中信資本|力鼎資本|平安創(chuàng)新資本|天使灣創(chuàng)投|和君資本|祥峰集團(tuán)|招商湘江投資|元禾控股|力合創(chuàng)投|復(fù)星創(chuàng)富|陜西高投|光速創(chuàng)投|富達(dá)亞洲|成為資本|中信產(chǎn)業(yè)基金|GIC|基石資本|金茂資本|富坤創(chuàng)投|盈富泰克|重慶科投|鼎暉創(chuàng)投|北工投資|海富投資|招商局資本|新天域資本|中路集團(tuán)|摩根士丹利|青云創(chuàng)投|建銀國(guó)際|德豐杰|弘毅投資|CVC|藍(lán)馳創(chuàng)投|寬帶資本|秉鴻資本|金石投資|天創(chuàng)資本|證大投資|中經(jīng)合|信中利|蘭馨亞洲|淡馬錫|浙商創(chuàng)投|華睿投資|景林資產(chǎn)|摯信資本|高特佳|清科創(chuàng)投|華登國(guó)際|山東高新投|集富亞洲|騰訊|無(wú)錫創(chuàng)投|創(chuàng)新工場(chǎng)|智基創(chuàng)投|策源創(chuàng)投|軟銀中國(guó)|
創(chuàng)業(yè)聯(lián)合網(wǎng)是創(chuàng)業(yè)者和投資人的交流平臺(tái)。平臺(tái)擁有5000+名投資人入駐。幫助創(chuàng)業(yè)企業(yè)對(duì)接投資人和投資機(jī)構(gòu),同時(shí)也是創(chuàng)業(yè)企業(yè)的媒體宣傳和交流合作平臺(tái)。
我想找投資人 我想發(fā)布信息
Copyright©創(chuàng)業(yè)聯(lián)合網(wǎng) ALL Rights Reserved
滬ICP備2024089025號(hào)-2
商務(wù)與客服聯(lián)系微信
大理市| 微博| 古田县| 屏边| 马边| 乌兰县| 诏安县| 建湖县| 马边| 常宁市| 亳州市| 平顺县| 富川| 留坝县| 呼和浩特市| 法库县| 黄冈市| 深泽县| 林口县| 平顶山市| 吉木萨尔县| 琼结县| 右玉县| 普兰店市| 榕江县| 新和县| 班玛县| 兴化市| 莱州市| 林甸县| 新竹县| 米易县| 四川省| 永丰县| 建德市| 巨鹿县| 屏东市| 剑阁县| 罗山县| 嘉义市| 新乡县|