重振人工智能雄心壯志的時(shí)刻已經(jīng)到了

(原文來(lái)自 MIT 科技評(píng)論,創(chuàng)投分享會(huì)評(píng)論)
在1955年夏天,4名頂級(jí)美國(guó)數(shù)學(xué)家(那時(shí)還沒(méi)有“計(jì)算機(jī)科學(xué)家”這個(gè)術(shù)語(yǔ))倡議在達(dá)特茅斯學(xué)院召開(kāi)了一次會(huì)議,來(lái)探討被他們稱(chēng)為“人工智能”的主題。“這項(xiàng)研究是在一個(gè)猜想的基礎(chǔ)上進(jìn)行,那就是學(xué)習(xí)的每一方面,或智能的任何其他特征,可以在原則上被精確地描述為,能夠造出一部機(jī)器來(lái)對(duì)其進(jìn)行模仿,”倡議書(shū)說(shuō)。
這次會(huì)議于1956年進(jìn)行,為期一個(gè)月,通常被認(rèn)為是人工智能研究的起始。倡議書(shū)作者中的三人,即表處理語(yǔ)言(LISP)發(fā)明者約翰·麥卡錫(John McCarthy),麻省理工學(xué)院40屆理學(xué)碩士、40屆博士、信息論先驅(qū)克勞德·香農(nóng)(Claude Shannon),以及后來(lái)的圖靈獎(jiǎng)得主馬爾溫·明斯基(Marvin Minsky),稍后都曾在麻省理工學(xué)院授課。
麥卡錫和明斯基(55年后他仍是麻省理工學(xué)院教師)創(chuàng)立了麻省理工學(xué)院人工智能實(shí)驗(yàn)室。
到1967年,計(jì)算機(jī)技術(shù)發(fā)展迅速,明斯基在他的書(shū)《計(jì)算:有限和無(wú)限的機(jī)器》(Computation: Finite and Infinite Machines)中大膽寫(xiě)道,“我確信,在一代人的時(shí)間內(nèi),智能的各個(gè)部分,鮮有哪個(gè)會(huì)在這部機(jī)器(電腦)的領(lǐng)域之外,創(chuàng)造‘人工智能’的問(wèn)題將在本質(zhì)上解決?!?/div>
當(dāng)然,明斯基的預(yù)測(cè)過(guò)于樂(lè)觀。早期人工智能研究者把贏得國(guó)際象棋比賽當(dāng)成智能應(yīng)用的范例,但后來(lái)發(fā)現(xiàn)這比區(qū)分口語(yǔ)詞匯或識(shí)別面孔之類(lèi)計(jì)算問(wèn)題要容易得多。
在20世紀(jì)80、90年代,隨著復(fù)制人類(lèi)智能的難度逐漸清晰化,人工智能具有了某些非常不同的含義,那就是實(shí)用的專(zhuān)用計(jì)算機(jī)系統(tǒng),通?;凇皺C(jī)器學(xué)習(xí)”,這應(yīng)用到對(duì)大量訓(xùn)練示例的統(tǒng)計(jì)分析。正是這一手段給了我們語(yǔ)音識(shí)別和自動(dòng)文本翻譯功能。
麻省理工學(xué)院的研究者們相信,現(xiàn)在是重振人工智能雄心壯志的時(shí)刻了,因?yàn)橛邢M_(kāi)發(fā)出更好的治療神經(jīng)紊亂的療法,以及能以人類(lèi)直覺(jué)預(yù)測(cè)我們需求的計(jì)算機(jī)系統(tǒng)。美國(guó)國(guó)家科學(xué)基金會(huì)(National Science Foundation)似乎也同意這一點(diǎn)。
去年9月,該基金會(huì)宣布為人腦及機(jī)器思維研究中心(Center for Brains, Minds, and Machines,簡(jiǎn)稱(chēng)CBMM)捐贈(zèng)2千5百萬(wàn)美元,該中心位于麻省理工學(xué)院的麥戈文腦科學(xué)硏究所(McGovern Institute for Brain Research)。
麻省理工學(xué)院為該中心提供12名主要研究人員,另有6人來(lái)自哈佛,還有5人來(lái)自其他機(jī)構(gòu)。
CBMM由托馬索·波焦(Tomaso Poggio)領(lǐng)導(dǎo),他是一名腦科學(xué)和人類(lèi)行為學(xué)教授,也是麥戈文研究所和計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(Computer Science and Artificial Intelligence Laboratory,簡(jiǎn)稱(chēng)CSAIL)的首席研究員。
對(duì)他的雙重身份展示了新中心的首要理念:如果能夠把計(jì)算、生理和心理的方法相結(jié)合,我們就能比孤立研究更快地理解人類(lèi)智能。
“這個(gè)中心嘗試的是,為了復(fù)制人類(lèi)智能,需要對(duì)大腦和認(rèn)知了解更多,而不是像50年前那樣僅僅依靠計(jì)算機(jī)科學(xué),”波焦說(shuō)。
帕特里克·溫斯頓(Patrick Winston)是電子工程和計(jì)算機(jī)科學(xué)系教授和CBMM的研究協(xié)調(diào)員,他補(bǔ)充說(shuō),調(diào)查問(wèn)題的技術(shù)在近年來(lái)有著顯著的提升。
溫斯頓說(shuō),首先,“計(jì)算是自由的,不論需要何種類(lèi)型的計(jì)算,都能夠做到?!彼€說(shuō),其次,“fMRI 現(xiàn)在已成常規(guī)。”fMRI 是指功能性磁共振成像,可用于研究大腦活動(dòng)。
他還指出了一些技術(shù),例如經(jīng)顱磁刺激,能夠在認(rèn)知測(cè)試中擾亂特定大腦區(qū)域的活動(dòng),以及光遺傳學(xué),這種技術(shù)利用光來(lái)選擇性地激活或沉默大腦中的轉(zhuǎn)基因神經(jīng)元。
光遺傳學(xué)的先驅(qū)是99屆工程碩士埃德-博伊登(Ed -Boyden),他是麻省理工學(xué)院媒體實(shí)驗(yàn)室(Media Lab)的教授,也是麥戈文研究所和新中心的首席研究員。
中心的研究圍繞幾個(gè)主要的主題或要點(diǎn)包括:視覺(jué)智力,其中集成了視覺(jué)、語(yǔ)言和運(yùn)動(dòng)技巧;智力回路,將包括神經(jīng)生物學(xué)和電氣工程學(xué)的研究;智能發(fā)展;以及社會(huì)智能。
波焦是視覺(jué)智力的主要研究者之一,他還將領(lǐng)導(dǎo)一個(gè)理論平臺(tái)的開(kāi)發(fā),旨在將研究結(jié)合在其他領(lǐng)域。
對(duì)于每一個(gè)要點(diǎn),CBMM研究者們正致力于定義一組基準(zhǔn)的問(wèn)題,令他們可以以此來(lái)評(píng)估他們的進(jìn)展。
波焦提供了一個(gè)例子,與他之前在視覺(jué)系統(tǒng)的研究相關(guān)。面對(duì)一副人們互動(dòng)的圖像,一臺(tái)智能計(jì)算機(jī)應(yīng)當(dāng)能為5個(gè)問(wèn)題提供合理的答案,從易到難分別是:圖像里有什么?圖像里都是誰(shuí)?人們?cè)谧鍪裁??誰(shuí)在對(duì)誰(shuí)做什么?接下來(lái)會(huì)發(fā)生什么?
不變量
探索圍繞著人類(lèi)智能的所有問(wèn)題的理論框架,是一個(gè)艱巨的任務(wù)。但是波焦對(duì)于大腦如何回答他列表上的第一個(gè)問(wèn)題的研究,為這一框架可能的樣子提供了一張草圖。
“圖像里有什么?”是人工智能研究的一個(gè)蓬勃發(fā)展的領(lǐng)域,需開(kāi)發(fā)物體識(shí)別的電腦系統(tǒng)來(lái)能夠回答這個(gè)問(wèn)題。
通常,物體識(shí)別系統(tǒng)會(huì)使用某些種類(lèi)的機(jī)器學(xué)習(xí)。人類(lèi)標(biāo)記樣本圖像,指示哪些物體出現(xiàn)在哪里,接著系統(tǒng)會(huì)嘗試識(shí)別該物體在所有圖像上所共有的一些常見(jiàn)特性。
“這與人類(lèi)學(xué)習(xí)或動(dòng)物學(xué)習(xí)完全不同,”他說(shuō)。“當(dāng)一個(gè)孩子學(xué)習(xí)認(rèn)識(shí)一只熊或一只獅子,你無(wú)需為他展示一百萬(wàn)次獅子的照片。大概兩到三次就夠了?!?/div>
波焦認(rèn)為與機(jī)器學(xué)習(xí)系統(tǒng)不同的是,人腦是以一種“不變”的方式描繪物體:不論物體有多大,是在視覺(jué)區(qū)域的何處,還是在旋轉(zhuǎn)的,描繪出的都是一樣的。他還相信,自己對(duì)這種描述的可能構(gòu)成有一個(gè)看上去合理的理論。
波焦的理論需要大腦或嘗試模擬大腦的電腦系統(tǒng)存儲(chǔ)一些物體的一塊模板,其中包含這些物體的每一種變化——類(lèi)型、位置和在平面上的旋轉(zhuǎn)。例如,大腦可能會(huì)存儲(chǔ)一張人臉的幾十張圖像,描繪出其360°的旋轉(zhuǎn)角度。
一個(gè)陌生的物體將被描繪成一個(gè)“點(diǎn)積”的集合,介于其圖像和模板之間。點(diǎn)積是線(xiàn)性代數(shù)的一種標(biāo)準(zhǔn)算法。不論該物體的大小、位置或方向如何,該集合總會(huì)維持原樣。
該理論具有說(shuō)服力的一點(diǎn)是,點(diǎn)積把兩組復(fù)雜數(shù)據(jù)集(例如視覺(jué)圖像)的對(duì)比,減少到一個(gè)數(shù)字。點(diǎn)積的各個(gè)集合,即便是為多個(gè)模板,也不會(huì)在記憶中占據(jù)太多空間。波焦說(shuō),另一個(gè)具有說(shuō)服力的一點(diǎn)是,“對(duì)于神經(jīng)元來(lái)說(shuō),點(diǎn)積是最簡(jiǎn)單的計(jì)算之一,或許就是最簡(jiǎn)單的?!?/div>
在實(shí)驗(yàn)中,波焦的系統(tǒng)或許無(wú)法超越機(jī)器學(xué)習(xí)系統(tǒng)。但它需要較少的訓(xùn)練例子,這表明它更好地復(fù)制了人腦的運(yùn)作。對(duì)于大多數(shù)計(jì)算任務(wù),人腦的方法通常是更好的。
波焦相信,積點(diǎn)的集合還能鎖定更抽象的概念。包括不同形狀物體集群的模板,就像一個(gè)骰子一面上的點(diǎn)一樣排列,或者排成一列或是圓形,能夠加強(qiáng)數(shù)字的概念。一個(gè)從不同透視關(guān)系觀察的平行線(xiàn)的模板,能夠加強(qiáng)平行或透視關(guān)系的概念。“可能會(huì)有更多有趣的事情有待探索,”他說(shuō)。
模糊思維
和波焦一樣,喬?!ぬ啬硝U姆(Josh Tenenbaum)是腦與認(rèn)知科學(xué)系(Department of Brain and Cognitive Sciences,簡(jiǎn)稱(chēng)BCS)的教授和CSAIL的首席研究員。
他領(lǐng)導(dǎo)的CBMM開(kāi)發(fā)要點(diǎn),集中于直觀把握孩子也能展示的物理現(xiàn)象,同時(shí)他也進(jìn)行有助于波焦領(lǐng)導(dǎo)的理論工作的研究。
特南鮑姆解釋說(shuō),最早的人工智能研究集中在構(gòu)建數(shù)學(xué)語(yǔ)言上,例如可以為“鳥(niǎo)能夠飛”和“鴿子是鳥(niǎo)類(lèi)”等論斷編碼。
研究者們認(rèn)為,如果語(yǔ)言足夠嚴(yán)謹(jǐn),計(jì)算機(jī)算法將能夠梳理編寫(xiě)在其中的論斷,并計(jì)算出所有邏輯上有效的推論。
但是,理解語(yǔ)言論斷所需要的背景信息被證明遠(yuǎn)比預(yù)期中要多。例如,并不是所有鳥(niǎo)都能飛。
在不能飛的鳥(niǎo)類(lèi)中,關(guān)在籠子中的知更鳥(niǎo)和翅膀斷了的知更鳥(niǎo)是有區(qū)別的,另一種區(qū)別是各種類(lèi)型的知更鳥(niǎo)和一只企鵝的區(qū)別。
以手工編寫(xiě)出足夠的這類(lèi)常識(shí)性例外,以使最基礎(chǔ)類(lèi)型的推理成為可能,被證明過(guò)分耗時(shí)。
相比之下,通過(guò)機(jī)器學(xué)習(xí),電腦可以自行學(xué)習(xí)某種東西的大量例子,并推斷這些例子的共同點(diǎn)。
例如,通過(guò)1百萬(wàn)張一只獅子的圖像,機(jī)器學(xué)習(xí)算法可以量化自身的猜測(cè):77%擁有這類(lèi)視覺(jué)特征的圖像是獅子的圖像。
但是,雖然這種方法對(duì)于明確定義的問(wèn)題處理得不錯(cuò),例如識(shí)別鳥(niǎo)類(lèi)的圖像,但在處理更抽象的概念時(shí)會(huì)遇到麻煩,例如飛行這種鳥(niǎo)類(lèi)、直升機(jī)、風(fēng)箏和超級(jí)英雄共有的能力。而比起語(yǔ)法和母性來(lái)說(shuō),飛行還算是一個(gè)具體化的概念。
特南鮑姆和他的學(xué)生們已經(jīng)開(kāi)發(fā)出一種新型工具,名為概率性編程語(yǔ)言,其中融合了新舊人工智能的最佳特色。
如同早期人工智能語(yǔ)言一樣,它包含了推理規(guī)則。但這些規(guī)則是概率性的。例如說(shuō)食火雞是一種鳥(niǎo),以特南鮑姆的語(yǔ)言編寫(xiě)的程序估計(jì)會(huì)得出這樣的結(jié)論:食火雞可能可以飛。
但假如程序隨后被告知食火雞的體重將近200磅,它大概就會(huì)把飛行可能性降低。
“在人工智能的兩個(gè)早期階段,最大的分歧在于符號(hào)對(duì)抗統(tǒng)計(jì),”特南鮑姆說(shuō)?!拔覀?cè)跀?shù)學(xué)方面的發(fā)現(xiàn)之一是如何將這兩點(diǎn)相結(jié)合,如何以這類(lèi)符號(hào)語(yǔ)言進(jìn)行統(tǒng)計(jì)推斷和概率推理。”
讀懂人們
波焦的五個(gè)基準(zhǔn)問(wèn)題中的第二個(gè)是“圖像里都是誰(shuí)?”。
這個(gè)問(wèn)題長(zhǎng)期以來(lái)一直與BCS教授南?!た簿S舍(Nancy Kanwisher)的工作相關(guān),她最知名的領(lǐng)域是,使用功能性核磁共振成像來(lái)識(shí)別和分析大腦的面部感知專(zhuān)門(mén)區(qū)域。
坎維舍領(lǐng)導(dǎo)著CBMM的社會(huì)智能要點(diǎn)研究,她把這當(dāng)成自己先前研究的自然延伸?!爱?dāng)你看一張臉時(shí),你感興趣的不僅是基本的人口統(tǒng)計(jì)方面信息,例如那具體是誰(shuí),他們是男是女,他們年齡多大,”她說(shuō)。“你能說(shuō)出的不僅是這個(gè)人快樂(lè)或悲傷,還有他們是自信還是躊躇,精力充沛還是被動(dòng)。通過(guò)非常簡(jiǎn)短的一瞥,我們能夠從一張臉上看出極為豐富的東西。”
坎維舍說(shuō),人類(lèi)通過(guò)肢體語(yǔ)言,同樣可以推斷出很多關(guān)于人們情緒、意圖,以及與他人的關(guān)系。肢體語(yǔ)言有著符合計(jì)算建模的優(yōu)勢(shì)。
她還援引了已故的納莉尼·阿姆巴迪(Nalini Ambady)的研究,后者是斯坦福大學(xué)的社會(huì)心理學(xué)家,曾開(kāi)發(fā)出“薄片判斷”理論。
“在學(xué)期開(kāi)始時(shí),她錄下了哈佛課程助教在班級(jí)前講課,”坎維舍說(shuō)?!叭缓笏堰@些視頻非常簡(jiǎn)短的片段向心理學(xué)實(shí)驗(yàn)的對(duì)象展示,并說(shuō)‘為這名教師的效率打分’。這些人都是看到一個(gè)人在教室前對(duì)一個(gè)班級(jí)講話(huà)的幾秒鐘,甚至都沒(méi)聽(tīng)到在說(shuō)什么。而她發(fā)現(xiàn),這些評(píng)分結(jié)果,與那個(gè)人的實(shí)際學(xué)生的評(píng)分非常接近?!?/div>
坎維舍說(shuō),CBMM社會(huì)智能要點(diǎn)的第一個(gè)項(xiàng)目,將是設(shè)計(jì)一組實(shí)驗(yàn)任務(wù),令研究人員能夠量化人類(lèi)社會(huì)知覺(jué)。一旦研究人員建立一條基線(xiàn),他們就能進(jìn)行一些研究,例如童年期間各項(xiàng)任務(wù)的表現(xiàn),或是自閉癥兒童不同于其他兒童的表現(xiàn)。
他們還能確認(rèn)參與社會(huì)知覺(jué)的大腦區(qū)域,方法是通過(guò)功能性核磁共振成像來(lái)測(cè)量神經(jīng)活動(dòng),或是通過(guò)經(jīng)顱磁刺激來(lái)干擾表現(xiàn)。在收集所有這些數(shù)據(jù)之后,他們將嘗試為大腦運(yùn)行進(jìn)行精確計(jì)算機(jī)建模。
聽(tīng)懂故事
波焦的列表上后邊的問(wèn)題是“誰(shuí)在對(duì)誰(shuí)做什么?”和“接下來(lái)會(huì)發(fā)生什么?”這些問(wèn)題吸引著帕特里克·溫斯頓(Patrick Winston)。
他認(rèn)為,定義人類(lèi)智能的特征就是講述和理解故事。
這種能力甚至在標(biāo)記圖像過(guò)程中發(fā)揮作用。正如溫斯頓喜歡指出的一樣,一個(gè)人類(lèi)能夠把一個(gè)人拿起杯子放到嘴邊的圖像識(shí)別為他在喝酒。如果這個(gè)人拿著杯子向前幾英寸,那他就是在敬酒。不過(guò)一只貓頭朝上接著水龍頭里的幾滴水的圖像,也會(huì)被人們識(shí)別為喝水的實(shí)例。
“你必須思考你所看到的是一個(gè)故事,”溫斯頓說(shuō)。“它們得到相同的標(biāo)簽,因?yàn)檫@是相同的故事,而不是因?yàn)榭雌饋?lái)一樣?!?/div>
這就是把一個(gè)研究要點(diǎn)貢獻(xiàn)給視覺(jué)、語(yǔ)言,以及社會(huì)和運(yùn)動(dòng)技能的一個(gè)原因。
為說(shuō)明另一個(gè)原因,溫斯頓援引了發(fā)展心理學(xué)家伊麗莎白·斯皮克(Elizabeth Spelke)進(jìn)行的一項(xiàng)實(shí)驗(yàn),她是前麻省理工學(xué)院教員,目前在哈佛,是發(fā)展要點(diǎn)的主要研究者之一。
斯皮克曾被一些實(shí)驗(yàn)引起了興趣,在那些實(shí)驗(yàn)中,研究人員把老鼠放在一間房間中心的一個(gè)旋轉(zhuǎn)平臺(tái)上。食物被明顯地放在一個(gè)角落,但隨后被擋板遮住。相同的擋板被安置在其余三個(gè)角落,平臺(tái)則被旋轉(zhuǎn)。
斯皮克決定將該研究擴(kuò)展到人類(lèi)兒童和成人上,隱藏物改為一個(gè)玩具或一串鑰匙而非食物。
對(duì)于所有動(dòng)物、兒童和成人來(lái)說(shuō),一旦旋轉(zhuǎn)停止,實(shí)驗(yàn)對(duì)象或者走向被遮蔽物的角落,或者走向?qū)堑慕锹洌雌饋?lái)和被遮蔽物的角落一樣),兩者概率相等。
研究者們還改變了實(shí)驗(yàn),為目標(biāo)物體對(duì)角角落的墻上涂上不同的顏色。動(dòng)物和兒童仍然以相等的概率選擇正確角落或?qū)墙锹洌赡耆藙t可以相對(duì)可靠地找到目標(biāo)。
這就是事情變得有趣的地方。如果成年人在前往目標(biāo)前,被要求聽(tīng)一段文本并背誦,那么他們又會(huì)被截然相反的角落所混淆。收聽(tīng)和背誦文本“消耗了人類(lèi)的語(yǔ)言處理器,把他們降到了老鼠的級(jí)別,”溫斯頓說(shuō)?!爸笏麄儠?huì)說(shuō),‘是的,我可以看到藍(lán)色的墻,但卻沒(méi)能記住?!?/div>
回答CBMM的基準(zhǔn)列表上最高級(jí)別的問(wèn)題,大概會(huì)比NSF最初資助的5年需要長(zhǎng)得多的時(shí)間。不過(guò)波焦說(shuō),“是時(shí)候再試一次了。已經(jīng)過(guò)了50年。我們不清楚這一次能否成功。但如果我們不去嘗試,就無(wú)從知道。”
知名風(fēng)險(xiǎn)投資公司
紅杉資本|瑞華投資|同創(chuàng)偉業(yè)|達(dá)晨創(chuàng)投|深創(chuàng)投|IDG|創(chuàng)東方|君聯(lián)資本|中科招商|經(jīng)緯中國(guó)|啟明創(chuàng)投|松禾資本|英特爾投資|優(yōu)勢(shì)資本|東方富海|天堂硅谷|九鼎投資|晨興創(chuàng)投|江蘇高科投|北極光創(chuàng)投|德同資本|凱雷投資|中國(guó)風(fēng)投|天圖資本|真格基金|DCM|IFC|凱鵬華盈|高盛投資|啟迪創(chuàng)投|戈壁|荷多投資|紀(jì)源資本|鼎暉投資|華平投資|金沙江投資|海納亞洲|永宣創(chuàng)投|險(xiǎn)峰華興創(chuàng)投|中投|海通開(kāi)元|中信資本|力鼎資本|平安創(chuàng)新資本|天使灣創(chuàng)投|和君資本|祥峰集團(tuán)|招商湘江投資|元禾控股|力合創(chuàng)投|復(fù)星創(chuàng)富|陜西高投|光速創(chuàng)投|富達(dá)亞洲|成為資本|中信產(chǎn)業(yè)基金|GIC|基石資本|金茂資本|富坤創(chuàng)投|盈富泰克|重慶科投|鼎暉創(chuàng)投|北工投資|海富投資|招商局資本|新天域資本|中路集團(tuán)|摩根士丹利|青云創(chuàng)投|建銀國(guó)際|德豐杰|弘毅投資|CVC|藍(lán)馳創(chuàng)投|寬帶資本|秉鴻資本|金石投資|天創(chuàng)資本|證大投資|中經(jīng)合|信中利|蘭馨亞洲|淡馬錫|浙商創(chuàng)投|華睿投資|景林資產(chǎn)|摯信資本|高特佳|清科創(chuàng)投|華登國(guó)際|山東高新投|集富亞洲|騰訊|無(wú)錫創(chuàng)投|創(chuàng)新工場(chǎng)|智基創(chuàng)投|策源創(chuàng)投|軟銀中國(guó)|
創(chuàng)業(yè)聯(lián)合網(wǎng)是創(chuàng)業(yè)者和投資人的交流平臺(tái)。平臺(tái)擁有5000+名投資人入駐。幫助創(chuàng)業(yè)企業(yè)對(duì)接投資人和投資機(jī)構(gòu),同時(shí)也是創(chuàng)業(yè)企業(yè)的媒體宣傳和交流合作平臺(tái)。
熱門(mén)標(biāo)簽
精華文章
Copyright©創(chuàng)業(yè)聯(lián)合網(wǎng) ALL Rights Reserved
商務(wù)與客服聯(lián)系微信


