普林斯頓大學(xué) | “學(xué)會看,學(xué)會讀”:人工智能進入新時代
指南者留學(xué)
2023-01-10 16:52:05
閱讀量:1212
<p>為了讓人工智能發(fā)揮其潛力——將人類從平凡的任務(wù)中解放出來,讓生活更輕松,并最終發(fā)明出全新的解決方案來解決我們的問題——計算機需要在人類擅長的兩件事上超越我們:觀察我們周圍的世界 并理解我們的語言。</p>
<p> </p>
<p>普林斯頓大學(xué)計算機科學(xué)系主任、戈登 Y.S. 吳工學(xué)教授。 “我們將這些領(lǐng)域稱為計算機視覺和自然語言處理。 這兩個領(lǐng)域是獨立發(fā)展的,但我們的教師正在以有趣的方式將它們結(jié)合在一起。”</p>
<p> </p>
<p>近年來,普林斯頓及其他地區(qū)的研究人員在這兩個領(lǐng)域取得了重大進展,開啟了各種應(yīng)用的快速發(fā)展。 “在過去十年中發(fā)生了巨大的轉(zhuǎn)變,”從事計算機視覺工作的計算機科學(xué)助理教授奧爾加·魯薩科夫斯基 (Olga Russakovsky) 說。 “我們正在進入真正有效的第二個十年。”</p>
<p> </p>
<p><span class="h1">看我們的世界</span></p>
<p><br />提高我們捕獲和分析圖像的能力是將人類甚至超人的視覺能力帶入手機、機器人和健康設(shè)備等機器的重要組成部分。</p>
<p><br />費利克斯·海德 (Felix Heide) 是研究人員之一,他正在開發(fā)人工智能方法來改進計算機的眼睛,即相機。 他的目標(biāo)是幫助相機進化到視覺能力達到或超過人類或動物的程度。</p>
<p> </p>
<p>“相機是現(xiàn)實世界和機器之間無處不在的接口。”從事人工智能、物理和光學(xué)接口工作的計算機科學(xué)助理教授海德說。</p>
<p> </p>
<p>海德和華盛頓大學(xué)的合作者最近制造了一個相機,它非常小,只有一粒鹽那么大。 該設(shè)備由超過一百萬個納米級圓柱柱組成,這些柱與光相互作用以產(chǎn)生圖像。 該相機在同一個計算機芯片上結(jié)合了圖像處理和軟件。</p>
<p> </p>
<p>該團隊使用 AI 優(yōu)化柱子的形狀和位置以調(diào)節(jié)光線,以便在使用 AI 重建和細化生成的圖像時記錄最佳圖片。 該團隊的方法依賴于一種被稱為人工神經(jīng)網(wǎng)絡(luò)的人工智能,它以大腦的神經(jīng)元和連接為模型,并結(jié)合光傳輸物理學(xué)模型。 模型中的神經(jīng)元實際上是稱為節(jié)點的計算機算法,它們接收信息、執(zhí)行計算并產(chǎn)生輸出。</p>
<p> </p>
<p>“將物理模型與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合是設(shè)計相機的新范例,”海德說。 “我們能夠使用人工智能在光學(xué)方面開辟一個完全不同的設(shè)計空間。”</p>
<p> </p>
<p>海德說,這種人工智能驅(qū)動的相機未來的應(yīng)用非常廣泛。 將數(shù)以千計的此類攝像機排列成陣列可以將整個表面變成全場景攝像機。 這些微型相機可以內(nèi)置于超薄內(nèi)窺鏡中,用于從體內(nèi)進行醫(yī)學(xué)診斷。 通過將成像和信息處理結(jié)合在一個設(shè)備中,這些相機可能是安全應(yīng)用的理想選擇。</p>
<p> </p>
<p>人工智能還幫助我們看到以前從未見過的物體,例如單個蛋白質(zhì)、生命的組成部分,有時還包括阿爾茨海默氏癥等疾病的病因。 即使使用最強大的設(shè)備,蛋白質(zhì)也太小而無法詳細觀察。 人工智能可以改變這一點。</p>
<p><br />新任計算機科學(xué)助理教授 Ellen Zhong 開發(fā)了機器學(xué)習(xí)技術(shù)來獲取蛋白質(zhì)的三維結(jié)構(gòu)。 她處理使用冷凍電子顯微鏡捕獲的圖像,這包括首先冷凍蛋白質(zhì)以平息它們的振動,然后再使用電子顯微鏡對樣品進行成像。</p>
<p> </p>
<p>生成的圖像包含一系列來自各個方向的分子二維快照。 然后研究人員使用復(fù)雜的算法來合成不同的視圖并將 3-D 結(jié)構(gòu)拼接在一起,這可以揭示這些復(fù)雜分子中原子的位置。</p>
<p> </p>
<p>Zhong 使用機器學(xué)習(xí)來理解冷凍電鏡圖像中復(fù)雜數(shù)據(jù)的模式,幫助研究人員比以往任何時候都更接近蛋白質(zhì)的準確表示。 但她并不打算就此止步。</p>
<p> </p>
<p>“我的研究中一個令人興奮的前瞻性領(lǐng)域是能夠可視化完整的細胞而不是單個蛋白質(zhì),”鐘說。 “現(xiàn)在,我們可以進行 3-D 重建以可視化單個分子,但這只是拼圖的一個孤立部分。”</p>
<p> </p>
<p>Zhong 是眾多研究人員之一,他們認為人工智能可能是解決更大目標(biāo)的重要關(guān)鍵,即了解單個蛋白質(zhì)如何在細胞景觀中相互作用。 通過更好地了解這些相互作用,生物學(xué)家可以幫助為許多涉及蛋白質(zhì)功能障礙的疾病創(chuàng)造新的療法。</p>
<p> </p>
<p>AI 不僅幫助我們看到新事物,還幫助我們通過改進自然語言處理進行交流。 這些系統(tǒng)落后于計算機翻譯語言、將語音轉(zhuǎn)換為文本和回答口頭問題的能力。</p>
<p> </p>
<p><strong><span class="h1">幫助計算機理解我們</span></strong></p>
<p><br />普林斯頓的自然語言處理小組旨在讓計算機有效地理解和使用人類語言。 該小組由兩位計算機科學(xué)助理教授 Danqi Chen 和 Karthik Narasimhan 發(fā)起,成員包括普林斯頓大學(xué) Charles C. Fitzmorris 計算機科學(xué)教授 Sanjeev Arora。</p>
<p><br />Chen 正在致力于開發(fā)能夠通過書面和口頭語言交互獲取人類知識的機器,并且能夠在很少或沒有外部指導(dǎo)的情況下理解、推理和做出決策和判斷。</p>
<p> </p>
<p>“我研究了一些基本問題,比如我們應(yīng)該如何在神經(jīng)網(wǎng)絡(luò)中表示文本,我們應(yīng)該如何提取和編碼文本中的信息,以及我們?nèi)绾螜z索相關(guān)信息并將其用于下游應(yīng)用程序,例如問答和對話系統(tǒng)。”陳說。</p>
<p> </p>
<p>在過去的兩三年中,自然語言處理領(lǐng)域通過引入大型語言模型 (LLM) 實現(xiàn)了轉(zhuǎn)型,通過簡單的自然語言指令開啟了開放式人機交互的新時代。 盡管令人興奮,但這些 LLM 可能包含數(shù)千億個參數(shù),使它們比以前的模型大一千倍。</p>
<p> </p>
<p>訓(xùn)練這些模型需要付出巨大的財務(wù)和環(huán)境成本,因此僅限于少數(shù)大公司和資金充足的研究實驗室。 “我目前正在解決的一個主要問題是如何縮小這些模型并開發(fā)更有效的解決方案來訓(xùn)練和調(diào)整這些非常大的模型。”陳說。</p>
<p><br />Narasimhan 正在開發(fā)可以通過與環(huán)境交互來獲取語言的自主系統(tǒng)。 他還希望提高計算機接收文本信息并利用它來推動決策的能力。</p>
<p> </p>
<p>Narasimhan 說:“當(dāng)今大多數(shù)自然語言處理模型都專注于僅從文本中學(xué)習(xí)語義表示,但對自然語言的深入理解需要 AI 系統(tǒng)的情境和上下文意識來解決歧義、避免誤解并提供適當(dāng)?shù)幕貞?yīng)。” “我們的實驗室專注于具身語言理解,目標(biāo)是教機器在交互式、多模式環(huán)境中理解和使用語言。”</p>
<p> </p>
<p>Narasimhan 的團隊還開發(fā)了新方法,讓計算機通過“做”和“讀”的結(jié)合來學(xué)習(xí)——就像人類一樣——這與強化學(xué)習(xí)等主要人工智能范式的“反復(fù)試驗”性質(zhì)相反,強化學(xué)習(xí)是一種基于訓(xùn)練方法 關(guān)于獎勵期望的行為。 例如,假設(shè)您決定將網(wǎng)球作為一項運動。 你可以在沒有任何外部輸入的情況下每天在球場上擊球并慢慢提高,但更有可能你會從互聯(lián)網(wǎng)上獲得提示或通過教練的口頭反饋來獲得更快的進步。</p>
<p> </p>
<p>“我想象一個不太遙遠的未來,人工智能系統(tǒng)可以類似地使用語言作為一種方式,通過書籍、手冊和互聯(lián)網(wǎng)從人類經(jīng)驗中獲得提煉的知識和指導(dǎo)。”Narasimhan 說。</p>
<p> </p>
<p>在過去的幾年里,Arora 一直被以下問題所吸引:AI 是如何工作的,為什么某些 AI 方法比其他方法更有效,以及 AI 系統(tǒng)在學(xué)習(xí)時會發(fā)生什么。 Arora 有興趣弄清楚神經(jīng)網(wǎng)絡(luò)在處理周圍世界時內(nèi)部發(fā)生了什么。</p>
<p> </p>
<p>“我的工作是在更嚴格和數(shù)學(xué)的層面上理解人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練內(nèi)部發(fā)生的事情。”阿羅拉說。 “我們說我們的目標(biāo)是打開黑匣子。” 這將有助于理解神經(jīng)網(wǎng)絡(luò)給出的答案,也可能導(dǎo)致更好的訓(xùn)練算法和更強大的學(xué)習(xí)者。</p>
<p> </p>
<p>通過了解神經(jīng)網(wǎng)絡(luò)運行時會發(fā)生什么,Arora 希望幫助工程師更好地規(guī)劃和設(shè)計他們的算法。</p>
<p> </p>
<p><strong><span class="h1">讓人工智能更聰明</span></strong></p>
<p><br />人工智能在很多方面已經(jīng)趕上了人類,在識別熟悉的圖像、翻譯語言和將文本轉(zhuǎn)換為語音方面變得和我們一樣出色。 人工智能可以比大多數(shù)人更快地完成這些事情。 但人工智能真的能幫助人們創(chuàng)造和創(chuàng)新嗎?</p>
<p> </p>
<p>在 Ryan Adams 的實驗室中,研究人員追尋的問題是,他們能否使用 AI 設(shè)計新事物?</p>
<p> </p>
<p>“我們有合成新圖片和文本的生成模型。”計算機科學(xué)教授兼普林斯頓大學(xué)統(tǒng)計學(xué)和機器學(xué)習(xí)本科項目主任亞當(dāng)斯解釋說。 “但我們也在研究如何使用人工智能為現(xiàn)實世界的物體創(chuàng)造新型設(shè)計,例如,發(fā)明新的抗生素分子、新的機械系統(tǒng)或新材料。 不僅僅是設(shè)計,我們還希望人工智能幫助我們制造這些東西。”</p>
<p> </p>
<p>Adams 研究的一項最新創(chuàng)新是將 AI 模型應(yīng)用于計算機輔助設(shè)計 (CAD) 工具。 Adams 和他的團隊創(chuàng)建了 AI 軟件,該軟件經(jīng)過人工設(shè)計的 CAD 草圖訓(xùn)練,可以自行自動提出新發(fā)明的建議。 “想想使用 Microsoft Word,當(dāng)你拼錯某些內(nèi)容時,它會自動更正或建議新文本,”Adams 解釋道。 “如果我們可以為設(shè)計做到這一點呢?”</p>
<p> </p>
<p>在他辦公室的大廳對面,亞當(dāng)斯有一個實驗室空間,里面擺滿了機床、3D 打印機和激光切割機。 這是一個高度物理化的設(shè)置,不像大多數(shù) AI 實驗室,在這些實驗室中,研究人員在電腦屏幕后完成大部分工作。 “我們有一些有趣的混亂。”他說。</p>
<p> </p>
<p>Adams 認為他和他的同事在他們的研究中所做的最有影響力的事情之一就是深入思考物理學(xué)和人工智能之間的相互作用。 “發(fā)明是關(guān)于物理體現(xiàn)的。”亞當(dāng)斯說。 “這是關(guān)于制造東西,你不能對它背后的物理學(xué)視而不見。”</p>
<p> </p>
<p>Adji Bousso Dieng 也在深入思考科學(xué)與人工智能的交集——但方式不同。</p>
<p> </p>
<p>Dieng 領(lǐng)導(dǎo) Vertaix,這是普林斯頓的一個跨學(xué)科研究實驗室,致力于人工智能和自然科學(xué)的交叉領(lǐng)域。</p>
<p> </p>
<p>計算機科學(xué)助理教授迪昂說:“我們正在研究科學(xué)發(fā)現(xiàn)過程中涉及的每一步,并根據(jù)該過程中出現(xiàn)的問題開發(fā)人工智能方法。”</p>
<p> </p>
<p>該發(fā)現(xiàn)過程的一個核心部分是確保機器學(xué)習(xí)算法能夠生成包含我們在自然世界中看到的多樣性的解決方案或結(jié)果。 Dieng 和她的合作者 Dan Friedman,博士。 普林斯頓計算機科學(xué)系的學(xué)生,利用生態(tài)學(xué)領(lǐng)域中使用的多樣性定義來開發(fā)一種稱為 Vendi 分數(shù)的指標(biāo)來衡量模型的多樣性。</p>
<p> </p>
<p>Vendi Score 著眼于樣本中元素之間的相似性——在一個例子中,是大量氣味分子——并返回分子之間的多樣性或差異程度的分數(shù)。 例如,如果所有氣味分子都屬于“草本”類別,則得分會低于顯示更多氣味類別的情況。</p>
<p> </p>
<p>與機器學(xué)習(xí)中的其他多樣性估計不同,該分數(shù)可用于任何可以定義相似性的問題。 它是無人監(jiān)督的,因為它不需要人為數(shù)據(jù)集添加標(biāo)簽。 “為了讓人工智能能夠發(fā)現(xiàn),我們應(yīng)該能夠衡量多樣性并將其納入我們開發(fā)的方法中,”Dieng 說。</p>
<p> </p>
<p>Dieng 說,科學(xué)界對 AI 的興趣正在迅速增長。 “10 年后,人工智能的最大影響將來自科學(xué)。”</p>
<p> </p>
<p>在谷歌人工智能實驗室,普林斯頓大學(xué)和谷歌研究人員合作的校園附近的研究中心,計算機科學(xué)教授埃拉德哈贊和他的團隊正在應(yīng)對挑戰(zhàn),例如控制患者的呼吸機以及機器控制技術(shù)的其他情況 . 為此,他們正在開發(fā)新的算法來改進機器學(xué)習(xí)方法并提高它們的效率。</p>
<p> </p>
<p>已知最快的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法源于 Hazan 的優(yōu)化工作,并廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)界。 Hazan 目前的研究涉及控制領(lǐng)域,目標(biāo)是使用可觀察到的信號來操縱物理系統(tǒng),例如醫(yī)用呼吸機。 “控制領(lǐng)域可以追溯到幾十年前,甚至幾個世紀前,”Hazan 說。 “我們對它的看法是新的,因為我們正在使用人工智能和深度學(xué)習(xí),它們是新工具并產(chǎn)生新方法。”</p>
<p> </p>
<p>在他的實驗室里,他和他的合作者正在研究開發(fā)訓(xùn)練神經(jīng)網(wǎng)絡(luò)以某種方式執(zhí)行的方法。 例如,Hazan 的方法可用于控制自動駕駛汽車和機器人。 “一般來說,控制領(lǐng)域的創(chuàng)新對機器人技術(shù)有影響,”Hazan 說。 “控制理論涉及一般性地操縱物理系統(tǒng)。 它可以是呼吸機、機器人、無人機或自動駕駛汽車。”</p>
<p> </p>
<p><strong><span class="h1">擴大社區(qū)</span></strong></p>
<p>人工智能的快速采用必須伴隨著解決人工智能算法中有關(guān)種族和性別偏見的問題。</p>
<p> </p>
<p>Russakovsky 是該領(lǐng)域的研究人員之一,致力于從工程角度解決倫理問題。 “我們開始問——作為工程師,作為這些系統(tǒng)的構(gòu)建者——我們能做些什么來確保它們對所有人都同樣準確,”Russakovsky 說。</p>
<p> </p>
<p>先前的研究發(fā)現(xiàn)了人工智能驅(qū)動過程中嵌入的顯著偏見。 例如,面部識別系統(tǒng)在識別膚色較淺的男性和膚色較深的女性時表現(xiàn)得更加準確。</p>
<p> </p>
<p>Russakovsky 和她的團隊正在為這些問題設(shè)計解決方案。 她幫助構(gòu)建了一個名為 REVISE 的工具,該工具分析視覺數(shù)據(jù)集是否存在偏見跡象,包括種族和性別偏見。</p>
<p> </p>
<p>“這是一個非常復(fù)雜的空間,從技術(shù)的角度來看它有點像第 22 條軍規(guī),”Russakovsky 說。 “你必須設(shè)計技術(shù)解決方案,但你設(shè)計的任何技術(shù)解決方案本質(zhì)上都是對潛在問題的簡化。”</p>
<p> </p>
<p>盡管面臨挑戰(zhàn),Russakovsky 對 AI 取得的進步感到興奮。 既然研究人員知道了這些視覺學(xué)習(xí)應(yīng)用程序在現(xiàn)實世界中的表現(xiàn)如何,他們希望進一步突破它們實際可能達到的極限。 “現(xiàn)在的問題是:我們可以解決的新領(lǐng)域是什么?” 魯薩科夫斯基說。</p>
<p> </p>
<p>隨著整個大學(xué)的研究人員不斷創(chuàng)新并進入下一代機器學(xué)習(xí),吸引下一代 AI 研究人員到普林斯頓將非常重要。 合作機會只會越來越多。 就 Adams 而言,他認為大學(xué)有能力在 AI 領(lǐng)域?qū)崿F(xiàn)甚至在去年似乎不可能的事情。 “我們在規(guī)模和質(zhì)量之間取得了這種平衡,”亞當(dāng)斯說。</p>
<p> </p>
<p>亞當(dāng)斯說,普林斯頓足夠小,人工智能研究人員可以步行穿過校園與機器人技術(shù)的工程師和研究人員合作,同時提供世界一流的教學(xué)和研究。 “普林斯頓在將事物帶到月球上絕對具有獨特的優(yōu)勢。</p>
<p> </p>
<blockquote>
<p>注:本文由院校官方新聞直譯,僅供參考,不代表指南者留學(xué)態(tài)度觀點。</p>
</blockquote>