亚洲精品中文免费|亚洲日韩中文字幕制服|久久精品亚洲免费|一本之道久久免费

      
      

            <dl id="hur0q"><div id="hur0q"></div></dl>

                人腦90%都是自監(jiān)督學習,AI大模型離模擬大腦還有多遠?

                人腦90%都是自監(jiān)督學習,AI大模型離模擬大腦還有多遠?

                編輯:David Joey

                【新智元導讀】人的大腦和自監(jiān)督學習模型的相似度有多高?

                我們都知道,人類的大腦90%都是自監(jiān)督學習的,生物會不斷對下一步發(fā)生的事情做出預測。

                自監(jiān)督學習,就是不需要外部干預也能做出決策。

                只有少數情況我們會接受外部反饋,比如老師說:「你搞錯了」。

                而現在有學者發(fā)現,大型語言模型的自監(jiān)督學習機制,像極了我們的大腦。

                知名科普媒體Quanta Magazine近日報道,越來越多的研究發(fā)現,自監(jiān)督學習模型,尤其是大型語言模型的自學方式,與我們的大腦的學習模式非常類似。

                過去常見的AI系統(tǒng)都是使用大量標記數據進行訓練的。

                例如,圖像可能被標記為「虎斑貓」或「虎貓」,用以訓練人工神經網絡來正確區(qū)分虎斑和虎。

                這種「自監(jiān)督」訓練需要人工費力地標記數據,而神經網絡通常會走捷徑,學習將標簽與最少、有時甚至是膚淺的信息聯系起來。

                例如,神經網絡可能會使用草的存在來識別奶牛的照片,因為奶牛通常是在田野中拍攝的。

                加州大學伯克利分校的計算機科學家阿列克謝·埃弗羅斯 (Alexei Efros) 說:

                我們正在培養(yǎng)的算法,就像是一整個學期都沒來上課的本科生,雖然他們并沒有系統(tǒng)學習這些材料,但他們在考試中表現出色。

                此外,對于對動物智能和機器智能的交叉感興趣的研究人員來說,這種「監(jiān)督學習」可能僅限于它對生物大腦的揭示。

                許多動物,包括人類不使用標記數據集來學習。在大多數情況下,他們自己探索環(huán)境,并且通過這樣做,他們對世界獲得了豐富而深刻的理解。

                現在,一些計算神經科學家已經開始探索使用很少或沒有人工標記數據進行訓練的神經網絡。

                最近的研究結果表明,使用自我監(jiān)督學習模型構建的動物視覺和聽覺系統(tǒng)的計算模型比監(jiān)督學習模型更接近大腦功能。

                對一些神經科學家來說,人工神經網絡似乎開始揭示用大腦來類比機器學習的途徑。

                有缺陷的監(jiān)督

                大約10年前,受人工神經網絡啟發(fā)的大腦模型開始出現,同時一個名為AlexNet的神經網絡徹底改變了對未知圖像進行分類的任務。

                這項成果在Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton 的論文「ImageNet Classification with Deep Convolutional Neural Networks」中發(fā)表。

                論文地址:https://dl.acm.org/doi/10.1145/3065386

                與所有神經網絡一樣,該網絡由多層人工神經元組成,其中不同神經元之間連接的權重不同。

                如果神經網絡未能正確分類圖像,學習算法會更新神經元之間連接的權重,以降低在下一輪訓練中錯誤分類的可能性。

                該算法重復此過程多次,調整權重,直到網絡的錯誤率低到可以接受的程度。

                之后,神經科學家使用AlexNet開發(fā)了第一個靈長類視覺系統(tǒng)(Primate Visual System)的計算模型。

                當猴子和人工神經網絡顯示相同的圖像時,真實神經元和人工神經元的活動顯示出類似的反應。

                在聽覺和氣味檢測的人工模型上也取得了相似的結果。

                但隨著該領域的發(fā)展,研究人員意識到自監(jiān)督訓練的局限性。

                2017年,德國蒂賓根大學的計算機科學家Leon Gatys和他的同事拍攝了一張福特T型車的照片,然后在照片上覆蓋了豹皮圖案。

                人工智能神經網絡將原始圖像正確分類為Model T,但將修改后的圖像視為豹子。

                原因是它只專注于圖像紋理,不了解汽車(或豹子)的形狀。

                自監(jiān)督學習模型旨在避免此類問題。

                瑞士巴塞爾弗里德里?!っ仔獱柹镝t(yī)學研究所的計算神經科學家弗里德曼·岑克 (Friedemann Zenke) 說,

                在這種方法中,人類不會標記數據,相反,標簽來自數據本身。自監(jiān)督算法本質上是在數據中創(chuàng)建空白,并要求神經網絡填補空白。

                例如,在所謂的大型語言模型中,訓練算法將向神經網絡顯示句子的前幾個單詞,并要求它預測下一個單詞。

                當使用從互聯網收集的大量文本進行訓練時,該模型似乎可以學習語言的句法結構,展示出令人印象深刻的語言能力——所有這些都沒有外部標簽或監(jiān)督。

                計算機視覺方面也正在進行類似的努力。

                2021年底,何愷明及其同事展示了著名的掩碼自動編碼器研究「Masked Auto-Encoder」(MAE)。

                論文地址:https://arxiv.org/abs/2111.06377

                MAE將未掩碼部分轉換為潛在表示——壓縮的數學描述,其中包含有關對象的重要信息。

                在圖像的情況下,潛在表示可能是一種數學描述,其中包括圖像中對象的形狀。然后解碼器將這些表示轉換回完整的圖像。

                大腦也是「自監(jiān)督」的

                在這樣的系統(tǒng)中,一些神經科學家認為,我們的大腦實際上也是自監(jiān)督學習的。

                麥吉爾大學和魁北克人工智能研究所(Mila)的計算神經科學家布萊克-理查茲(Blake Richards)說:「我認為毫無疑問,大腦所做的90%都是自監(jiān)督學習。」

                生物大腦被認為是在不斷地預測,例如,一個物體在移動時的未來位置,或一句話中的下一個詞,就像自我監(jiān)督學習算法試圖預測圖像或一段文字的間隙一樣。

                計算神經科學家布萊克-理查茲(Blake Richards)創(chuàng)建了一個AI系統(tǒng),模仿活體大腦中的視覺網絡

                理查茲和他的團隊創(chuàng)建了一個自監(jiān)督模型,暗示了一個答案。他們訓練了一個結合兩種不同神經網絡的人工智能。

                第一個,稱為ResNet架構,是為處理圖像而設計的;第二個,稱為遞歸網絡,可以跟蹤先前的輸入序列,對下一個預期輸入進行預測。

                為了訓練聯合AI,該團隊從一連串的視頻開始,比如說10幀,讓ResNet逐一處理。

                然后,遞歸網絡預測了第11幀的潛在表示,而不是簡單地匹配前10幀。自監(jiān)督學習算法將預測值與實際值進行比較,并指示神經網絡更新其權重,以使預測效果更好。

                為了進一步測試,研究人員向AI展示了一組視頻,西雅圖艾倫腦科學研究所的研究人員以前曾向小鼠展示過這些視頻。與靈長類動物一樣,小鼠的大腦區(qū)域專門用于靜態(tài)圖像和運動。艾倫研究人員在小鼠觀看視頻時記錄了小鼠視覺皮層的神經活動。

                理查茲的團隊發(fā)現了AI和活體大腦對視頻的反應方式的相似之處。在訓練過程中,人工神經網絡中的一條途徑變得與小鼠大腦的腹側、物體探測區(qū)域更加相似,而另一條途徑則變得與注重運動的背側區(qū)域相似。

                這些結果表明,我們的視覺系統(tǒng)有兩條專門的通路,因為它們有助于預測視覺的未來;單一的通路是不夠好的。

                人類聽覺系統(tǒng)的模型講述了一個類似的故事。

                6月,由Meta AI的研究科學家Jean-Rémi King領導的團隊訓練了一個名為Wav2Vec 2.0的人工智能,它使用一個神經網絡將音頻轉化為潛在的表征。研究人員對這些表征中的一些進行了屏蔽,然后將其送入另一個稱為轉化器的組件神經網絡。

                在訓練過程中,轉化器預測被屏蔽的信息。在這個過程中,整個人工智能學會了將聲音轉化為潛在的表征,同樣,不需要標簽。

                該團隊使用了大約600小時的語音數據來訓練網絡?!高@大約是一個孩子在前兩年的經驗中得到的東西?!菇鹫f。

                Meta AI的讓-雷米-金幫助訓練了一種人工智能,它以模仿大腦的方式處理音頻–部分是通過預測下一步應該發(fā)生什么

                一旦該系統(tǒng)被訓練出來,研究人員給它播放英語、法語和普通話的有聲讀物部分,然后將AI的表現與412人的數據進行了比較(這些人都是以這三種語言為母語的人),他們在核磁共振掃描對自己的大腦進行成像時,聽了同樣長的一段音頻。

                結果顯示,盡管fMRI圖像有噪音且分辨率不高,但AI神經網絡和人類的大腦「不僅相互關聯,而且還以系統(tǒng)的方式關聯」。

                AI早期層的活動與初級聽覺皮層的活動一致,而AI最深層的活動則與大腦中較高層的活動相一致,比如前額葉皮層。

                「這是非常漂亮的數據,雖然算不上是決定性的,但算得上是令人信服的證據,表明我們學習語言的方式在很大程度上是在預測接下來會說的話。」

                有人不同意:模擬大腦?模型、算法都差的遠

                當然,也并非所有人都認同這種說法。

                MIT的計算神經科學家喬希-麥克德莫特(Josh McDermott)曾使用監(jiān)督和自監(jiān)督學習研究視覺和聽覺的模型。他的實驗室設計了一些人工合成的音頻和視覺信號,對于人類來說,這些信號只是難以捉摸的噪音。

                然而,對于人工神經網絡來說,這些信號似乎與真實語言和圖像沒有區(qū)別。這表明,在神經網絡的深層形成的表征,即使是自監(jiān)督學習,也與我們大腦中的表征不一樣。

                麥克德莫特說:「這些自我監(jiān)督的學習方法是一種進步,因為你能夠學習能夠支持很多識別行為的表征,而不需要所有標簽。但仍然有很多監(jiān)督模型的特征。」

                算法本身也需要更多改進。比如在Meta AI的Wav2Vec 2.0模型中,AI只預測了幾十毫秒的聲音的潛在表征,比人發(fā)出一個噪音音節(jié)的時間還要短,更不用說預測一個詞了。

                要真正實現讓AI模型和人類大腦相類似,我們還有很多事情要做,金說。

                如果目前發(fā)現的大腦和自我監(jiān)督學習模型之間的相似性在其他感官任務中也成立,將更有力地表明,無論我們的大腦有什么神奇的能力,都需要以某種形式進行自監(jiān)督學習。

                參考資料:

                Self-Taught AI Shows Similarities to How the Brain Works

                鄭重聲明:本文內容及圖片均整理自互聯網,不代表本站立場,版權歸原作者所有,如有侵權請聯系管理員(admin#wlmqw.com)刪除。
                用戶投稿
                上一篇 2022年8月20日 18:18
                下一篇 2022年8月20日 18:18

                相關推薦

                • 什么是推廣cpa一篇文章帶你看懂CPA推廣渠道

                  CPA渠道 CPA指的是按照指定的行為結算,可以是搜索,可以是注冊,可以是激活,可以是搜索下載激活,可以是綁卡,實名認證,可以是付費,可以是瀏覽等等。甲乙雙方可以根據自己的情況來定…

                  2022年11月25日
                • 百度關鍵詞快速排名的4大原理解析(百度怎么刷關鍵詞)

                  近期百度公告驚雷算法2.0,升級之快還是第一次吧,看來百度對于刷點擊行為是零容忍了。之前尹華峰SEO技術博客介紹過一篇如何使用刷點擊工具,其實市面上有很多這類SEO快速排名的軟件,…

                  2022年11月25日
                • 抖音直播帶貨有哪些方法技巧(抖音直播帶貨有哪些痛點)

                  如今抖音這個短視頻的變現能力越來越突顯了,尤其是在平臺上開通直播,更具有超強的帶貨屬性,已經有越來越多的普通人加入到其中了。不過直播帶貨雖然很火,但是也不是每個人都能做好的,那么在…

                  2022年11月24日
                • 明查|美國新冠后遺癥患者中有16%癥狀嚴重以致無法工作?

                  點擊進入澎湃新聞全球事實核查平臺 速覽 – 網傳數據比例無權威信源佐證,該比例有可能是結合了美國疾病防控中心和布魯金斯學會的數據得出,但這兩個機構的調研目的和樣本都不同…

                  2022年11月24日
                • 谷歌Pixel 7 DXO影像成績140分:險勝小米12S Ultra

                  日前,DXOMARK公布了谷歌Pixel 7的影像總分,其以140分在高端機型排名第1、全球排名第10,險勝小米12S Ultra(136分)。 DXOMARK表示,得益于硬件和軟…

                  2022年11月23日
                • 淘寶運營數據分析的3個指標解析(運營數據分析怎么做)

                  我們知道淘寶運營工作中對于數據的分析與整理是很重要的,這些工作乍一聽可能比較難,但是也有一些相關的技巧可以讓我們能夠有效的找出對我們有用的數據,這樣我們也能夠更加直觀的看出我們店鋪…

                  2022年11月20日
                • 3階魔方教程 1~7步驟(魔方教程一步一步圖解)

                  基礎層先魔方復原法 by信手拈花 0. 魔方轉動的公式表示和復原步驟 0. 1魔方轉動的公式表示 魔方轉動的公式表示 0. 2層先法魔方復原步驟 層先法魔方復原步驟 讓我開始魔方復…

                  2022年11月18日
                • 1公頃等于多少平方千米(公頃等于多少平方米)

                  四年級數學上冊第二單元 公頃和平方千米 一、換算進率 1平方千米= 100公頃=1000000 平方米 1公頃= 10000平方米 1平方米=100平方分米 1平方分米= 100平…

                  2022年11月18日
                • 微信緩存是什么 清理微信的緩存會不會清除聊天記錄?

                  軟件使用的越久,產生的緩存垃圾也就越多。但是很多朋友不敢清理微信的緩存,怕把聊天記錄一并清理了。那么清理微信緩存會不會刪除聊天記錄?想知道答案的小伙伴就跟小編一起來看看吧! 清理微…

                  2022年11月18日
                • 網頁版淘寶登錄入口(淘寶網頁版怎么進入)

                  現在淘寶已經成為我們生活中必不可少的一個購物平臺了,當需要什么東西的時候,直接打開淘寶搜索一下就可以了。這種趨勢也讓更多的商家入駐淘寶開店,選擇在網上做生意。有些商家在管理淘寶店鋪…

                  2022年11月18日

                聯系我們

                聯系郵箱:admin#wlmqw.com
                工作時間:周一至周五,10:30-18:30,節(jié)假日休息