科技創(chuàng)新世界潮|技術(shù)“聯(lián)姻”，雙向奔赴：機器人或成人工智能領(lǐng)域“弄潮兒”

2024-05-30 18:23:27 來源: 科技日報點擊數(shù)：

科技日報記者?劉霞

觀看《星球大戰(zhàn)》長大的一代人可能會感到失望，他們目光所及之處，仍看不到C-3PO類機器人的影子。那些預(yù)想中具有常識、能在家里和職場為人類提供幫助的人形機器人何時會出現(xiàn)？

人工智能（AI）的快速發(fā)展或許很快會填補這一空白。

人形機器人使用OpenAI編程獲得語言和視覺。
　　圖片來源：《自然》網(wǎng)站

《自然》網(wǎng)站近日報道指出，AI和機器人技術(shù)“聯(lián)姻”，可能是一場將彼此推向新高度的“雙向奔赴”。AI給機器人灌輸常識，讓其能像人一樣處理各種任務(wù)；機器人則利用身體經(jīng)驗，幫助AI躍升為“通用AI”。但專家提醒，這條雙向奔赴之路仍面臨諸多挑戰(zhàn)，包括收集海量精準數(shù)據(jù)供機器人學(xué)習(xí)、應(yīng)對“喜怒無?！钡挠布⒔鉀Q安全問題等。

基礎(chǔ)模型助機器人“更聰明”

眾多機器人領(lǐng)域的AI科學(xué)家都希望，未來機器人能在更廣泛環(huán)境中自主適應(yīng)。例如，會幫顧客挑選產(chǎn)品的機械臂，能陪伴老人的智能人形機器人等。

當看到提示“挑選滅絕動物”時，谷歌的RT-2選擇了恐龍雕像。
　　圖片來源：谷歌“深度思維”公司

然而，控制這類機器人絕非易事。從OpenAI到谷歌“深度思維”公司，都致力于將多功能學(xué)習(xí)算法（基礎(chǔ)模型）嵌入機器人，以便其在聊天時表現(xiàn)得更像人類。這些想法的核心是給機器人灌輸常識，使之能勝任各種任務(wù)。英偉達公司機器人技術(shù)營銷專家杰拉德·安德魯斯強調(diào)，機器人技術(shù)目前正處于變革的關(guān)鍵時刻。該公司于3月推出了一款專為人形機器人設(shè)計的通用AI模型。谷歌“深度思維”公司則創(chuàng)建了現(xiàn)有最先進的機器人基礎(chǔ)模型之一RT-2，其可以認出明星的照片，盡管之前受到的訓(xùn)練中該明星并未出現(xiàn)過。

研究人員樂觀地認為，基礎(chǔ)模型有助科學(xué)家研發(fā)出可以輔助人類勞動的通用機器人。今年2月，人形機器人公司籌集6.75億美元，以在通用人形機器人中應(yīng)用OpenAI開發(fā)的語言和視覺模型。一段視頻顯示，機器人給人一個蘋果，以回應(yīng)人們“吃東西”的要求。

多樣數(shù)據(jù)讓機器人“更有經(jīng)驗”

盡管聊天機器人正在接受來自互聯(lián)網(wǎng)數(shù)十億單詞訓(xùn)練，但機器人活動的數(shù)據(jù)集還遠遠不夠。

數(shù)據(jù)匯集或是一種解決方法。美國斯坦福大學(xué)機器人研究專家亞歷山大·卡哈扎特斯基及其同事創(chuàng)建了開源數(shù)據(jù)集DROID2，匯集了德國Franka Robotics公司制造的Franka Panda 7DoF機械臂約350小時的視頻數(shù)據(jù)，包括浴室、洗衣房、臥室等數(shù)百種環(huán)境的記錄。這種多樣性有助機器人在全新環(huán)境下更好地執(zhí)行任務(wù)。

加州AI公司Covariant也在努力擴大機器人數(shù)據(jù)的規(guī)模。該公司于2018年開始從世界各地的30種機械臂中收集數(shù)據(jù)，其“機器人基礎(chǔ)模型1”（RFM-1）不僅收集視頻數(shù)據(jù)，還收集傳感器讀數(shù)。此類數(shù)據(jù)對于提升機器人任務(wù)執(zhí)行能力至關(guān)重要，比如讓機器人知道如何不碰傷香蕉。

此外，許多專家正致力于構(gòu)建3D虛擬現(xiàn)實環(huán)境，旨在通過這些環(huán)境來訓(xùn)練機器人。元宇宙平臺（Meta）和英偉達都在模擬領(lǐng)域投入大量資源，以擴大機器人數(shù)據(jù)的規(guī)模，并建立了復(fù)雜的模擬世界b。通過這些平臺，機器人能夠在短短幾個小時內(nèi)積累相當于多年實際經(jīng)驗的數(shù)據(jù)。

硬件和安全問題需考慮

許多機器人專家指出，盡管AI給了機器人更智慧的“大腦”，但其進一步發(fā)展仍面臨諸多挑戰(zhàn)。機器人很復(fù)雜，而且硬件很容易損壞。

新加坡國立大學(xué)人機交互專家哈羅德·索赫說，機器人可能需要大量其他類型的數(shù)據(jù)，如觸覺或本體感覺（身體在空間中的位置感）數(shù)據(jù)。這類數(shù)據(jù)集目前還不存在，但這是人形機器人高效工作所必需。

安全性必須認真考量。大型語言模型已被證明會產(chǎn)生錯誤、偏見，也可能誘騙人類或機器人做一些“壞事”。鑒于此，研發(fā)人員需要給機器人AI模型中植入一些規(guī)則。機器人無疑仍需要大量人工監(jiān)督。

盡管存在一定風險，但AI與機器人的這場雙向奔赴仍值得期待。而AI通過與機器人相結(jié)合，增加與現(xiàn)實世界互動，有望超越學(xué)習(xí)模式做出預(yù)測，真正理解和推理世界。

責任編輯：常麗君

姿花直播官方版_姿花直播平台官方app下载_姿花直播免费版app下载

科技創(chuàng)新世界潮|技術(shù)“聯(lián)姻”，雙向奔赴：機器人或成人工智能領(lǐng)域“弄潮兒”

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

姿花直播官方版_姿花直播平台官方app下载_姿花直播免费版app下载

科技創(chuàng)新世界潮|技術(shù)“聯(lián)姻”，雙向奔赴：機器人或成人工智能領(lǐng)域“弄潮兒”

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

3.暫不升級，繼續(xù)瀏覽