圖片來源:視覺中國(guó)
科技日?qǐng)?bào)記者?劉霞
生成式人工智能(AIGC)在目前的技術(shù)領(lǐng)域穩(wěn)居“C位”。其利用人工智能(AI)技術(shù),通過已有數(shù)據(jù)尋找規(guī)律,并通過預(yù)訓(xùn)練大模型、生成式對(duì)抗網(wǎng)絡(luò)等方法,自動(dòng)生成各種類型的內(nèi)容,例如文章、視頻、圖片、音樂、代碼等。AIGC代表了AI技術(shù)發(fā)展的新趨勢(shì),過去傳統(tǒng)AI偏向分析能力,而現(xiàn)在AI正在生成新內(nèi)容,實(shí)現(xiàn)從感知理解世界到生成創(chuàng)造世界的躍進(jìn)。
過去,人們只能使用AIGC創(chuàng)建碎片化的對(duì)象?,F(xiàn)在,人們?cè)絹碓蕉嗟厥褂肁IGC創(chuàng)建整個(gè)世界。據(jù)美國(guó)《福布斯》雙周刊網(wǎng)站近日?qǐng)?bào)道,AIGC技術(shù)領(lǐng)域正在噴涌出一些令人興奮和充滿活力的新功能,為富有想象力、有趣且有潛在用處的產(chǎn)品、服務(wù)和體驗(yàn)(包括但不限于游戲創(chuàng)作)開辟了新機(jī)會(huì)。
深度學(xué)習(xí)加聊天
近年來,隨著AI技術(shù)的不斷發(fā)展,聊天機(jī)器人在各個(gè)領(lǐng)域逐漸成了“香餑餑”,也成了人們非常喜歡的交互方式?;谏疃壬窠?jīng)網(wǎng)絡(luò)的聊天機(jī)器人更是成為了研究熱點(diǎn)。
這些聊天機(jī)器人由深度機(jī)器學(xué)習(xí)提供動(dòng)力,但靈感來自人類大腦結(jié)構(gòu)。在訓(xùn)練過程中,超級(jí)計(jì)算機(jī)會(huì)讀取大量文本并進(jìn)行訓(xùn)練,這種訓(xùn)練使聊天機(jī)器人能夠在對(duì)話中結(jié)合上下文語境,產(chǎn)生類似人類的文本響應(yīng)。
目前,智能客服聊天機(jī)器人集成了這項(xiàng)技術(shù)。隨著這些機(jī)器人在語言翻譯、創(chuàng)造性寫作、理解上下文并作出有意義反應(yīng)方面的能力不斷增強(qiáng),這些聊天機(jī)器人也可成為忙碌的專業(yè)人士的虛擬助理。
自然語音合成
當(dāng)大聲朗讀文本時(shí),許多AI機(jī)器人發(fā)出的聲音聽起來不自然且令人不舒適。但科學(xué)家現(xiàn)在可利用文本-語音軟件領(lǐng)域的一些新工具,創(chuàng)建聽起來更加自然而舒適的合成語音。
例如,AI文本轉(zhuǎn)語音公司ElevenLabs推出了AI配音功能,可將口語內(nèi)容轉(zhuǎn)換為另一種語言,同時(shí)保留原說話者的聲音、語言模式、情感和語調(diào)。這款流行且功能強(qiáng)大的語音生成器讓任何人都可創(chuàng)建專業(yè)的畫外音。
這些工具可將文本轉(zhuǎn)換為具有不同聲音、風(fēng)格和語言的優(yōu)質(zhì)音頻,有望在電子游戲和娛樂行業(yè)大顯身手,為其中的動(dòng)畫角色賦予獨(dú)特的配音。它還可與其他技術(shù),例如神經(jīng)語言模型聊天機(jī)器人相結(jié)合,為用戶與名人進(jìn)行“對(duì)話”創(chuàng)造獨(dú)特且逼真的體驗(yàn)。
圖片創(chuàng)作編輯
有了新的AIGC圖片編輯工具,人們可做的將不再限于在照片上貼有趣的貓耳朵。
AI應(yīng)用程序EPIK可讓用戶生成懷舊的、90年代風(fēng)格的照片。與其他最近流行的AI應(yīng)用程序類似,EPIK的工作原理是讓用戶首先上傳一系列自拍照,然后EPIK使用這些自拍照生成復(fù)古年鑒照片。近期,隨著來自世界各地的名人開始在社交媒體上分享EPIK生成照片,該應(yīng)用程序10月飆升至蘋果應(yīng)用商店的榜首。
EPIK并非第一個(gè)因奇妙功能而走紅的AI照片應(yīng)用程序。此前,Lensa和Remini等產(chǎn)品也風(fēng)靡一時(shí),Lensa提供AI生成的“魔法頭像”;Remini則因其專業(yè)外觀的AI頭像而在今年夏天登上蘋果應(yīng)用商店榜首。
簡(jiǎn)而言之,這些新工具生成上傳照片的超現(xiàn)實(shí)版本,且擁有一系列風(fēng)格,如復(fù)古、優(yōu)雅、運(yùn)動(dòng)等。這些照片編輯工具顯然也可應(yīng)用于游戲、電影、平面廣告或任何依賴人類圖像的東西。
AI情感陪伴
AI情感陪伴是指利用自然語言處理技術(shù),來模擬、理解、表達(dá)和滿足人類的情感需求,從而提供給用戶一種類似于人類之間情感交流和支持的體驗(yàn)?;诖祟惞ぞ邉?chuàng)建的模型,能真實(shí)而富有同情心地與人類討論思想和感受,進(jìn)行角色扮演,幫助管理用戶的焦慮情緒。
當(dāng)然,仍有很多人對(duì)與AI建立更加親密的關(guān)系感到不舒服,但開發(fā)人員斷言,這些工具可幫助用戶更好地學(xué)習(xí)社交技能,體察自己的情緒或思維模式,管理自身的壓力,并努力改善情緒健康。
此外,鑒于這些AI模型能模仿人類的聲音、言語模式、外表甚至性格,潛在用戶擔(dān)心別有用心之人利用這些工具實(shí)施欺詐、身份盜竊或其他犯罪行為。而這正是業(yè)界仍在努力解決的問題。
《福布斯》網(wǎng)站強(qiáng)調(diào)稱,通過嚴(yán)格的身份驗(yàn)證,例如雙因素認(rèn)證、視網(wǎng)膜掃描、政府對(duì)數(shù)據(jù)隱私實(shí)施的嚴(yán)格規(guī)定,以及用戶更謹(jǐn)慎地與AI平臺(tái)共享某些數(shù)據(jù),上述AIGC工具有望在未來安全有效地為用戶提供一系列極具創(chuàng)新性且極有用的功能。