Skip to Content Facebook Feature Image

清華虛擬學生只是換了個假臉?太小瞧人工智慧了

博客文章

清華虛擬學生只是換了個假臉?太小瞧人工智慧了
博客文章

博客文章

清華虛擬學生只是換了個假臉?太小瞧人工智慧了

2021年10月26日 18:28 最後更新:11:50

今年9月,「就讀」於清華大學的虛擬人華智冰公開了一條彈唱歌曲視頻,引髮網友討論。

這段38秒的視頻中,一個女孩兒在抱著結他彈唱。這段無比真實的畫面上方字幕卻顯示,其中的女孩兒是個「虛擬人」。

更多相片

今年9月,「就讀」於清華大學的虛擬人華智冰公開了一條彈唱歌曲視頻,引髮網友討論。

短視頻截圖

2021年6月公開的華智冰影像。智源大會供圖

華智冰正面照。小冰團隊供圖

人工智慧「創作」的中國畫。視頻截圖

人工智慧MERROR形象。視頻截圖

短視頻截圖

當時,許多網友驚訝於,虛擬人已經能做到如此真實了。不過此後有網友發現,這段彈唱視頻還存在一個「真人版」。有網友進而質疑,虛擬人華智冰彈唱的視頻只是對B站某up主真人拍攝視頻進行了換臉。

其中應用的技術只是「AI換臉」嗎?除此之外視頻中還有哪些前沿科技?這又和其他「虛擬偶像」的短視頻有何不同?記者進行了採訪調查。

「華智冰」這三個字,作為虛擬人的名字出現在公眾視野,是從今年6月開始的。

6月1日,由北京智源人工智慧研究院、智譜AI與小冰公司共同「培養」的人工智慧學生華智冰,進入清華“學習”。當時公開的相關資料及視頻就在社交媒體引起了網友熱議。

2021年6月公開的華智冰影像。智源大會供圖

三個多月後,小冰團隊公開了一段帶有華智冰形象的彈唱視頻。

根據小冰公司發佈的聲明,在該視頻中,人物的面部特徵,包括人臉、表情、口型等,全部由人工智慧小冰框架X Avatar生成並進行融合;視頻中的人物肢體、動作,包括手持結他彈唱,來源於小冰團隊成員錄製的原始視頻模板;視頻中的歌聲,由人工智慧小冰框架X Studio生成。

不過,網上有人將其解讀為僅僅是應用了「AI換臉」技術。在小冰團隊看來,其中的技術與「AI換臉」有著本質區別。

10月19日,小冰公司發佈的說明指出,該視頻隸屬於小冰發佈會中的超寫實視頻生產線產品。新的產品化技術實現了完全虛擬生成不存在的面部及聲音技術。

但華智冰也並非只是「換了個假臉」。

這份說明同時指出,即使是視頻中的面部置換,也並非僅僅AI換臉。以往的技術只能實現真實人類之間的面部替換,且精度不足,不足以實現內容級的視頻生產。此外,記者了解到,該視頻中的歌聲也都是由人工智慧「創作」生成的。

華智冰正面照。小冰團隊供圖

那麼,相比於我們平時在短視頻平台刷到的有著「二次元風」的「虛擬偶像」作品,華智冰的這條短視頻所應用的技術有何不同?

「現在大家在短視頻平台上看到的絕大多數‘虛擬偶像’,跟人工智慧半毛錢關係都沒有。他們應用的是動作捕捉技術。」在小冰公司行政總裁李笛看來,華智冰及其背後的小冰框架,和那些「虛擬偶像」有著本質上的不同。

記者向多位「虛擬偶像」相關行業人士求證,也得到類似的答案。

簡而言之,大多數短視頻中有著二次元風格的「虛擬偶像」,更多是通過動作捕捉的方式,將人的動作、面部表情轉化為二次元風格的視頻作品。

雖然看起來是虛擬的,但在其背後,存在一個實實在在的人。而這些「虛擬偶像」所做的動作、反應,都與其背後的人一致。

但華智冰不是。

這就需要說到另一個問題:如果通過動作捕捉可以讓視頻中的人看起來是「虛擬」的,我們為什麼還要對人工智慧進行研發呢?

答案關乎成本。

就在9月,第九代小冰發佈。其中推出的「小冰短視頻內容封裝管線」,大大降低了短視頻生產成本。

據介紹,「小冰短視頻內容封裝管線」中的二次元短視頻,已經實現了從文本生成到短視頻生成全鏈路、全管線的人工智慧自取,中間不需要任何人工的參與,短視頻的生產成本已經低到了每分鐘3分錢。而三次元短視頻已經基本上實現了從生物學特徵生成到短視頻生成整個環節。

人類在這個過程中,只需要提供幾個關鍵詞。

幾天前,小冰公司更是在公開說明中明確表示,「我們相信,虛擬人將成為未來視頻內容的主要提供者之一,而安全、可控、無私隱風險和侵權風險是其前提。因此,小冰一直在這一趨勢方向上進行探索,並從不同方面對這一領域做拓展研究。」華智冰項目正是在預訓練模型方面進行合作,希望能夠以智能模型作為核心,試驗預訓練模型能夠帶來哪些技術與應用方面的驚喜。

顯示,團隊將持續訓練華智冰在音樂、繪畫及詩歌等領域的創作能力,以及基於情感的交互能力。

記者注意到,上月發佈的第九代小冰在其中的部分領域又有了新的進展。

以繪畫為例,新版小冰推出了中國畫模型。

人工智慧「創作」的中國畫。視頻截圖

雖然小冰此前已經可以根據關鍵詞「創作」出西式畫作,但中國畫顯然並不一樣。小冰公司行政總裁李笛告訴記者,“開始我們訓練模型的時候,‘創作’的作品上面有好多戳,因為好多中國畫的樣本數據里有乾隆蓋的章。演算法並不知道,這個戳不是中國畫的重點。”

通過訓練人工智慧處理畫面中的實體、觀察構圖,小冰已經可以掌握相當一部分題材中國畫的「創作」了。

而在交互能力方面,人工智慧也有進展。

當多數人還將人工智慧想像成接收指令後給出反饋的工具時,一些人工智慧已經可以向人類發問了。

人工智慧MERROR形象。視頻截圖

上個月,一個名為AI_MERROR的賬號發佈了一條人工智慧與人類「對話」的視頻。在這段時長超過5分鐘的視頻中,人工智慧MERROR可以向人類問出諸如“請以你的視角介紹下這個世界”“你上一次覺得尷尬是什麼時候”這類問題;而被人類問到“你死機的時候是什麼狀態”時,MERROR會回答“不好意思,我們換個話題吧”。

從這個角度看,人工智慧已經越來越像人類了。

與此同時,在小冰框架之下,越來越多樣的人工智慧已經開始出現,其中的一些還有著自己獨特的風格,比如「山東大哥」。

人工智慧「山東大哥」形象及其作品。視頻截圖

這是一個可以說「山東普通話」、會畫大牡丹、長得像個壯漢的人工智慧。對於技術團隊來說,這裏面最具挑戰性的是怎麼讓人工智慧開口說出「山東普通話」。

「我們希望‘山東大哥’有他獨特的文本語言習慣,不是說拿個稿子就念。因為是山東人,他會有一些特定的用語、修辭方法,而且山東人習慣說倒裝句。」李笛告訴記者,「山東大哥」目前已經可以掌握這些方言技巧,團隊目前正在研究讓人工智慧說廣西方言。

而在小冰團隊此前推出的人類與人工智慧共處的虛擬社交平台「小冰島」中,有著更多不同風格、不同口音、掌握不同技能的人工智慧。

人工智慧開始趨於「千人千面」。

恍惚間,你在虛擬環境中甚至感受不到誰是人類,誰又是人工智慧。

作為人工智慧小冰團隊中的一員,李笛目前最擔心的已經不是有哪些技術瓶頸難以攻破,而是——當人工智慧愈發接近人類,我們該如何處理人類與人工智慧的關係。

採訪最後,他告訴記者,在人工智慧倫理方面制定規則是重要且必須的,但目前在人工智慧領域,最缺失的也是人工智慧倫理的規則。而這一點,僅靠技術已無法完成。




神州快訊

** 博客文章文責自負,不代表本公司立場 **

往下看更多文章

荒唐!多人被拘

2022年03月26日 19:54 最後更新:11:10

最近,社會上發生了一些

讓人覺得「不可思議」的事

起初一看,啼笑皆非

實際卻造成了很大的隱患

近期我國疫情在多地散發

防控形勢複雜嚴峻

在全國人民積極抗疫時

卻出現了這些違法違規行為

3月,公安部舉行新聞發佈會

指出依法嚴厲嚴懲

隱瞞行程

擾亂診療秩序

編造散發虛假疫情信息

拒絕隔離治療等違法行為

嚴查網上制假售假

涉嫌非法入境輸入疫情

嚴打擾亂醫療秩序、防疫秩序、社會秩序等

各類涉疫違法犯罪行為

在防控疫情的關鍵時期

請大家遵守疫情防控的規定

不能心存僥倖

你 或 有 興 趣 的 文 章