狗是人類最好的朋友~
美國芝加哥庫克縣州檢察官福克斯(Kim Foxx)的辦公室日前有一隻拉布拉多尋回犬履新,擔任輔導犬的工作,協助紓緩青少年及襲擊案中受害人的情緒。
這隻名叫哈蒂(Hatty)的狗狗兩歲大,將會執行朝9晚5的工作,作為州檢察官辦公室的支援犬。哈蒂是該辦公室的首隻支援犬,部份訓練工作由囚犯執行。
哈蒂宣誓就任的儀式由福克斯親自主持,牠的一雙前腿擱在桌子上,利用一對後腿站立,桌上擺放了宣誓文件,十分認真。
大視野
狗是人類最好的朋友~
美國芝加哥庫克縣州檢察官福克斯(Kim Foxx)的辦公室日前有一隻拉布拉多尋回犬履新,擔任輔導犬的工作,協助紓緩青少年及襲擊案中受害人的情緒。
這隻名叫哈蒂(Hatty)的狗狗兩歲大,將會執行朝9晚5的工作,作為州檢察官辦公室的支援犬。哈蒂是該辦公室的首隻支援犬,部份訓練工作由囚犯執行。
哈蒂宣誓就任的儀式由福克斯親自主持,牠的一雙前腿擱在桌子上,利用一對後腿站立,桌上擺放了宣誓文件,十分認真。
微軟 ( Microsoft ) 發佈 VASA-1 人工智能模型,能夠依據一張照片及一條語音,創建出說話或唱歌的同步動畫影片。
Microsoft just dropped VASA-1.
— Min Choi (@minchoi) April 18, 2024
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
影片具真實感且表情豐富
VASA-1 使用機械學習技術分析靜態圖像和語音音訊片段,生成具有精確面部表情、頭部運動和音訊同步的真實影片。Microsoft 稱 VASA-1 在真實感、表情豐富度與效率方面,顯著超越過往的語音動畫方案。該模型不會製作或模擬語音,而是依賴於已有的聲音輸入。研究團隊強調,該技術主要用於研究,而非實際產品或 API 發布。
「蒙娜麗莎」搖身一變會饒舌
在微軟建立的 VASA-1 研究專頁,展示了多個樣本影片,包括以蒙娜麗莎的形象配合 Anne Hathaway在Conan O’Brien 節目中表演的《Paparazzi》歌曲的音訊軌進行饒舌。
模型2018年開始研發
該模型的訓練基於2018年由牛津大學研究人員創建的 VoxCeleb2數據庫,該數據庫包含來自 6,112 名知名人士的超過一百萬條語音資料,這些資料均來自 YouTube。VASA-1 能生成 512×512 像素解像度的影片,每秒最多 40 幅。
微軟:初衷不是製造能夠冒充真實人物的假象
Microsoft研究人員指出,他們的初衷不是製造能夠冒充真實人物的假象,而是探索視覺影響技術生成虛擬互動角色的可能性。他們也意識到這種技術的潛在濫用風險,因此目前不計劃公開此技術背後的程式碼。
4. Out-of-distribution generalization - singing audios pic.twitter.com/h7BvTq4vAE
— Min Choi (@minchoi) April 18, 2024