Skip to Content Facebook Feature Image

OpenAI展示超強AI影像模型「Sora」 60秒視頻一鏡到底效果超逼真

大視野

OpenAI展示超強AI影像模型「Sora」 60秒視頻一鏡到底效果超逼真
大視野

大視野

OpenAI展示超強AI影像模型「Sora」 60秒視頻一鏡到底效果超逼真

2024年02月16日 14:20 最後更新:15:03

OpenAI公開展示最新影片生成AI模型Sora,號稱能將文字轉成最高60秒且具複雜運鏡、多角色的高品質影片。

綜合外媒報導,ChatGPT開發者人工智慧研究實驗室OpenAI 今日(16日)在公開展示最新文字轉影像AI模型Sora(日文「空」羅馬拼音)的產品影片,並附上該影像的指令,宣稱此模型能生成最多60秒的豐富場景細節、多角色及複雜運鏡影片。

觀看影片

Sora 使用約1萬小時的「高品質」影片訓練,OpenAI 表示,Sora 是基於 DALL·E、GPT 模型的研究成果,一方面使用 DALL·E 3 的重述技術,能專為視覺資料生成高度描述性的標題,所以 Sora 可以更忠實地、也更新深入遵循使用者的文字指令,並生成情感豐富、引人入勝的角色,甚至 Sora 還能深入理解指令提到的人、事、物在現實物理世界中真正存在的面貌。

AP圖片

AP圖片

OpenAI官網說明,此模型不僅可以文字轉影音,也可以從靜態圖像或將現有影像延伸成影片,「我們正在訓練AI瞭解並模擬真實世界的動態,希望能夠幫助使用者解決一些需要真實世界互動的難題」。

OpenAI官網截圖

OpenAI官網截圖

據悉,目前OpenAI 並沒有將 Sora 完全開放,只有部分研究者、影片創作者,以及扮演「紅隊」(Red Team)測試以預防有心人士利用各種方式繞過OpenAI的服務條款,包括禁止極端暴力、性內容、仇恨圖像、名人臉孔或盜用智財等等規範。

Tags:

OpenAI

往下看更多文章

馬斯克預測AI或在2年內比全人類聰明 特斯拉8月8日推自駕的士Robotaxi

2024年04月11日 15:20 最後更新:17:17

特斯拉執行長馬斯克大膽預測,人工智能發展可能在明年或2026年前超越全人類智能水平,他同時透露,特斯拉將於8月8日推出自駕的士Robotaxi。

馬斯克旗下聊天機械人Grok新版本預計5月完成訓練

馬斯克在社交平台X Spaces直播中向挪威央行投資管理公司的行政總裁坦根(Nicolai Tangen)表示,AI的發展受限於電力供應。他還透露他的新創公司xAI旗下的聊天機械人Grok的新版本預計在5月完成訓練。

AI或在2年內比全人類聰明

在被問及通用人工智能的發展時程時,馬斯克表示,如果將AGI定義為比最聰明的人類更聰明,他認為可能大約在明年或未來兩年內實現。

然而,馬斯克提到由於先進晶片的短缺,Grok版本2模型的訓練進度受到阻礙。他指出Grok 2模型的訓練需要約2萬個輝達(NVIDIA)的H100 GPU,而Grok 3模型及後續版本將需要10萬個輝達H100晶片。

電力供應將成關鍵因素

他也指出晶片短缺目前是人工智能發展的一大限制,但未來一兩年,電力供應將成為關鍵因素。

過去18個月,人工智能領域取得了許多突破,例如影片生成工具和更強大的聊天機械人,推動了人工智能以超乎先前預期的速度發展。

特斯拉8月8日推自駕的士Robotaxi

馬斯克在談到電動車時再次強調,中國汽車製造商是全球最有競爭力的,對特斯拉構成了最艱巨的競爭挑戰。同時,馬斯克宣布,特斯拉將於8月8日推出自駕的士Robotaxi。

馬斯克(AP資料圖片)

馬斯克(AP資料圖片)

他沒有透露細節,但過去他曾表示,特斯拉將開發一款無需人類駕駛的車輛供人乘坐。他亦表示,配備全自動輔助駕駛技術的車輛將透過軟體升級不斷完善駕駛技能,到某個時間點,車輛將具備全自動能力,並能透過自駕載客為車主帶來額外收入。

你 或 有 興 趣 的 文 章