OpenAI 的 Sora 的推出為人工智慧驅動的視訊生成應用程式打開了大門,這些應用程式可以根據文字提示創建短片。現在,Google也加入了這場競爭,在本週的年度 I/O 開發者大會上宣布推出自己的影片生成人工智慧應用程式 Veo。
然而,與許多其他新發布的人工智慧工具一樣,新的影片產生器尚未可供公眾使用。谷歌計畫讓藝術家和創作者透過眾包練習來試用工具,這有助於改進它。以下是我們對 Google Veo 的了解。
維奧能做什麼?
Google Veo 可以產生持續一分多鐘的 1080p 視頻,您也可以透過書面說明對其進行編輯。它可以確保框架在視覺上一致,使用者可以使用單一提示或一系列提示來建立敘述。該工具可以包括航空拍攝等電影效果,並創建高度詳細的場景。
使用 Veo 創建影片時,您可以選擇現實主義、超現實主義,甚至動畫。除此之外,它還允許您使用電影製作命令並理解“空中拍攝”和“延時拍攝”等術語。與 Google 宣布的早期 AI 影片產生器相比,Veo 提供了更強的控制能力,同時提供了更高品質的影片。
Veo 還支援蒙版編輯,可讓您對影片的特定部分進行調整。您可以透過在提示中包含遮罩區域來實現此目的,並且圖像也可以與文字提示一起使用來產生影片。
在這種情況下,它將使用提供的圖像作為參考並生成相同風格的視頻,例如下面的視頻是使用穿著針織毛衣的羊駝圖像和提示生成的Alpacas dancing to the beat
。
Veo 如何運作?
視訊 AI 模型需要正確理解所提供的提示,並將該資訊與可用的參考相結合。 Veo 被設計為非常擅長理解自然語言和視覺效果,這使其能夠準確生成視頻,包括具有多個細節的視頻。
正因為如此,像這樣的提示Timelapse of a common sunflower opening, dark background
可以為您提供非常高品質的影片。
據谷歌稱,Veo 透過使用壓縮的潛在視訊利用,改進了該公司先前宣布的其他視訊生成工具,例如 Lumiere、VideoPoet、WALT 等。與這些工具不同的是,Veo 接受了詳細視訊字幕的訓練,這有助於人工智慧更好地理解提示。
谷歌表示,視訊生成器依賴潛在的擴散變壓器,這可以確保一致性並防止角色和物體在場景之間閃爍和跳躍。它還使用潛在的視頻壓縮表示,使其更加高效並有助於提高性能。因此,Veo 可以在更短的時間內產生高品質的影片。
您使用 Veo 產生的影片將使用 Google 的 SynthID 新增浮水印,用於識別 AI 產生的內容,類似於 OpenAI 的 Sora 透過內容來源和真實性聯盟 (C2PA) 標準所做的事情。
此外,還有記憶檢查流程和安全過濾器,有助於減少偏見、版權和隱私風險。儘管有這些技術和流程,Veo 仍然需要一些改進,因為背景仍然容易發生變化,而且高度詳細的區域似乎並沒有很好地組合在一起。這就是為什麼谷歌只允許少數創作者進行測試。
如何使用 Veo?
如上所述,Veo 目前尚未可供公眾使用,Google只允許少數選定的創作者試用該工具。他們可以使用 VideoFX 進行嘗試,這是 Google 實驗室中提供的另一個實驗工具,所有正在測試的 Google 產品都在其中。
如果您是創作者並想嘗試 Veo,
- 請造訪 Google 實驗室網站加入候補名單。
- 輸入您的詳細資訊並提交。
- 等待 Google 檢查您提交的內容。如果它認為合適,您將被允許嘗試 Veo。
Google Veo 是 Google 宣布的一系列人工智慧影片產生器中的最新產品,似乎是迄今為止功能最強大的一個。它不僅可以讓您使用不同的風格和效果創建視頻,還可以輕鬆編輯創建的視頻。
我們已經解釋了創作者如何加入候補名單並親自試用該工具,但沒有透露 Veo 是否會公開發布。谷歌只是暗示該工具的某些功能可能會出現在 YouTube 短片中,因此值得期待。
發佈留言