什麼是 Google Veo 以及如何嘗試

OpenAI 的 Sora 的推出為人工智慧驅動的視訊生成應用程式打開了大門，這些應用程式可以根據文字提示創建短片。現在，Google也加入了這場競爭，在本週的年度 I/O 開發者大會上宣布推出自己的影片生成人工智慧應用程式 Veo。

然而，與許多其他新發布的人工智慧工具一樣，新的影片產生器尚未可供公眾使用。谷歌計畫讓藝術家和創作者透過眾包練習來試用工具，這有助於改進它。以下是我們對 Google Veo 的了解。

維奧能做什麼？

Google Veo 可以產生持續一分多鐘的 1080p 視頻，您也可以透過書面說明對其進行編輯。它可以確保框架在視覺上一致，使用者可以使用單一提示或一系列提示來建立敘述。該工具可以包括航空拍攝等電影效果，並創建高度詳細的場景。

使用 Veo 創建影片時，您可以選擇現實主義、超現實主義，甚至動畫。除此之外，它還允許您使用電影製作命令並理解“空中拍攝”和“延時拍攝”等術語。與 Google 宣布的早期 AI 影片產生器相比，Veo 提供了更強的控制能力，同時提供了更高品質的影片。

Veo 還支援蒙版編輯，可讓您對影片的特定部分進行調整。您可以透過在提示中包含遮罩區域來實現此目的，並且圖像也可以與文字提示一起使用來產生影片。

在這種情況下，它將使用提供的圖像作為參考並生成相同風格的視頻，例如下面的視頻是使用穿著針織毛衣的羊駝圖像和提示生成的Alpacas dancing to the beat。

來源：Google

視訊 AI 模型需要正確理解所提供的提示，並將該資訊與可用的參考相結合。 Veo 被設計為非常擅長理解自然語言和視覺效果，這使其能夠準確生成視頻，包括具有多個細節的視頻。

正因為如此，像這樣的提示Timelapse of a common sunflower opening, dark background可以為您提供非常高品質的影片。

來源：Google

據谷歌稱，Veo 透過使用壓縮的潛在視訊利用，改進了該公司先前宣布的其他視訊生成工具，例如 Lumiere、VideoPoet、WALT 等。與這些工具不同的是，Veo 接受了詳細視訊字幕的訓練，這有助於人工智慧更好地理解提示。

谷歌表示，視訊生成器依賴潛在的擴散變壓器，這可以確保一致性並防止角色和物體在場景之間閃爍和跳躍。它還使用潛在的視頻壓縮表示，使其更加高效並有助於提高性能。因此，Veo 可以在更短的時間內產生高品質的影片。

您使用 Veo 產生的影片將使用 Google 的 SynthID 新增浮水印，用於識別 AI 產生的內容，類似於 OpenAI 的 Sora 透過內容來源和真實性聯盟 (C2PA) 標準所做的事情。

此外，還有記憶檢查流程和安全過濾器，有助於減少偏見、版權和隱私風險。儘管有這些技術和流程，Veo 仍然需要一些改進，因為背景仍然容易發生變化，而且高度詳細的區域似乎並沒有很好地組合在一起。這就是為什麼谷歌只允許少數創作者進行測試。

如上所述，Veo 目前尚未可供公眾使用，Google只允許少數選定的創作者試用該工具。他們可以使用 VideoFX 進行嘗試，這是 Google 實驗室中提供的另一個實驗工具，所有正在測試的 Google 產品都在其中。

如果您是創作者並想嘗試 Veo，

Google Veo 是 Google 宣布的一系列人工智慧影片產生器中的最新產品，似乎是迄今為止功能最強大的一個。它不僅可以讓您使用不同的風格和效果創建視頻，還可以輕鬆編輯創建的視頻。

我們已經解釋了創作者如何加入候補名單並親自試用該工具，但沒有透露 Veo 是否會公開發布。谷歌只是暗示該工具的某些功能可能會出現在 YouTube 短片中，因此值得期待。