谷歌最近宣布對其 Gemini AI 模型進行一系列更新,包括多項升級和新模型。其中,備受關注的是Gemini Live,這是一種具有視訊和語音功能的多模態人工智慧模型。
自今年 2 月 Bard 更名為 Gemini 以來,該 AI 車型一直在 Android 裝置上取代 Google Assistant。然而,它目前能做的事情相當有限。透過 Gemini Live,Google旨在透過提供更強大、更通用的人工智慧模型來改變這一現狀。
什麼是雙子座直播?
為了向用戶提供改進的 AI 體驗並挑戰 OpenAI 的 GPT-4o 增強型 ChatGPT,Google最近在其 I/O 開發者大會上宣布了 Gemini Live。 Gemini Live 將允許用戶透過語音以及隨後的視訊與其進行自然且個人化的即時對話。
新的人工智慧模型是Google Astra 專案的一部分,該專案是這家搜尋巨頭試圖建立一個通用人工智慧助手,可以使用日常生活中不同類型的輸入來提供幫助。例如,Gemini Live 可以使用文字、智慧型手機相機的圖像以及您的聲音來回答問題。
谷歌表示,新的自然語言模型不僅可以幫助用戶解決問題並執行各種操作,而且在互動過程中感覺完全自然。用戶將能夠透過點擊手機上的語音圖示來啟動 Gemini Live,這將全螢幕顯示 AI 並帶有音訊波形效果。
然後,您可以與人工智慧交談,就像與真正的私人助理交談一樣。升級後的人工智慧模型如何幫助您的一個很好的例子是,當您要求它幫助您準備面試時。 Gemini Live 將建議您可以強調的技能、提供公開演講技巧等等。
特徵
Gemini Live 具有一些功能,使其成為比 Google Assistant、蘋果 Siri 或亞馬遜 Alexa 更好的人工智慧助理。
雙向語音對話
Gemini Live 可讓您與其交談並提供類似人類的口頭回應,從而產生引人入勝且直觀的對話。例如,您可以詢問它有關天氣的信息,它會給您準確而簡潔的更新信息。
智慧助理能力
人工智慧模型可以充當智慧助手,執行總結電子郵件資訊和更新日曆等任務。例如,您可以拍攝音樂會傳單的照片,Gemini 會將活動新增至您的日曆中。
視覺能力
透過使用智慧型手機上的鏡頭,Gemini Live 可以即時捕捉影片。這讓它可以識別物體並回答有關它們的問題。舉個例子,如果您將智慧型手機相機對準揚聲器並要求 Gemini 識別它,它會告訴您它是什麼,甚至識別它的品牌和型號。
Gemini Live如何經營?
Project Astra 可以將語音和視覺輸入結合起來,使人工智慧模型更容易理解它們。然後它可以對資訊做出反應並提供所需的幫助。與 OpenAI 的 GPT-4o 支援的 ChatGPT 一樣,Gemini Live 是一種多模式 AI,不僅僅依賴文字作為輸入。
雖然 Gemini Live 最初在最初版本中將使用語音輸入來收集和分析數據,但它將在未來幾個月內進行升級,透過逐幀分解視頻來處理和分析視頻,以實現更好的理解和交互。
人工智慧可以適應不同用戶說話的速度,你甚至可以打斷它以要求澄清或提供更多資訊。它模仿人類對話的能力可以提供更具吸引力的互動。因此,您可以與它進行來回對話,就像與人類助手一樣。此外,您還可以為人工智慧選擇十種不同的聲音。
GPT-4o 對比。雙子座現場
雖然 GPT-4o 和 Gemini Live 都是多模式 AI 模型,但目前很難看出哪一個在現實生活中表現更好,特別是因為目前兩者都沒有公開可用。
然而,與 ChatGPT 不同的是,Gemini Live 依賴其他 AI 模型(如 Google Veo 和 Imagen 3)來提供影片和影像形式的輸出。儘管如此,在 OpenAI 和 Google 展示的演示中,ChatGPT 似乎更加自然,新的 GPT-4o 模型甚至可以透過語音來檢測和模擬人類情緒。
此外,它可以適應您希望它回答的方式,而 Gemini Live 無法做到這一點,至少在目前的狀態下。
雙子座即時可用性
Gemini Live 將為 Gemini Advanced 訂閱者提供,這是 AI 聊天機器人的付費版本。它將在未來幾個月內推出,預計將在年底前廣泛使用。
Google Messages 等應用程式將能夠充分利用 Gemini Live,讓用戶直接在訊息應用程式中與人工智慧進行互動。
Gemini Live 可能是Google AI 聊天機器人的下一個重大升級,也是它與 OpenAI 的 ChatGPT 等競爭對手相比所需要的。憑藉多模態功能和強大的語音功能,升級後的模型可以幫助Google成功提供多功能且可靠的數位助理。
目前谷歌剛剛宣布將向付費用戶推出新的人工智慧模型。雖然這遺漏了佔 Google 用戶群很大一部分的免費用戶,但我們確實希望 Google 改變立場並決定擴大 Gemini Live 的可用性。
發佈留言