在加州舉行的年度 I/O 大會上,Google發布了多項與人工智慧相關的公告,包括新模型和現有模型的升級。最有趣的公告之一是 Project Astra,這是一款多模式助手,可以即時運行,並結合了 Google Lens 和 Gemini 的功能,為您提供周圍環境的資訊。
阿斯特拉計劃如何運作?在會議上,Google展示了 Project Astra 的早期版本,它的功能是基於攝影機的聊天機器人,可以使用設備上的攝影機從周圍環境收集資訊。作為多模式人工智慧助手,它可以使用音訊、視訊和影像作為輸入,並根據這些提供必要的輸出。它在 Gemini 1.5 Pro 型號上運行,這使得它非常強大。
這個聊天機器人可以即時分析物體和周圍環境,並且可以非常快速地回答查詢,這使得它非常類似於人類助手,或者托尼·斯塔克(Tony Stark)心愛的賈維斯(JARVIS)。 Project Astra 也適用於智慧眼鏡等穿戴式設備,這意味著人工智慧聊天機器人有很大的潛力整合到不同的設備中。
Project Astra 可以更好地理解它所使用的上下文,更快地處理訊息,並保留它以便更快地回憶。與早期的 Gemini 型號相比,它的語音能力也有了很大的提高,因此聽起來更加自然和人性化。
阿斯特拉計畫能做什麼?在Google展示的簡短演示中,Project Astra 似乎可以幫助完成很多事情。它可以透過攝影機和麥克風觀察和理解物體和位置,並為您提供有關它們的資訊。例如,您可以將手機對準一段代碼並與聊天機器人討論它,或要求它識別一個物件及其用途。
同樣,借助位置感知功能,Project Astra 只需查看周圍環境即可提供有關您所在位置的資訊。它還可以保留顯示的信息,如果您想找到放錯地方的物品,這會非常方便,如演示中所示,它幫助用戶找到了他們的眼鏡。
您也可以向 AI 助理詢問創意,就像手機上的 Gemini 一樣。例如,您可以要求它提供歌曲的歌詞、樂團的名稱或其他任何內容。基本上,Project Astra 的目標是成為一個通用的人工智慧助手,能夠以非常對話的方式為您提供即時資訊。
阿斯特拉計劃何時可用?截至目前,Google尚未發布有關 Project Astra 可用性的公告。演示中顯示的版本是早期原型,但Google暗示這些功能可能會在稍後階段整合到現有的 Gemini 應用程式中。
透過 Project Astra,Google正在努力引領人工智慧助理的發展,讓它們變得更加有用、更容易使用。然而,谷歌並不是唯一追求這一目標的公司。 OpenAI 最近也發布了 GPT-4o,使其 ChatGPT 成為多模式,從而增強了其功能和效率。 ChatGPT 的新語音模式(即將發布)還可以在與用戶互動時使用裝置相機的視訊輸入。
目前,兩者之間的區別在於,GPT-4o 很快就會在所有運行 ChatGPT 的設備上可用,而 Project Astra 預計將在未來某個時候以 Gemini Live 的形式提供,儘管目前還沒有發布日期。隨著 GPT-4o 驅動的 ChatGPT 較早推出,Google的 Project Astra 是否足以與 OpenAI 更受歡迎的聊天機器人競爭還有待觀察。
發佈留言