OpenAI 的最新旗艦型號 GPT-4o 受到了用戶不同的評價。雖然有些人對其速度和多模式功能印象深刻,但有些人則對其在智慧和推理方面沒有比 GPT-4 有所改進感到失望。但無論您的團隊是“驚嘆不已”還是團隊“乏味”,仍然很難忽視這樣一個事實:GPT-4o 的多模式功能將改變遊戲規則。
OpenAI 發布新的語音和視覺功能後,GPT-4o 將透過以下方式為您提供協助。
學習夥伴/導師
憑藉 GPT-40 的能力,它可以成為完美的學習夥伴或導師。您可以使用它來學習語言或獲得解決數學問題的幫助。您可以指向物體來獲得語言學習的幫助或與它分享您的數學問題。它不會只是給你答案或為你做作業。
https://www.youtube.com/watch?v=_nSmkyDNulk
它可以創建一系列問題來幫助您理解概念並自行解決問題,就像真正的導師一樣。此外,憑藉其先進的功能,它能夠「同理心」地處理情況。因此,在它輔導你的同時,它可以表現出令人難以置信的耐心和同理心,推動你朝正確的方向前進,而不會感到沮喪。對許多人來說,有時在現實生活中很難做到這一點。
如果您可以在智慧眼鏡上使用 GPT-4o(借鑒 Google 的 Project Astra 的想法),讓您的學習夥伴始終陪伴在您身邊,那麼未來的應用程式將會更加有趣。
獲得面試準備協助
ChatGPT 在 GPT-4o 的支持下可以成為準備面試的終極夥伴。雖然您已經可以模擬與 ChatGPT 的來回對話來準備面試,並且它可以非常出色地幫助解決其技術方面的問題,但由於延遲和 ChatGPT 核心缺乏多模態等因素,該過程並不那麼自然。
但憑藉其增強的語音和視覺推理能力,它可以在幫助你方面更進一步。對於初學者來說,憑藉其「看到」您的新能力,它甚至可以指導您準備面試的美學部分,例如您的服裝。
https://www.youtube.com/watch?v=wfAYBdaGVxs
然而,其影響要大得多。憑藉其視覺功能和解讀人類情感的能力,它甚至可以為您提供肢體語言的回饋,就像真正的教練一樣。
會議助理
ChatGPT 可以像真正的助手一樣即時加入您的會議、監聽您的通話、轉錄、總結,甚至提出自己的意見。
您可以詢問通話中討論的內容、每個人對某個觀點的看法、識別相互衝突的觀點、處理數據分析問題、尋找某些資訊等等。
個人語言翻譯
GPT-4o 可以成為優秀的語言翻譯助理。它可以即時翻譯對話,無需多次重新提示。因此,您可以用不同的語言進行正常的對話,每次說話者說完後,ChatGPT 都會將其翻譯為第二種語言。
它與使用Google翻譯或任何其他翻譯工具有什麼不同?除了您不必每次都打開翻譯並且使對話保持自然之外,GPT-4o 能夠理解單字背後的語調,這意味著翻譯中的損失更少。
盲人無障礙助理
ChatGPT-4o 具有視覺功能,可以幫助視障人士查看周圍環境並向您描述一切。
https://www.youtube.com/watch?v=KwNUJ69RbwY
雖然在目前的狀態下這似乎相當令人嚮往,但想像一下如果你可以在智慧眼鏡中使用GPT-4o,例如Meta Rayban 眼鏡,其中GPT-4o 可以真正成為視障人士的眼睛,那麼會產生怎樣的影響。即使以目前的形式,人們可以將手機相機對準某個物體,並且它可以提供所有細節,這也是相當令人驚奇的。
如果 ChatGPT 能夠翻譯手語,它甚至可以在未來為聾人提供幫助。
監控能力
ChatGPT-4o「有可能」用於監控孩子、寵物、病人和老人,甚至只是前門等。定義),請立即提醒您。
雖然您還需要一段時間才能相信人工智慧不會犯錯並每次都能提供可靠的結果,但這絕對是未來一個令人興奮的可能用例。
編碼助理
由於 ChatGPT 能夠透過螢幕分享存取您的螢幕,因此您可以有一個編碼助手在您身邊並全程指導您。雖然它對其他應用程式也很有幫助,但憑藉 GPT-4o 增強的編碼功能,獲得編碼幫助將是最好的應用程式。
數據分析
與 GPT-4 Turbo 相比,GPT-4o 在速度上有了驚人的改進,並且它也將這種速度帶到了數據分析中。它可以在不到 3 秒的時間內處理電子表格、分析數據,甚至創建統計圖表、曲線圖和圖表。
建立 3D 模型
GPT-4o 甚至可以根據單一文字提示為 3D 模型建立 STL 文件,從而加快視覺化和原型製作過程。因此,無論您是想加快工作流程,還是不具備此任務所需的技術知識,ChatGPT 都可以幫助您!
我在手機上使用 GPT-4o 在大約 20 秒內創建了 3D 模型的 STL 檔案。 pic.twitter.com/2fbObrpPol
– Min Choi (@minchoi) 2024 年 5 月 14 日
創造一致的角色
OpenAI 不久前向 ChatGPT 引入了 DALL-E 的圖像生成功能。但使用 GPT-4o,您可以建立相同角色的多個影像,同時保持角色一致性。因此,您現在可以使用 ChatGPT 為您的故事創建一致的角色,並且它可以在不同的操作中創建角色的圖像。
抄寫手寫筆記
隨著 GPT-4o 影像辨識能力的增強,它現在可以更好地轉錄手寫筆記。您可以使用它來數位化您的學校或大學筆記。它甚至在處理十八世紀的手寫信件時表現出驚人的轉錄能力。因此,雖然會出現錯誤,但它也會以指數方式加快整個過程!
GPT-4o 在 18 號手寫體上確實非常出色。我給了它下面的信並要求它抄錄。幾個非常小的錯誤…太棒了! pic.twitter.com/3JevZvd5p5
– 生成歷史 (@HistoryGPT) 2024 年 5 月 14 日
雖然 GPT-4o 在智慧和推理方面相對於 GPT-4 來說並不是一個巨大的升級,但無論如何它都不是一個小的升級。即使你對它的擬人化或它與斯嘉麗·約翰遜的《她》中的人工智能的相似性感到更加恐懼,你也不能否認它變得更加聰明這一事實,這將在實際方面有所幫助。
然而,在考慮 GPT-4o 的實際應用時,還有一個不容忽視的事實——ChatGPT 的 128K 上下文視窗。由於上下文視窗有限,ChatGPT 只能在會議助理、語言翻譯等場景中發揮作用。 ChatGPT 的上下文視窗在會議/對話進行多久後會耗盡的問題是一個非常有效的問題。還有 GPT-4o 使用上限有限的問題。
發佈留言