OpenAI GPT-4 Omni 模型可以即時解釋音訊、視訊和文字

ChatGPT 的最新版本有望成為迄今為止最先進的版本。

OpenAI 已發布其 ChatGPT 機器人的更新。 GPT-4o 更新承諾為所有用戶提供更大的易用性,並全面提高速度。

「GPT-4o(「o」代表「omni」)是邁向更自然的人機互動的一步——它接受文字、音訊和圖像的任意組合作為輸入,並產生文字、音訊和圖像的任意組合輸出,」讀到開放人工智慧網站。 「它可以在短至232 毫秒的時間內響應音訊輸入,平均為320 毫秒,這與人類在對話中的響應時間(opens in a new window) 相似。它與GPT-4 Turbo 在英語文本上的性能相匹配和代碼,對非英語語言的文本有了顯著的改進,同時API 的速度也更快,成本降低了50%,與現有模型相比,GPT-4o 在視覺和音頻理解方面尤其出色。

OpenAI 技術負責人 Mira Murati 在周一的直播中談到了最新的 ChatGPT 新增功能。她展示了它的一些功能,包括一些新的翻譯功能。透過最新更新,ChatGPT 現在可以跨 50 種不同的語言運行。

OpenAI GPT-4 Omni x BeMyEyes 演示#OpenAI #GPT4 #電腦視覺 @BeMyEyes pic.twitter.com/Yr0wpFyFin

— Shacknews (@shacknews)2024 年 5 月 13 日

正如所指出的美國全國廣播公司財經頻道Murati 非常感謝 NVIDIA 執行長 Jensen Huang 為 OpenAI 技術提供的協助。英偉達有一個大量金錢投資人工智慧領域,幫助該公司實現獲利優於預期

Ozzie 自從 5 歲時拿起他的第一個 NES 控制器以來就一直在玩電子遊戲。但在 THQ 和 Activision 的 QA 圈子裡待了多年之後,他又被拉回來了,主要花時間幫助推動《吉他英雄》系列的巔峰。奧齊已經成為平台遊戲、益智遊戲、射擊遊戲和角色扮演遊戲(僅舉幾例)的忠實粉絲,但他也對任何背後有精彩、引人入勝的故事的事物著迷。因為如果你不能用新鮮的櫻桃可樂來享受好故事,那麼電子遊戲還有什麼意義呢?