搜尋
Close this search box.

OpenAI發佈GPT-4o!理解世界即時影音對話,能聽也能看!

在5月13日最新的OpenAI發佈會上,展示了GPT-4o,不僅精通文字,還能用聲音和圖像和你即時對話,能識別圖像、情緒,可以唱歌、情感豐富反應靈敏,完全就像一個有血有肉的真人和你對話。
OpenAI-GPT-4o

目錄

在5月13日最新的OpenAI發佈會上,他們展示了GPT-4o,一款功能強大的語言模型。

GPT-4o 的“o”是omni的縮寫,源自拉丁語omnis,意為全面的意思”。

我們可以理解為 OpenAI 是要表達 GPT-4o 擁有”包羅萬象、全知全能”的意思,也由此可見 OpenAI 的目標是進一步減少人們使用ai的障礙,讓所有人都能在工作、學習、創造中用上AI工具。

GPT-4o不僅精通文字,還能用聲音和圖像和你即時對話,能識別圖像、情緒,可以唱歌、情感豐富反應靈敏,完全就像一個有血有肉的真人和你對話。

播放影音

ChatGPT-4o的推出帶來了以下新的變化:

  1. 增強語音理解交互能力:GPT-4o在語音對話模式上採用了新技術,使得與ChatGPT進行交流更加流暢、自然,甚至在語音對話測試中,還有了感知呼吸能力,仿佛與真人對話一般。
  2. 支援多樣(文字、圖像、聲音)內容輸入輸出:新模型能夠處理和生成不僅包括文字還包括圖像和其他媒體的內容,能夠參與更具互動性和視覺的交流,將推動AIGC在影音、圖像生成領域發展。
  3. 提高了處理速度和降低運營成本:與之前的模型相比,處理速度提高了一倍,而運營成本則減半。當與人交談時,它們可以以與人類相同的反應速度進行交流。
  4. 支援更多語言:新模型允許ChatGPT處理50種不同的語言,速度和品質都有所提高,並且通過OpenAI的API提供支援,開發者可以開始使用新模型構建應用。
  5. 改進使用者介面:OpenAI發佈了桌上出版的ChatGPT、更新了UI設計的網頁版ChatGPT,並現場在iPhone手機上演示了由新推出的GPT-4o模型支援的ChatGPT即時語音、文本、圖像圖像交互能力。

GPT-4o的推出,可能影響多個行業

  1. 翻譯行業:GPT-4o的即時多語翻譯,可能減少對人工翻的依賴。
  2. 旅遊行業:人們可以藉由多語即時翻譯,未來減少團體行,改採自由行。
  3. 教育行業:它能提供個性化輔導,改變傳統教學模式。
  4. 客戶服務:GPT-4o的理解對話能力、情感識別功能,將大大提升服務體驗,可能減少傳統客服的職位。
  5. 醫療咨詢:透過識別人臉圖像,能夠提供初步健康咨詢,改變患者獲取訊息方式。
  6. 程式開發:GPT-4o程式代碼理解、問題解決能將提高開發效率,對初級工程師工作可能產生影響。
  7. 娛樂產業:它能夠創作故事、歌曲,帶來新的內容創工具。
  8. 新聞媒體產業:AI的文字生成能力,可以快速產生新聞內容。
  9. 財會人員:GPT-4o的數據分析能力將提高工作效率。 

GPT-4o在北美時間5月29日,已宣布對所有用戶免費開放使用,用戶均可在瀏覽器上傳文件、數據分析、視覺功能,透過GPT-4o能夠高完成多種任務,全天侯在線,不吃不喝不休息,滿足使用者情緒價值,未來可能對各行各業都將產生影響。

您還沒跟上數位轉型的浪潮嗎?

直通國際 AIM為全方位的LINE行銷平台  ,擁有活潑經營LINE的行解決方案、掌握好友面貌,搭配深入的數據分析,讓您更有效率的增加好友、避免封鎖、轉換成實際客戶。

CDP通過提供全面的、即時的、個性化的數據支持,有助於企業更好地適應數位環境,提升業務效率、客戶體驗和競爭力,推動企業實現數位轉型。

想要獲取更多關於CDP客戶數據平台的資訊,以及如何開始使用它的信息嗎?立即訪問我們的網站並獲取更多資訊。

打通營銷增長通路

掌握全方會員樣貌,帶動營收成長動能
Picture of ESi小編群

ESi小編群

ESi的顧問群,分享工作所見所聞,熱切的探索MarTech的世界,協助客戶完成數位轉型

關於ESi

專注於行銷科技的應用、協助企業導入行銷解決方案。專業顧問+熱情服務。值得您信任的數位轉型夥伴。

最近文章

追蹤我們