Login
Sign Up For Free
English
中文 (繁體)
中文 (香港)
中文 (简体)
日本語
Filipino
Bahasa Indonesia
Bahasa Melayu
Pусский
Português (Brasil)
Magyar
Français
Español
Deutsch
Čeština
العربية
Català
Dansk
Ελληνικά
فارسی
Suomi
Gaeilge
Hindi
עברית
Hrvatski
Italiano
Norsk bokmål
Nederlands
한국어
Polski
Română
Slovenský
Svenska
Türkçe
українська
беларуская
ไทย
Standard view
Walkinggeek
10 months ago
"reason across audio, vision, and text in real time"
NEW GPT-4o: My Mind is Blown.
Walkinggeek
10 months ago
兩個AI的對話, 一個有視覺另一個沒有
Two GPT-4os interacting and singing
Walkinggeek
10 months ago
講話聲音的"表情"已經不會輸從小接受戲劇或是歌唱或是演說的人
Walkinggeek
10 months ago
wow
Interview Prep with GPT-4o
立即下載
Walkinggeek
10 months ago
response time came down from 2-3 seconds to 0.2-0.3 seconds... 跟一般人對話已經沒兩樣
Walkinggeek
10 months ago
以前的 multi-modal 把聲音先轉成text不同, 這次應該是把聲音影像文字一起放在一個神經網路裡訓練
delete
reply
edit
cancel
cancel