OpenAI har nyss presenterat sin senaste och mest avancerade språkmodell GPT-4o som kan tolka ljud, bild och text i realtid (något Google nyss visade att Gemini klarar). Tillägget av bokstaven ”o” i namnet på språkmodellen står för ”omni”. Enligt utvecklaren
Läs mer här
OpenAI introducerar GPT-4o som kan tolka ljud, bild och text i realtid
Previous Post
Google ger imponerande glimt av multimodal AI innan I/O