OpenAI stellt GPT-4o vor: Revolutionäre Stimmen für den KI-Dialog

Von 6. Juni 2024Dezember 5th, 2025Blog2 Min. Lesezeit

Ein stoischer Löwe oder ein fies lachender Fuchs: In einem Demovideo zeigt OpenAI, wie GPT-4o Stimmen synthetisieren kann, um auf spannende Weise mit Nutzern zu kommunizieren.

OpenAI hat kürzlich GPT-4o vorgestellt, ein fortschrittliches Sprachmodell, das in der Lage ist, Stimmen zu erzeugen und mündliche Dialoge mit den Nutzern zu führen. Diese Technologie erinnert an Sprachassistenten wie Alexa und Google Assistant, bietet jedoch deutlich ausgefeiltere Möglichkeiten.

In einem Demo-Video zeigt OpenAI beeindruckend, wie das Modell funktioniert. Ein Nutzer gibt Sprachbefehle über eine App auf seinem Smartphone ein, um eine Geschichte zu erstellen. Die Software kann verschiedenen Charakteren Stimmen zuordnen: eine weise Eule, ein stoischer Löwe, eine schreckhafte Maus und ein fies lachender Fuchs. Jede Stimme wird anhand der vorgegebenen Charaktereigenschaften synthetisiert.

Sie sehen gerade einen Platzhalterinhalt von Standard. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf den Button unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Weitere Informationen

Dialog in Echtzeit

Das Besondere: GPT-4o meistert flüssige, schnelle Gespräche inklusive typischer Füllwörter wie „like“, ohne den Faden zu verlieren. Wie bei Textinteraktionen kann sich die KI vergangene Eingaben merken und darauf aufbauen, was nun auch mündlich funktioniert. Das Modell schafft so eine dynamische und anpassungsfähige Kommunikation.

Experimentieren und rechtliche Hürden

Derzeit können Nutzer GPT-4o mit einem entsprechenden Account testen. Parallel dazu ist OpenAI in einen Rechtsstreit mit Schauspielerin Scarlett Johansson verwickelt. Einige KI-generierte Stimmen sollen ihrer Stimme zu ähnlich sein, was zu rechtlichen Auseinandersetzungen geführt hat. Es bleibt abzuwarten, wie OpenAI auf diese Herausforderung reagieren wird.

Zusammenarbeit mit Apple?

OpenAI plant eine Partnerschaft mit Apple. Gerüchten zufolge könnte GPT-4o zukünftig Siri ersetzen, was die Zusammenarbeit beider Unternehmen auf eine neue Ebene heben würde. Konkrete Pläne hierzu sind jedoch noch nicht bekannt.

Quelle: Golem

Keine Experimente mehr im Serverraum – Starten Sie Ihren IT-Betrieb nach FlightOps-Standard.

IT-Ausfälle kosten nicht nur Nerven, sondern im Ernstfall Zehntausende Euro pro Stunde. Mit unserer FlightOps-Methodik bringen wir die Präzision und Fehlerkultur der Luftfahrt in Ihren IT-Betrieb. Weg vom „Helden-Admin“ und hektischer Fehlersuche, hin zu proaktivem Monitoring, strikten Checklisten und garantierter Stabilität.

Frank Roebers

Gründer und Geschäftsführer bei Fox Romeo IT GmbH
Frank Roebers bringt über 30 Jahre IT-Erfahrung mit. Als ehemaliger CEO der SYNAXON AG leitete er Europas größtes IT-Kooperationsnetzwerk mit 300+ Mitarbeitern und einem Einkaufsvolumen von über einer Milliarde Euro. Mit der Tochter einsnulleins etablierte er professionelle IT-Betreuung zum Festpreis für KMU – das Unternehmen wuchs auf 120+ Mitarbeiter an 10+ Standorten. Heute entwickelt er mit Fox Romeo Management-Strukturen für mittelständische IT-Organisationen und fokussiert auf messbare IT-Prozesse als Wettbewerbsfaktor. Als Redner behandelt er Digitalisierung, Führung und KI.
Mehr erfahren
Kontakt