OpenAI lance un agent vocal
Le 21 mars à 01:00 (UTC+8), OpenAI a réalisé une diffusion technique en direct et a dévoilé trois nouveaux modèles vocaux spécifiquement conçus pour le développement d'agents vocaux IA. Deux sont des modèles de reconnaissance vocale, GPT-40 Transcribe et GPT-4 Mini Transcribe ; l'autre est un modèle de synthèse vocale, GPT-40 Mini TTS. Il est à noter que les développeurs peuvent contrôler l'émotion et le style vocal du modèle GPT-40 Mini TTS. OpenAI a ajouté un mode de streaming puissant à son API de reconnaissance vocale, permettant aux développeurs d'entrer des flux audio continus dans le modèle en temps réel, et le modèle peut également renvoyer du texte et des réponses en continu en temps réel. Cette fonctionnalité d'interaction en temps réel est très utile pour les applications nécessitant un retour immédiat, telles que les systèmes de dialogue vocal en temps réel, la transcription de réunions vocales, etc. (Communauté Ouverte AIGC)
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
Vous pourriez également aimer

GAIN officiel : enquête en cours sur le problème d'émission anormale
Données : 10 adresses ont reçu un total de 210 000 ETH en 6 heures, d'une valeur d'environ 863 millions de dollars.