OpenAI 正在为其备受欢迎的语言模型 ChatGPT 增添一项引人注目的新功能,该功能将允许 ChatGPT 进行类似电话通话的实时语音交互。据预计,这一突破性的更新将在本周一的一次活动中正式揭晓。
为实现这一革新,OpenAI 已经部署了所需的 WebRTC(Web Real-Time Communication)服务器架构。最初,人们猜测 WebRTC 可能仅用于 ChatGPT 的语音模式,但随后发现,实际上是通过 Livekit 这一先进的流媒体服务来实现语音通话的流畅体验。
新功能的主要亮点包括:
语音直接对话:用户可以在 ChatGPT 的界面上直接通过语音与模型对话,体验如电话般自然的交流方式。
互动性增强:这种新的交互方式将让 ChatGPT 变得更加生动和实用,为用户提供前所未有的沟通体验。
语音到文本的即时转换:ChatGPT 不仅能够接收用户的语音输入,还能迅速将其转换为文本,并以文本形式给出回应。
实时语音交流:随着电话通话功能的整合,OpenAI 正朝着更直接的语音交流迈进,使用户能够与 ChatGPT 进行即时、无延迟的语音对话。
无需屏幕的沟通:新的语音对话功能将模拟真实的电话交流,让用户即便不看屏幕也能与 ChatGPT 顺畅沟通,极大提升了使用的便捷性。
OpenAI 的这一创新举措不仅拓宽了 ChatGPT 的应用场景,使之能够支持更直接的语音交流,还预示着未来人机交互将变得更加自然和流畅,为用户带来更加便捷、高效、生动的体验。
暂无评论...