当地时间13日,美国人工智能公司“开放人工智能研究中心”(OpenAI)宣布,将推出一款名为GPT-4o的新款人工智能模型,并免费向用户开放使用。
在发布会上,OpenAI首席技术官穆拉蒂表示GPT-4o在多模态方面非常强大,基于来自互联网的大量数据展开训练,并改进了文本、图像和音频方面的能力。这款模型能以这三者任意组合的形式输入和输出,交互方式更多样、更自然,并且支持50种语言。
GPT-4o在语音对话时平均响应时长仅有320毫秒,与人类近似,而此前ChatGPT语音对话的平均延迟为2.8到5.4秒。此外,新模型在对话时,用户可以随时打断。
OpenAI还表示,新模型性能更强,接口调用价格却只有此前模型的一半。所有用户都可以免费使用,不过消息数量会受到限制。预计新模型各项功能会在未来几周逐步推出。
不过,有业内人士表示,尽管GPT-4o在多模态功能上有所提升,但OpenAI并未展示出真正的视觉多模态突破功能。
编辑: | 张梦薇 |
责编: | 刘圣韬 |
剑网行动举报电话:12318(市文化执法总队)、021-64334547(市版权局)
Copyright © 2016 mzyl.org Inc. All Rights Reserved. 看东方(上海)传媒有限公司 版权所有
全部评论
暂无评论,快来发表你的评论吧