记者实测|速度更快成本更低,人机交互更自然,openai新模型免费开放-爱游戏官网

业界
2024
05/14
13:50
第一财经资讯
分享
评论

当地时间5月13日,openai通过直播展示了产品更新。与此前传出的市场消息不同,openai并未推出搜索引擎,也未推出gpt-4.5或gpt-5,而是发布了gpt-4系列新模型gpt-4o以及ai聊天机器人chatgpt的桌面版本,聚焦多模态和端侧应用。

此前openai公司ceo奥尔特曼(sam altman)就已经否认了公司将会发布gpt-5,他表示新版gpt非常“神奇”。根据openai官方网站介绍,gpt-4o中的“o”代表omni,也就是“全能”的意思。

据介绍,gpt-4o文本、推理、编码能力达到gpt-4 turbo水平,速度是上一代ai大模型gpt-4 turbo的两倍,但成本仅为gpt-4 turbo的一半,视频、音频功能得到改善。openai ceo奥尔特曼(sam altman)在博客中表示,chatgpt免费用户也能用上新发布的gpt-4o。此外,openai还与走到一起,推出了适用于macos的桌面级应用。

openai技术负责人mira murati在直播中表示:“这是我们第一次在易用性方面真正迈出的一大步。”

价格低于gpt-4 turbo

openai研究员mark chen表示,新模型具有“感知情绪”的能力,能输出笑声、歌唱或表达情感,还可以处理用户打断它的情况。

在直播中,openai演示了一段openai员工与gpt-4o对话的视频,模型反应速度与人类相近,gpt-4o可利用手机摄像头描述其“看到”的东西。

另一段展示视频里,gpt-4o被装在两个手机上,其中一个代表人类与电信公司打电话沟通设备更换事项,另一个gpt-4o扮演电信公司客服人员。openai还展示了gpt-4o搭载在手机上的实时翻译能力。

根据openai介绍,gpt-4o与gpt-3.5、gpt-4的语音对谈机制不同。gpt-3.5和gpt-4会先将音频转换为文本,再接收文本生成文本,最后将文本转换为音频,经历这三个过程,音频中的情感表达等信息会被折损,而gpt-4o是跨文本、视觉和音频的端到端模型,是openai第一个综合了这些维度的模型,可更好进行对谈。

openai将gpt-4o定位为gpt-4性能级别的模型。据介绍,gpt-4o在传统基准测试中,文本、推理、编码能力达到gpt-4 turbo的水平。该模型接收文本、音频和图像输入时,平均320毫秒响应音频输入,与人类对话中的响应时间相似,英文文本和代码能力与gpt-4 turbo相当,在非英文文本上有改善,提高了chatgpt针对50种不同语言的质量和速度,并通过openai的api提供给开发人员,使其即时就可以开始使用新模型构建应用程序。

第一财经记者在openai爱游戏官网看到,gpt-4o输入、输出每1m token(文本单位)收费0.005美元、0.015美元,gpt-4 turbo输入、输出每1m token收费0.01美元、0.03美元。

“在过去两年中,我们花了大量精力在堆栈的每一层上提高-效率,作为这项研究的第一个成果,我们能使gpt-4级别的模型更广泛应用,gpt-4o即日起扩展红队访问权限。”openai爱游戏官网称,gpt-4o的文本和图像功能今日在chatgpt中推出,“我们计划在未来几周内在api中向一小部分值得信赖的爱游戏ayx官网的合作伙伴推出对gpt-4o新音频和视频功能的支持。”

第一财经记者在chatgpt网站看到,chatgpt已接入gpt-4o有限访问权限,但免费用户还不能使用图片生成功能。

记者使用了gpt-4o来描述图片,发现其生成结果较准确,5秒左右就能生成描述图片的文字。

此外,openai还宣布推出一款适用于macos的桌面级应用,使用键盘快捷键就可向chatgpt提问。用户可通过电脑与chatgpt语音对话,gpt-4o的新音频和视频功能后续将推出。openai已向plus用户推出macos应用程序,今年晚些时候还将推出windows版本。

值得注意的是,近日还有消息传出苹果与openai商谈,以便在下一代iphone操作系统使用chatgpt功能。此次openai重点展示了大模型在手机端侧应用的能力。

不过,此次openai并未发布关于新模型的论文或技术文档。

今日,openai特别强调了新模型的风险和局限性。该公司称:“gpt-4o的音频模式带来了各种新的风险。在接下来的几周和几个月里,我们将更关注技术基础设施、培训后的可用性以及发布其他模式所需的安全性。例如,在发布时,音频输出将仅限于选择预设的声音,并将遵守我们现有的安全政策。”

发力端侧应用

不少界人士发表了对openai此次产品更新的看法。“我没想到gpt-4o会接近gpt-5。传闻中openai的‘arrakis’模型就采用多模态输入和输入。事实上,它可能是gpt-5的一个早期检查点(checkpoint),尚未完成训练。”英伟达高级科学家jim fan在上评论称。

jim fan认为,在谷歌召开i/o大会前,openai宁愿发布超过人们对gpt-4.5心理预期的产品,也不愿因为推出达不到人们期望的gpt-5,而让人感到失望。此外,谁先赢得苹果,谁就将大获全胜,与ios整合有几个层次,例如抛弃siri,openai为ios提炼出一个更小层级、设备上运行的gpt-4o。虽然此次未公开相关论文,加利福尼亚大学圣克鲁兹分校教授xin eric wang还是评论认为,一个演示胜过千篇论文。

“比较让人失望的是,这次openai没有发布gpt-5,连gpt-4.5都没看到。openai发布了一系列应用,最重要的是发布了语音助手,由于使用了端到端大模型技术,体验远超siri。openai发布应用,恰恰说明应用在人工智能领域大有可为。目前看来,gpt-5可能还要‘难产’一段时间。”猎豹移动董事长兼ceo傅盛表示。

近期业内对大模型在既有参数下推动应用落地、变现多有讨论。openai在继续研发下一代更大参数模型gpt-5的同时,也在推动价格下降、应用场景和用户群体扩大。

从api价格看,gpt-3.5 turbo输入、输出每1m token(文本单位)收费0.0005美元、0.0015美元,gpt-4为0.03美元、0.06美元,gpt-4之后定价就持续下降。今年4月,openai还宣布chatgpt无需注册便可使用,此举被业界解读为扩大用户群体的努力,或其算力成本得到一定下降。此次产品更新后,奥尔特曼在其博客中强调,openai使命的一个关键部分是让强大的人工智能工具免费,或以一个不错的价格推出。

包括openai推出macos桌面级应用在内,业内近期对大模型落地端侧多有期待。苹果就多次传出与大模型厂商洽谈合作,苹果自身还在端侧小模型领域布局,并推出可支持ai运行、性能更强的m4芯片。

近日一场对谈中,金沙江创投主管合伙人朱啸虎也判断,此前meta发布的llama3系列两个小模型性能强大,ipad pro则用了m4芯片,以后端侧可能就直接跑一个小模型了。几百亿参数的小模型也可在端侧直接跑,尤其是今年下半年iphone新品可能就类似,明年应用层将会爆发。

【来源:第一财经资讯】

the end
广告、内容合作请点击这里
免责声明:本文系转载,爱游戏ayx官网的版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

5 月 11 日消息,彭博社记者马克・古尔曼(mark gurman)今日发文表示,苹果即将与 openai 达成协议,为今年的新 ios 系统提供一些生成式 ai 功能(如聊天机器人)。
业界
周四,据报道,openai计划于下周一5月13日宣布其基于ai的搜索产品,以期与谷歌搜索竞争。
业界
5 月 9 日消息,根据彭博社报道,openai 内部正在开发全新的搜索引擎,通过生成式 ai 的问答方式带来全新搜索体验。
业界
5 月 9 日消息,openai 公司近日发布名为 model spec 的拟议框架初稿,希望能够规范 ai 模型和工具(例如 gpt-4)未来的响应方式。
业界
北京时间5月8日,最新解封的法庭文件显示,openai删除了两个名为“图书1”(books1)和“图书2”(books2)的庞大数据集,这些数据集曾用于训练其gpt-3人工智能(ai)模型。
业界

相关推荐

网站地图