ChatGPT刚刚完成了迄今为止最大的一次更新,这要归功于在其“春季更新”活动上宣布的一系列新功能——由新的GPT-4o模型提供支持。和斯派克·琼斯的电影《她飞来飞去》中的虚拟助手相比,你可能想知道什么时候可以试用它——嗯,答案有点复杂。
好消息是,GPT-4o是ChatGPT的一个新的多模式版本,它可以“实时地在音频、视觉和文本之间进行推理”(正如该公司所描述的那样),现在正在向所有人推出,包括免费用户。我们已经在我们的ChatGPT Plus帐户中使用了它,尽管只是有限的形式——目前,OpenAI只发布了GPT-4o的文本和图像功能,稍后会发布很酷的语音和基于视频的功能。
要找到它,只需在网络浏览器中登录你的帐户,并检查左上角的下拉菜单-如果你有更新,它应该默认为GPT-4o,并贴上标签,称其为OpenAI的“最新和最先进的模型”(见下图)。
以上是对GPT-4o模型的网络访问排序,那么针对iOS、Android和现在的Mac的ChatGPT应用程序呢?似乎ChatGPT的最新模型在这些方面推出得有点慢。我们还没有在iOS或Android上访问GPT-4o, ChatGPT的新Mac应用程序仍在推出(在撰写本文时还无法使用)。
GPT-4o模型现在正在推出基于浏览器的ChatGPT版本——如果你已经有了它,它将出现在左上角的模型下拉框中(上图)。
OpenAI在5月13日表示,它将“从今天开始向Plus用户推出macOS应用程序”,并将“在未来几周内更广泛地推广”。奇怪的是,Windows的粉丝们被冷落了,被排除在ChatGPT桌面应用程序的聚会之外,但OpenAI表示“我们还计划在今年晚些时候推出Windows版本”。
我们什么时候有新的语音助手?
OpenAI的GPT-4o演示中最令人印象深刻的部分无疑是实时会话语音和基于视觉的技巧,这些技巧允许模型同时“看”和聊天。
不幸的是,看起来我们必须再等一段时间才能得到更广泛的推广。OpenAI表示,开发人员现在可以“在API中以文本和视觉模型的形式访问GPT-4o”,这与昨天开始向免费和付费用户发布的基于图像的版本不同。
至于语音技巧,OpenAI表示,它将“在未来几周内在ChatGPT Plus中推出一个带有GPT-4o alpha版本的新版本语音模式”。“我们计划在未来几周内向一小部分值得信赖的API合作伙伴提供对GPT-4o新音频和视频功能的支持。”
这有点模糊,意味着GPT-4o的一些最酷的技巧现在只提供给ChatGPT付费用户中的测试人员和开发人员。但这也是可以理解的——OpenAI GPT-4o演示的技术可能需要一些强大的计算能力,所以更广泛的推广可能需要时间。
对于我们这些渴望在OpenAI的各种演示中与GPT-4o驱动的令人难以置信的快乐和智能助手聊天的人来说,这有点令人沮丧。如果你还没有看过它们,我们建议你看看OpenAI网站上的各种GPT-4o演示视频——其中包括两个人工智能助手互相唱歌,以及ChatGPT帮助某人准备面试。
但从好的方面来看,GPT-4o令人惊讶地将对免费和付费用户开放——尽管OpenAI预览的所有技巧的全面推出可能需要一些时间,但前景肯定是存在的。现在是时候看看Google如何在Google I/O 2024上做出回应了——以下是你如何收听现场活动的方法。