OpenAI 申请 GPT-5 商标,什么时候发布?都会带来哪些新能力?

CN
1年前
GPT-5 还远吗?


撰文:Kyle


8 月1日消息,OpenAI已经正式为「GPT-5」提交了商标申请,该商标涵盖了以下内容:


  • 人工生成人类语音和文本的软件
  • 将音频数据文件转换为文本
  • 声音和语音识别
  • 基于机器学习的语言和语音处理



根据 GPT-5 的商标申请文件显示,GPT-5商标涵盖了AI生成语音和文本的功能,还可以将音频文件转换为文本,实现声音和语音识别,并利用机器学习技术进行语言和语音处理。


这可能意味着GPT-5 将支持语音能力,将为用户带来更先进、更高效的语音和文本处理体验,多模态能力进一步增强。


GPT-5 什么时候到来?


2023 年3月发布GPT-4时,预计OpenAI将在2023年12月发布下一代模型。Runway联合创始人Siqi Chen此前表示,我被告知GPT5计划于今年12月完成训练,Openai预计它能够实现通用人工智能(AGI)。这意味着我们都会激烈争论它是否真正实现了AGI。


然而,在4月份的MIT活动中,当被问及OpenAI是否正在训练GPT-5时,OpenAI首席执行官Sam Altman表示「我们不会,并且一段时间内不会」。 而在今年6月份的采访中,OpenAI创始人兼CEO Sam Altman在被问及什么推出GPT-5 时曾表示,我也很好奇,我们没有答案,我们不会很快有 GPT-5,我们必须把安全性作为很重要的一部分。


尽管如此,一些人认为OpenAI可能会在2023年10月之前推出GPT-4.5,这是GPT-4和GPT-5之间的中间版本,就像GPT-3.5一样。 据说GPT-4.5最终将带来多模态功能,即分析图像和文本的能力。OpenAI早在2023年3月的GPT-4开发者直播中就已经宣布并演示了GPT-4的多模态功能。现在微软已经在Bing Chat中发布了GPT-4的多模态功能。 看来GPT-4的下一个重大更新即将到来。


除此之外,在开始研究GPT-5之前,OpenAI目前在GPT-4模型上还有很多工作要做。 目前,GPT-4的推理时间非常长,而且运行成本相当昂贵。GPT-4 API访问仍然很难通过。 此外,OpenAI最近刚刚开放了对ChatGPT插件和代码解释器的访问,这些插件和代码解释器仍处于测试阶段。 互联网浏览功能已从GPT-4中删除,因为它显示来自付费网站的内容。


虽然GPT-4非常强大,但我想OpenAI意识到计算效率是可持续运行模型的关键要素之一。 添加新的特性和功能,您就可以处理更大的基础设施,同时确保所有检查点都正常启动并可靠运行。 因此,大胆猜测一下,如果我们假设政府机构不设置监管障碍,GPT-5很可能会在2024年发布。


预测:GPT-5特性和功能


  • 减少幻觉


业界热议的是 GPT-5 将实现 AGI(通用人工智能)。除此之外,GPT-5应该可以减少推理时间、提高效率、减少幻觉等等。让我们从幻觉开始,这是大多数用户不太相信AI模型的关键原因之一。


根据OpenAI的数据,在所有九个类别的内部对抗性设计的事实评估中,GPT-4的得分比GPT-3.5高40%。 现在,GPT-4对不准确和不允许的内容做出响应的可能性降低了82%。 在各个类别的准确度测试中,它非常接近80%的分数。 这是对抗幻觉的巨大飞跃。


现在,预计OpenAI将在GPT-5中将幻觉减少到10%以下,这对于使LLM模型值得信赖来说将是巨大的。


  • 计算效率模型


我们已经知道GPT-4的运行成本很高(每1K token 0.03美元),并且推理时间也更长。 而较旧的GPT-3.5-turbo模型比GPT-4便宜15倍(每1K token 0.002美元)。 根据SemiAnalysis最近的一份报告,GPT-4不是一个密集模型,而是基于「专家混合」架构。 这意味着 GPT-4 针对不同的任务使用 16 种不同的模型,拥有 1.8 万亿个参数。


有了如此庞大的基础设施,运行和维护GPT-4模型的成本就变得非常昂贵。


事实上,很多新的大模型已经开始追求「小而精」,让大模型拥有尽可能少的参数,而不是更多。


在最近对Google PaLM 2模型的解释中,PaLM 2参数相当小,但性能却很快。


  • 多感官AI模型


虽然GPT-4已被宣布为多模态AI模型,但它仅处理两种类型的数据,即图像和文本。 借助GPT-5,OpenAI可能会在实现真正的多模态方面迈出一大步。 它还可以处理文本、音频、图像、视频、深度数据和温度。 它将能够将来自不同模式的数据流互连起来以创建嵌入空间。


  • 长期记忆


随着GPT-4的发布,OpenAI带来了32K token的最大上下文长度,每1K token的成本为0.06美元。 我们在几个月内迅速看到了从标准4K token到32K的转变。 最近,Anthropic将其Claude AI聊天机器人的上下文窗口从9K token增加到了100K token。 预计GPT-5可能会通过更大的上下文长度带来长期记忆支持。


这有助于让人工智能角色和朋友记住你的角色和记忆,并且可以持续多年。 除此之外,您还可以在单个上下文窗口中加载书籍和文本文档库。 由于长期记忆的支持,可能会出现各种新的人工智能应用,而GPT-5可以使这成为可能。


你认为GPT-5什么时候发布,会带来哪些颠覆性创新?


参考资料:
https://beebom.com/gpt-5/

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

币安:注册返10%、领$600
链接:https://accounts.suitechsui.blue/zh-CN/register?ref=FRV6ZPAF&return_to=aHR0cHM6Ly93d3cuc3VpdGVjaHN1aS5hY2FkZW15L3poLUNOL2pvaW4_cmVmPUZSVjZaUEFG
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接