OpenAI GPT-4是一款更安全更实用且能够理解图像的ChatGPT

今天Open AI官方正式发布了GPT-4,GPT-4比以往任何AI系统都“更有创造力和协作能力”,具有更广泛的知识库,并且在解决问题方面表现更出色。作为一个多模态系统,它还可以接受图像作为输入。

GPT-4在需要结构化解决问题的任务方面取得了“突破”。例如,GPT-4可以在回答关于如何清洁水族箱的问题时提供逐步指导。在模拟的律师资格考试中,GPT-4有望进入前10%的成绩,而GPT-3.5的成绩位于倒数10%。

file

GPT-4对话问答方面优于ChatGPT

GPT-4可以处理超过25,000个单词,使其适合生成较大的文档和分析。GPT-4的数据库截至2021年9月,该模型无法从自身经验中学习。据OpenAI表示,GPT 3.5是新系统的第一次测试运行。

file

GPT-4在常见的机器学习基准测试上比前代产品优越高达16%,在多语言任务上优越于GPT 3.5达15%。

OpenAI表示,它还开发了新方法,利用仅使用GPT-4计算能力千分之一的模型进行训练,预测GPT-4在某些领域的表现。

在对AI能力的预测中,OpenAI认为安全方面是一个重要的问题,但鉴于AI的潜在影响,这个问题并没有得到充分解决, 正在加大力度发展方法,为社会提供关于未来系统预期表现的更好指导。

GPT-4可以处理视觉输入

file

GPT-4最明显的新特性是其能够处理图像作为输入的能力。例如,它可以仅使用图像输入来解释一个梗图或一个图案的独特之处,它可以逐步分解信息图表,并且可以总结科学图表或解释它们的各个方面。

在常见的基准测试中,GPT-4已经优于现有的文本-图像模型。OpenAI表示,它仍在发现GPT-4可以在视觉上解决的“新颖和令人兴奋的任务”。

为了控制模型,OpenAI依赖于API客户端的系统消息。这些可以在一定程度上决定模型回应的性质,即GPT-4是以好莱坞演员的风格回应还是以苏格拉底式的方式回应。

与之前的GPT模型类似的限制

尽管在推理和多模态方面取得了重大进步,但GPT-4与其前身在某些方面仍存在类似的局限性。例如,它仍然不是完全可靠的,容易出现错觉。然而,在OpenAI的内部对抗事实评估中,GPT-4的表现平均比GPT 3.5高出40%,并在准确性评分方面达到了70%到80%之间。
file
GPT-4比GPT 3.5产生的错觉更少,但问题远未解决。

GPT-4也继续产生或加强现有的偏见——OpenAI承认,这方面“仍然有很多工作要做”。在这方面,该公司指向了最近宣布的可定制AI语言模型的计划,这些模型可以反映不同用户的价值观,从而代表更大程度的观点多样性。

在处理模型不应回答的问题方面,OpenAI已经大大提高了安全性,因为这些问题违反了OpenAI的内容政策。据说,与GPT 3.5相比,GPT-4回答了82%更少的关键查询。同时,对于涉及敏感问题(如与医学主题相关的问题),GPT-4更有可能提供符合OpenAI政策的答案,比例高出29%。

GPT-4通过ChatGPT Plus推出,API需要等待名单

OpenAI最初将GPT-4提供给ChatGPT Plus的付费客户。该服务每月收费20美元,面向全球提供。像以前的模型一样,开发者将通过API获得访问权限。OpenAI在此处提供一个GPT-4等待名单。

GPT-4的上下文长度限制为约8,000个令牌,或约25,000个单词。还有一个版本可以处理多达32,000个令牌,约50页,但OpenAI目前限制了访问权限。

价格为每1k提示令牌0.03美元和每1k完成令牌(8k)0.06美元,或每1k提示令牌0.06美元和每1k完成令牌(32k)0.12美元,明显高于ChatGPT和GPT 3.5的价格。最便宜的模型,gpt-3.5-turbo,每1000个令牌的价格仅约为0.002美元。

当前的OpenAI报告没有提供关于架构(包括模型大小)、硬件、训练计算、数据集构建等方面的详细信息。OpenAI以竞争激烈的市场为理由。

OpenAI不披露参数数量的事实也可以被解释为该公司不再在其公关中给予参数数量决定性的重要性,因为单凭这一点对于模型的质量没有意义,但许多人认为它确实有意义。

在GPT-4发布之前,社交媒体上提到了一些荒谬的参数数字,以展示GPT-4的性能并助长炒作。在所有以前的模型中,OpenAI都将模型大小作为一个差异化特征进行了传播。

根据OpenAI的说法,GPT-4的第一批客户包括语言学习应用Duolingo、计算机视觉应用Be My Eyes以及摩根士丹利财富管理,后者使用GPT-4组织其内部知识库。冰岛政府正在使用GPT-4来保存其自己的语言。“我们已经对GPT-4进行了一段时间的初始培训,但我们花了很长时间和大量工作才感觉准备好发布它,”OpenAI首席执行官Sam Altman说。

紧随OpenAI GPT-4的发布之后,微软也透露Bing Chat从一开始就已经在使用GPT-4。因此,过去几周与“Sydney”互动的任何人可能已经对GPT-4的能力有所了解。

网站登录为什么需要输入短信验证码?
Midjourney如何注册(保姆级)
标签:

发表我的评论

电子邮件地址不会被公开。 必填项已用*标注

82 + 29 =

ajax-loader