考试能力超 90% 人类的 OpenAI GPT-4 发布
旗龙网网 北京时间 3月15日消息,今天凌晨,OpenAI 最新版本的大型语言模型已经公布 ——GPT-4。该公司表示,GPT-4 在许多专业测试中,它表现出超过绝大多数人类的水平。
具体而言,GPT-4 实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图能力,但目前只限内部测试;更长的上下文,文字输入限制提升至 2.5 万字;回答准确性显著提高;更安全,有害信息更少。
对于普通人而言,如何理解 GPT-4 到底有多强多聪明?
据 OpenAI 透露,GPT-4 通过了所有基础考试而且是高分通过。例如,GPT-4 在模拟律师资格考试的成绩在考生中排名前 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数学考试中排名前 11% 左右。相比之下,曾经令人震撼的 GPT-3.5 ,真实得分在倒数 10% 左右,GPT-4 的强大已经可想而知。
有网友评论,“如果真跟报告说的那样就太可怕了,我感觉能力已经远超我了。”也有人笑称,“我躺好了!我生在了适合我的时代!”
最多的声音则是对未来工作不保的担忧,“还有哪个行业可以不被替代?”“消除任何幻想,AI 时代横扫全球,先思考下 GPT-4 不能做但你能做的。”
比以前的版本“更大”,或许也更烧钱
OpenAI 称,GPT-4 比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。
同时,OpenAI 并未公布这个模型的参数量有多少。
OpenAI 表示,它使用的是微软 (MSFT.US) Azure 训练模型,微软已经向这家初创公司投资了数十亿美元。OpenAI 没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是“竞争情况”。
目前,此领域的许多研究人员认为,人工智能领域的许多最新进展,都来自于在数千台超级计算机上运行越来越大的模型,这些模型的训练过程可能耗资数千万美元。
为了不断提高 GPT-4 性能,OpenAI 还为其研发大搞“基建”。
在过去的两年里,OpenAI 重建了整个深度学习堆栈,并与 Azure 一起为其工作负载从头开始设计了一台超级计算机。一年前,OpenAI 在训练 GPT-3.5 时第一次尝试运行了该超算系统,之后他们又陆续发现并修复了一些错误,改进了其理论基础。这些改进的结果是 GPT-4 的训练运行获得了前所未有的稳定。
OpenAI 联合创始人兼总裁格雷格・布罗克曼(Greg Brockman)表示,OpenAI 预计,未来将由投资十亿美元超级计算机的公司开发尖端模型,一些最先进的工具将带有风险。OpenAI 希望对他们工作的某些部分保密,以给初创公司“一些喘息的空间,以真正关注安全并做好它。”
局限性明显,GPT-4 仍然不完全可靠
尽管功能已经非常强大,但 GPT-4 仍与早期的 GPT 模型具有相似的局限性,其中最重要的一点是它仍然不完全可靠,也就是还有可能胡说八道。
OpenAI 也警告称,GPT-4 还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4 仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”
总的来说,GPT-4 相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在 OpenAI 的内部对抗性真实性评估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%。
同时,GPT-4 训练数据还是截止到 2021 年 9 月份。这也意味着,GPT-4 对于这个时间点以后的信息,缺乏足够的了解,也不会从其经验中学习。
在 GPT-4 发布之后,OpenAI 创始人阿尔特曼发推文表示:“它仍然是有缺陷的,仍然是有限的,在你花了更多的时间第一次使用它时,它似乎比实际情况更令人印象深刻。”
中国的 ChatGPT 们要怎么追?
最令人震惊的在于,按照 demo 视频里 OpenAI 工程师们的说法,GPT-4 的训练在去年 8 月就已经完成,剩下的时间都在进行微调提升,以及最重要的去除危险内容生成的工作。
这也意味着,OpenAI 内部技术,比大家想象中的领先外界更多年。更可怕的是,OpenAI 还一口气开放了 API 接口和相关论文!这让中国的 ChatGPT 们还怎么追?
英诺天使基金合伙人王晟曾告诉《态℃》栏目,“中国的 ChatGPT 们即便奋起直追,静态来讲也许两三年能追上,我认为已经很乐观了。”
但随着更强大的 GPT-4 发布,OpenAI 的技术能力显然仍在不断进步,且进展速度远比我们追的速度还要快。王晟在之前的采访中判断,“除非这件事突然遇到了一个瓶颈,整个科技发展方向到头了,对方不得不停下来,或许我们还有机会追平,或者我们挖掘到一种新的技术路径有机会追上,不然可能没有机会了。”
与此同时,在该模型的落地和应用方面,OpenAI 也有了最新进展。
新模型将提供给 ChatGPT 的付费用户,也将作为 API 的一部分提供,允许程序员将 AI 集成到他们的应用程序中。OpenAI 将对 750 字左右的指令信息收费 3 美分,对 750 字左右的响应信息收费 6 美分。
OpenAI 还介绍,摩根士丹利正在使用 GPT-4 来组织数据,而电子支付公司 Stripe 正在测试 GPT-4 是否有助于打击欺诈。其他客户还包括语言学习公司 Duolingo、Khan Academy 和冰岛政府。OpenAI 合作伙伴微软周二表示,新版必应搜索引擎将使用 GPT-4。
GPT-4 取得的成绩令人兴奋,但对于还在起跑线上的中国 ChatGPT 们,还有大量的工作要去探索和研究,想必感受到了巨大的压力。风浪越大鱼越贵,对于这些迅速进入这个新领域的公司来说,也将会拥有巨大的机会。
GPT-4 的强大告诫我们,未来唯一限制的因素,就是你的想象力!
热门推荐
-
AI 能生成新型蛋白质,可用于制造特定机械性能材料
研究人员将新生成的蛋白质与具有相似结构特性的已知蛋白质进行了比较。他们发现,许多生成的蛋白质与已知的... -
华为盘古大模型即将4 月 8 日亮相!
由中国人工智能学会主办的人工智能大模型技术高峰论坛将在杭州萧山举行。会议议程显示,华为云人工智能领... -
吹爆海信手机金刚4 Pro的“安全性能”和“续航能力”!
叶紫小编要吹爆海信手机金刚4 Pro的“安全性”功能,为了大幅度提升手机用户使用时的安全性能,海信在... -
31 名 ChatGPT 训练派遣工遭解雇
人 ChatGPT 语言模型背后的派遣工被解雇。Slack 内部聊天截图显示,截至 3 月 16 日... -
微软打造 13 亿参数小型 LLM AI 模型,号称实际效果胜于千亿参数 GPT-3.5
模型盲堆体积的效果并不一定更好,更多的取决于训练数据的质量,最近,微软最近发布了一款 13 语言模型... -
Meta 语言 AI 工具泄露:未获授权的用户也能下载使用
Meta 最新的大型语言模型泄漏,当地时间周一,未经授权的用户也可以下载使用,Meta 表示将继续向... -
人工智能语言模型 GPT-3 在智商测试中明显胜过人类大学生
在衡量智力的一系列推理测试中,自回归语言模型 GPT-3 的成绩明显优于普通大学生。该程序利用深度学... -
OpenAI 发帖介绍如何确保 AI 安全:从实际使用中学习预防风险
因此,我们正在努力确保在各个系统层面上的安全性。打造更加安全的人工智能系统在推出任何新的人工智能系统... -
英特尔演示 Meteor Lake 上的 VPU 能力
英特尔最近举行 Computex 2023 大会上,展示了 Meteor Lake 处理器原型,重点... -
超强待机能力,电池容量超大,这就是金立m2017
这几年国产手机一直在做着自己的创新,像专门针对拍照生产的美图手机,还有力争想要超越苹果的华为手机,最... -
谷歌未来几周推出基于人工智能 (AI) 的大型语言模型
2 月 3 日消息,谷歌公司 CEO 桑达尔・皮查伊周四表示,谷歌将在“未来几周或几个月”推出 L... -
OpenAI 聘请专家攻击 ChatGPT,定性探索和对抗性测试
以测试这个工具在回答问题时的详细程度。OpenAI 想要探索模型毒性、偏见和歧视等问题。因此,“红军... -
预计今年将具备折叠屏和 HTD 屏的量产能力,并推出相关产品
TM18 项目分阶段建设,目前,生产线的第一阶段正在攀升,技术预研究、产品认证和发货正在迅速推进,... -
美国教授称 ChatGPT 可分析财经新闻预测股价走势
在接下来交易日的回报。洛佩兹-里拉发现,在获得新闻标题信息之后,模型在几乎所有情况下都表现得更好。具... -
在Java行业里如何才能够体现出自己的价值和能力
在Java行业里面,人们要想实现自己的价值,是非常不容易的一件事情,虽然这一个行业里面的计算机技术已... -
Meta 首次披露专供内部使用自研 AI 芯片
另外一款处理器则是该公司的 Meta 训练和推理加速器(MTIA)家族中的首款芯片,其目的是帮助 M... -
谷歌聊天机器人 Bard 在训练的数据集上,调用了 Gmail 数据
微软研究院首席研究员・克劳福德(Kate Crawford)近日发布推文,谷歌推出的聊天机器人 B... -
考试能力超 90% 人类的 OpenAI GPT-4 发布
今天凌晨,OpenAI 最新版本的大型语言模型已经公布 ——GPT-4。该公司表示,GPT-4 在许... -
亚马逊零售支出将向云业务倾斜,发力 AI 和大模型
亚马逊表示,为了加强生成式 AI 开发大语言模型,该公司将部分零售业务支出转向亚马逊云服务(AWS)... -
行业先驱但不算科技巨头,OpenAI 还面临哪些挑战
人工智能模型能给它们带来帮助,但同时也希望确保,它们的数据保持在自己手中,并且只使用行业相关信息去训... -
微软 Bing Chat 聊天机器人已升级使用最新技术
席营销官 Yusuf Mehdi 确认 Bing Chat 聊天机器人 AI 已经在 GPT-4 上... -
微软分享新版必应开发故事:ChatGPT 演示印象太深刻
Ribas 近日更新其 LinkedIn 博文,分享新版本的必应性(Bing)幕后开发故事。新版微... -
谷歌最新 AI 大语言模型 PaLM2 数据量扩充 5 倍
上周发布的最新大语言模型使用的训练数据,几乎是 2022 年的上一代模型 5 倍。得益于此,该模型在... -
阿里文案生成方法、文案优化方法、模型生成方法及计算设备”专利今日公布
其中,从目标对象的相关信息中,提取至少一个文本元素;将所述至少一个文本元素组合生成待处理文本;基于... -
毫末智行推出全球首个自动驾驶认知大模型 DriveGPT
通过人驾数据反馈的强化学习,来不断提升测评效果,同时也将 DriveGPT 作为云端测评模型,用来评...