这个故事让人们反思,我们真的了解自己所处的世界吗?或者,我们只是困在一座看似真实却实际上是幻觉的洞穴里,以为自己已经看到了全部?
当下,ChatGPT震撼了人们对人工智能的预期。就像柏拉图的那些困在洞穴中的人们一样,过去,AI可以分析一组数据并在其中寻找模式,但是算法无法真正理解语言的内涵和上下文,人们通过算法只能看到表面的阴影。但是,以ChatGPT为代表的AIGC,让我们相信一些重要的变化正在发生,也许人类即将走出这个看似真实但实际上是幻觉的洞穴。
我们正式推出AIGC的“尖峰系列”,呈现源码资本在AIGC领域的深度思考,分享科技和商业的前沿洞察。在伟大征程的起点,召唤更多人与我们同行。
此前,我们发布了《谁是AIGC的“大玩家”?》,从应用到模型、再到行业基础设施,全面总结和探讨了AIGC各环节玩家面临的情况。今天,我们进一步聚焦,从GPT的技术演进到LLM大模型,尝试回答为什么我们正站在AI应用指数级爆发的起点。
01
GPT模型的技术演进路径

GPT-1至GPT-3成长路径
在深度学习中,模型的参数数量通常非常庞大,包括多个层次、多个节点和多个权重等,因此参数数量可以成为衡量模型复杂度和性能的一个重要指标。参数数量越多,模型的学习能力和表达能力就越强,能够处理更加复杂和多样的任务。

InstructGPT第一代10万级的标注数据
2.采样一个更大的调用API的数据。网络生成多个答案,让AI训练师对它们进行优劣排序,形成奖励模型。
3.利用这些奖励模型,使用接近策略优化(Proximal Policy Optimization)微调模型。
现在,New Bing会展现出情绪变化、更丰富的创意创作;ChatGPT也会拒绝不合理请求,承认自己能力有限——它们表现得更像人类了。
02
涌现能力:仅存在于大模型的暴力美学
可以预测和真实数据分布与模型分布之间的KL散度。
总的来说,大语言模型是一种强大的自然语言处理工具,它的应用潜力非常广泛,并在自然语言处理领域发挥着越来越重要的作用。
[2] Open AI 官网 Introducing ChatGPT
[3] Open AI 官网 Aligning language models to follow instructions
[4] Scaling Laws for Autoregressive Generative Modeling – Open AI 2020/11/06
[5] Scaling Laws for Neural Language Models – Open AI 2020/01/23
[6] 大模型的突现能力和ChatGPT引爆的范式转变https://yaofu.notion.site/A-Closer-Look-at-Large-Language-Models-Emergent-Abilities-493876b55df5479d80686f68a1abd72f
[7] ChatGPT问答