GPT-4相较ChatGPT全方位升级,包括升级多模态模型、支持复杂问题解决、可靠性与安全性提升、推出可预测深度学习堆栈和开源Evals评估框架。
1.多模态模型:支持图片输入,文本能力升级
-
根据OpenAI 官网案例,GPT-4能够发现图片中的异常之处,明白“梗图”中的含义和笑点,甚至能直接阅读并分析带有图片的论文。
-
文本能力方面,GPT-4的表现显著优于现有大型语言模型。GPT-4能够处理超过2.5万字的文本,允许长篇内容创建、扩展对话以及文档搜索和分析等应用场景。
2.支持复杂性问题解决,可靠性与安全性显著提升
-
提升各种专业和学术水准并有较好表现。GPT-4在人类模拟考试中的表现超越GPT-3.5。在没有专门培训的情况下,GPT-4在律师 考试 、LSAT 、GREQuantitative等测试中的得分基本全部高于GPT-3.5。
-
GPT-4在语言风格方面得到更新。与具有固定冗长语气和风格的经典ChatGPT不同,开发人员可以通过描述,在系统中规定AI的语言风格,即拥有“自定义”的功能。
3.推出可预测深度学习堆栈,开源 Evals 评估框架
-
Evals可用于分析 GPT-4 等模型的性能来评估其有效性。借助 Evals,程序员可以使用数据集生成问题,评估 OpenAI 模型响应的准确性与各种数据集和模型的功效。