当我们在谈论ChatGPT时，我们在谈论什么？

文章目录

当我们在谈论ChatGPT时，我们在谈论什么？
- 一、介绍
- GPT-4相比GPT-3.5有何不同呢
- - 1.交谈能力
  - 2.多语言翻译精确度
  - 3.视觉输入
- 二、应用领域
- - 1.小镇做题家 (学术研究)
  - 2.Cosplay，假如你是_,你会？(场景设定)
  - 3.内容生成
  - 4.聊天助手
  - 5.编程小能手
- 三、如何使用
- 局限性

一、介绍

北京时间2023年3月15日凌晨，OpenAI公司推出了其GPT最新版本GPT-4，这是其努力扩展深度学习的最新里程碑。

在此之前，ChatGPT被大家所熟知，它本身并不是OpenAI语言模型的一个版本，而是一个聊天界面，适用于任何支持它的模型。

过去几个月，ChatGPT一直是基于GPT-3.5，而现在它将基于GPT-4进行交互。

据OpenAI称，该公司花了六个月的时间使用内部对抗性测试程序和 ChatGPT的训练经验“迭代调整”GPT-4，从而在真实性、可控性等方面取得了最好的效果。GPT-4 是一个大型多模态模型（接受图像和文本输入，发出文本输出），拥有了图像处理能力，就意味着机器有了"眼睛"，不仅可以简单地要求它描述图片中的内容，还可以深度理解图里的意思并做出反应。
虽然在许多现实世界场景中的能力不如人类，但在各种专业和学术基准上表现出人类水平的表现。

在发布当日颇受关注，热度飙升，百度搜索指数如下图：

GPT-4相比GPT-3.5有何不同呢

官方从以下几个方面进行基准测试对比结果如下：

1.交谈能力

在非正式的交谈中，GPT-3.5和GPT-4的差别并不明显。差异体现在当复杂任务达到某个阈值的时候，GPT-4将更可靠，更有创造性，并能比GPT-3.5更善于处理细致入微的引导。
以下是关于《奥林匹克竞赛》和《AP自由回答问题》的情况对比结果

2.多语言翻译精确度

许多现存的机器学习测试基准都是用英语写的。为了测试在其他语言中的能力，我们翻译了MMLU测试基准，一组14,000个多选题，横跨了57个专业，翻译为了多种语言，使用的是Azure 翻译工具（见附录）。在26种语言的24种中，GPT-4都胜出了一些模型的英语语言性能，这些模型包括GPT-3.5和其他的LLMs（Chinchilla，PaLM），甚至在语料稀少的语言上也是如此，这些语言有拉脱维亚语，威尔士语，和斯瓦希里语等