当我们在谈论ChatGPT时,我们在谈论什么?

news/2024/5/20 9:59:34 标签: chatgpt, 人工智能, gpt4, openAI, gpt-3

当我们在谈论ChatGPT时,我们在谈论什么?

文章目录

  • 当我们在谈论ChatGPT时,我们在谈论什么?
    • 一、介绍
    • GPT-4相比GPT-3.5有何不同呢
      • 1.交谈能力
      • 2.多语言翻译精确度
      • 3.视觉输入
    • 二、应用领域
      • 1.小镇做题家 (学术研究)
      • 2.Cosplay,假如你是_,你会?(场景设定)
      • 3.内容生成
      • 4.聊天助手
      • 5.编程小能手
    • 三、如何使用
    • 局限性

一、介绍

北京时间2023年3月15日凌晨,OpenAI公司推出了其GPT最新版本GPT-4, 这是其努力扩展深度学习的最新里程碑。

在此之前,ChatGPT被大家所熟知,它本身并不是OpenAI语言模型的一个版本,而是一个聊天界面,适用于任何支持它的模型。

过去几个月,ChatGPT一直是基于GPT-3.5,而现在它将基于GPT-4进行交互。

据OpenAI称,该公司花了六个月的时间使用内部对抗性测试程序和 ChatGPT的训练经验“迭代调整”GPT-4,从而在真实性、可控性等方面取得了最好的效果。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),拥有了图像处理能力,就意味着机器有了"眼睛",不仅可以简单地要求它描述图片中的内容,还可以深度理解图里的意思并做出反应。
虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现。

在发布当日颇受关注,热度飙升,百度搜索指数如下图:

GPT-4相比GPT-3.5有何不同呢

官方从以下几个方面进行基准测试对比结果如下:

1.交谈能力

在非正式的交谈中,GPT-3.5和GPT-4的差别并不明显。差异体现在当复杂任务达到某个阈值的时候,GPT-4将更可靠,更有创造性,并能比GPT-3.5更善于处理细致入微的引导。
以下是关于《奥林匹克竞赛》和《AP自由回答问题》的情况对比结果

2.多语言翻译精确度

许多现存的机器学习测试基准都是用英语写的。为了测试在其他语言中的能力,我们翻译了MMLU测试基准,一组14,000个多选题,横跨了57个专业,翻译为了多种语言,使用的是Azure 翻译工具(见附录)。在26种语言的24种中,GPT-4都胜出了一些模型的英语语言性能,这些模型包括GPT-3.5和其他的LLMs(Chinchilla,PaLM),甚至在语料稀少的语言上也是如此,这些语言有拉脱维亚语,威尔士语,和斯瓦希里语等

3.视觉输入

图像处理和强大的理解能力,允许用户指定任何视觉或语言任务,它输出的是文本(自然语言的形式)
官方给出了7个示例,其中列举4个如下:

  • 1.给出一篇论文,解释其中章节含义并总结论文
  • 2.识别图中冷笑话
  • 3.根据给出的图文数据进行推理得出答案
  • 4.识别图片不合理的地方,如图:

注: 图像输入仍然在研究使用,暂未对公众开放

二、应用领域

1.小镇做题家 (学术研究)

GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。

2.Cosplay,假如你是_,你会?(场景设定)

3.内容生成

4.聊天助手

5.编程小能手

等等… AI深刻改变了多种岗位职能,如技术支持,销售,内容编辑,以及编程。虽然它现在还不能替代人类,但已足够强大,我们可以在工作中使用AI辅助提效。

三、如何使用

前提:需要魔法

    1. 访问官网
    1. 注册账号(需手机号验证码,目前暂不支持国内手机号)
    1. 升级计划(免费版暂不支持gpt4)
    • 1.点击左下角

    • 2.升级到plus

    • 3.绑定信用卡付费(不支持国内卡)

局限性

虽然GPT-4模型很强, 但仍有有着于早期GPT模型相似的局限性。最重要的是,它仍然不是完全可靠(它“颠倒”事实,并有逻辑错误)。
即给出一个看似正确,实际错误的答案,经过训练迭代,GPT-4在跑分上高出40%于GPT-3.5。因此我们可以持续期待GPT更新的版本,更强的能力!

参考官网

Github地址体验


http://www.niftyadmin.cn/n/270985.html

相关文章

【OpenFOAM】-pimpleFoam-RAS-算例12-wingMotion

算例路径: OpenFOAM-8\tutorials\incompressible\pimpleFoam\RAS\wingMotion 算例描述: 该路径下包含三个目录,分别为:         (1) wingMotion_snappyHexMesh,使用 snappyHexMesh 生成 3D 网格;         (2) wingMotion2D_simpleFoam,使用 extrudeMesh 和 crea…

R语言 | 处理矩阵与更高维数据

目录 一、矩阵 1.1 建立矩阵 ​1.2 认识矩阵的属性 1.3 将向量组成矩阵 二、取得矩阵元素的值 2.1 矩阵元素的取得 2.2 使用负索引取得矩阵元素 三、修改矩阵的元素值 四、降低矩阵的维度 五、矩阵的行名和列名 5.1 取得和修改矩阵对象的行名和列名 5.2 dimnames()函数…

JAVA基本运算符的应用------JAVA入门基础教程

class c { public static void main(String args[]) { //x,先加再使用,x先使用再加 int a1 10; int b1 a1; System.out.println(a1""b1); int a2 10; int b2 a2; System.out.println(a2"&…

MongoDB【索引-index】

目录 1:概述 2:索引的类型 2.1:单字段索引 2.2:复合索引 2.3:其他索引 3:索引的管理操作 3.1:索引的查看 3.2:索引的创建 3.3:索引的移除 4:索引的…

精通ES=ElasticSearch

Elasticsearch 是一个分布式、高扩展、高实时的搜索与 数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平 伸缩性,能使数据在 生产环境变得更有价值。Elasticsearch 的实现原理主要分为以下几个步骤,首先用…

BFS算法专题

BFS算法专题 框架篇LeetCode 111. 二叉树的最小深度解题思路代码实现 LeetCode 752. 打开转盘锁解题思路代码实现 LeetCode 773. 滑动谜题解题思路代码实现 总结 不要纠结,干就完事了,熟练度很重要!!!多练习&#xff0…

特斯拉、毫末、华为……第一梯队拥抱“重感知”

上海、深圳、重庆、杭州等16个城市进行泛化测试,2023年第四季度落地45城,2023年底覆盖50座城市,2023年底前完成100个城市的落地推送……这个春天,忽如一夜春风来,城市NOA的星星之火突然开始呈现燎原之势。特斯拉后&…

SpringMVC的拦截器和异常处理器

目录 lerInterceptor 拦截器 1、拦截器的作用 2、拦截器的创建 3、拦截器的三个抽象方法 4、拦截器的配置 5、多个拦截器的执行顺序 SpringMVC的异常处理器 1、异常处理器概述 2、基于配置文件的异常处理 3、基于注解的异常处理 lerInterceptor 拦截器 1、拦截器的作…