Google发布Gemini 1.0:开启生成式AI模型新时代!

news/2024/5/20 10:06:17 标签: 人工智能, ai, chatgpt, openAI, Gemini, Google
aidu_pl">
个人头像
🎥 屿小夏 : 个人主页
🔥个人专栏 : IT杂谈
🌄 莫道桑榆晚,为霞尚满天!

文章目录

  • 📑前言
  • 一. Gemini的发布前期
    • 1.1 Gemini的准备
    • 1.2 DeepMnid
  • 二. Gemini的三大杀手锏
    • 2.1 多模态能力
    • 2.2 可拓展性
    • 2.3 新硬件,新架构
  • 三. 生成式人工智能领域的新格局会是什么样?

image-20231218202658001

📑前言

北京时间 12 月 6 日晚,Google 给近期稍显沉寂的 AI 模型战场扔下了一颗新的炸弹:号称多模态任务处理能力首次超越人类的 AI 模型,Gemini 1.0 正式发布。

Gemini_13">一. Gemini的发布前期

Gemini_15">1.1 Gemini的准备

Gemini正式发布之前,外媒就有诸多关于 Google 这款全新 AI 模型的消息流出,Google 最早在今年五月的 IO 大会期间透露了 Gemini 的存在,但与之前外界预期的不同,Google 声称 Gemini 的发布并未因为任何内部原因而延期,表示其 AI 模型的研发进程从 2012 年已经开始,直到最近 2023 年发布 PaLM2 与 Bard 之后,就开始为 Gemini 的正式发布做准备。

1.2 DeepMnid

DeepMind本就是 AI 领域顶尖研究机构,早在 OpenAI 踏入聚光灯下之前,DeepMind 就凭借 AI 围棋棋手 —— AlphaGo 赢得了全世界对 AI 时代的关注,如今名为「双子座」的新一代 AI 大模型正式对外发布,也颇有抢回 AI 模型领域主导地位的感觉:双子座在神话本身就对应着「快速思维」的能力,同时也有着包罗万象、善于沟通等寓意。

image-20231218202900640

Gemini_25">二. Gemini的三大杀手锏

2.1 多模态能力

Gemini是一款由Google开发的AI模型,它是史上第一款原生支持多模态能力的模型。与以往的多模态模型不同,Gemini在不同的模态上进行预训练,并利用额外的多模态数据进行微调,从而在处理复杂问题时表现更为出色。Gemini Ultra在行业标准MMLU基准测试中取得了90%的成绩,超过了人类专家和GPT-4同类测试的结果,并在九项独立基准测试中击败了竞争对手。这一突破性的训练架构让Gemini能够快速理解和推理人类的各种内容,为解决复杂问题提供了更加高效的解决方案。

image-20231218203433174

Gemini展示了其多模态理解能力,包括根据简笔画实时解读、根据视频中的颜色比例推荐编织玩具、以及玩猜硬币游戏。它与其他生成式AI模型最大的区别在于能够同时处理多种形态的信息输入。Google强调了Gemini在数学领域的复杂理解能力,展示了通过视频输入数学题,Gemini辅助解决的场景。这展示了Gemini在处理复杂逻辑的数学问题中的优势。

image-20231218203601183

2.2 可拓展性

到 2023 年下半年,大模型并行发展成为行业主流,尤其是端侧大模型在生成式 AI 应用中备受瞩目。vivo、小米、OPPO等手机品牌推出了端侧大模型与云端大模型的结合应用。在Gemini 1.0中,Google发布了三个版本:Gemini Ultra最聪慧,需要更大的计算量;Pro最均衡,适用于多场景;Nano体积最小最高效,主打部署在Android手机等设备上的端侧大模型。

image-20231218203908773

Gemini Nano具备完全在端侧离线运行的能力,已适配Pixel系统自带的录音App,可生成AI摘要,甚至在无网络连接时也可运行。Gemini Nano的能力已整合进Android系统,第三方应用开发者也可通过应用适配调用其能力。Google计划将Gemini适配到其他Android智能手机,但目前仅有Pixel 8 Pro适配。虽未正面回应是否超越GPT-4,但Gemini Ultra在MMLU中获得的评分比GPT-4更高,是唯一超越人类专家测试结果的AI模型。

img

img

2.3 新硬件,新架构

Google的TPU(张量处理单元)是专为神经网络机器学习开发的专用硬件,从2015年发布TPU v1至今已经迭代了五个大版本。

Gemini 1.0基于Google数据中心的TPU v4和TPU v5e大规模阵列训练而来。TPU阵列不仅用于训练Gemini,也应用在Gmail、YouTube、Google Play等Google生态应用中,并从2018年开始开放给第三方客户使用。

Gemini在TPU上的运行速度也明显优于早期的小模型。同时,Google展示了最新的TPU v5p系列,提升了可拓展性,浮点运算能力相比v4提升了两倍,训练速度也提升了2.8倍以上。

此外,还推出了代号为「AI Hypercomputer」的超级计算机架构,可以与Google Cloud计算中心的硬件协同工作,支持现代AI模型开发的工作负载。

image-20231218203827197

三. 生成式人工智能领域的新格局会是什么样?

最近OpenAI经历了一些领导层的变动,包括首席执行官被罢免后又回归,导致了一些不确定性。谷歌发布了Gemini,与OpenAI的GPT-4进行了对比,显示出在大型语言模型领域的激烈竞争。OpenAI也在密切关注谷歌的动向,并推出了一系列更新,包括GPT-4的升级版、将个性化GPT赋予用户的功能以及计划开放GPT应用商店等。OpenAI目前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

image-20231218205446562


http://www.niftyadmin.cn/n/5274587.html

相关文章

iOS 将sdk更新到最新并为未添加版本号的三方库增加版本号

1、更新cocoapod sudo gem install cocoapods2、更新sdk pod update3、查看最新版本号 # 查看最新版本号 cat Podfile.lock4、增加版本号 将查询到的版本号添加到pod中 pod MJRefresh, 3.7.6

蚂蚁集团5大开源项目获开放原子 “2023快速成长开源项目”

12月16日,在开放原子开源基金会主办的“2023开放原子开发者大会”上,蚂蚁集团主导开源的图数据库TuGraph、时序数据库CeresDB、隐私计算框架隐语SecretFlow、前端框架OpenSumi、数据域大模型开源框架DB-GPT入选“2023快速成长开源项目”。 (图…

《计算机网络管理》第二章节网络管理概述思维导图

文章目录 说明第二章 抽象语法表示2.0 概述2.1 网络数据表示2.2 ASN.1语法2.2.1 简介2.2.2 表示上下文2.2.3 ASN.1的文本约定2.2.4 ASN.1基本符号和关键字2.2.5 抽象数据类型2.2.6 数据类型分类2.2.6.1 标签类型 2.2.7 子类型2.2.8 产生子类型的方法2.2.9 应用类型 2.3 ASN.1基…

SpringMVC---获取参数

文章目录 传递单参数传递对象传递多个参数参数重命名传递JSON对象直接从 url 中传递参数 省略变量上传文件获取Cookie获取Header设置Session读取Session 传递单参数 RequestMapping("/name")//1. 传递参数//注:传参的时候一定要传递包装类型而非基础类型…

【openssl】Linux升级openssl-1.0.1到1.1.1

文章目录 前言一、openssl是什么?二、使用步骤1.下载2.编译安装3.一些问题 总结 前言 记录一次openssl的升级,1.0.1升级到1.1.1 一、openssl是什么? OpenSSL是一个开源的加密工具包,广泛用于安全套接层(SSL&#xff…

R语言生物群落(生态)数据统计分析与绘图丨R语言基础、tidyverse数据清洗、多元统计分析、随机森林模型、回归及混合效应模型、结构方程模型、统计结果作图

R 语言的开源、自由、免费等特点使其广泛应用于生物群落数据统计分析。生物群落数据多样而复杂,涉及众多统计分析方法。本教程以生物群落数据分析中的最常用的统计方法回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法为主线,通过多个来自…

排序嘉年华———选择排序和快排原始版

文章目录 一.选择排序二.霍尔版快速排序1.单趟思想2.递归多趟3.寻找中间值作为key 一.选择排序 在进行大佬“快排”之前先来一道开胃小菜————选择排序 选择排序是一种简单直观的排序算法,它的基本思想是每一次从待排序的数据元素中选出最小(或最大&…

CleanMyMac X 4 for Mac(Mac优化清理工具)v4.14.6中文破解版

CleanMyMac X for Mac中文破解版只需两个简单步骤就可以把系统里那些乱七八糟的无用文件统统清理掉,节省宝贵的磁盘空间。cleanmymac x个人认为X代表界面上的最大升级,功能方面有更多增加,与最新macOS系统更加兼容,流畅地与系统性…