机器学习笔记 - 了解机器学习中的小样本(Few-Shot)学习

news/2024/5/20 7:41:41 标签: 机器学习, 小样本学习, Few-Shot, 元学习, OpenAI

一、背景概述

        深度学习模型在图像分类、语义分割、对象检测等计算机视觉任务中的成功归功于利用了用于训练网络的大量标记数据——一种称为监督学习的方法。尽管在这个信息技术时代有大量的非结构化数据可用,但注释数据很难获得。

        由于这个原因,计算机视觉机器学习项目中数据标记将占用大部分时间,并且也是一项人工代价昂贵的工作。此外,在医疗保健等领域,只有专家医生才能对数据进行分类 - 例如,看看以下两张宫颈细胞学图像,哪一个是癌变的?大多数未经训练的医疗专业人员不会知道答案,在这种情况下,数据标记更加困难。充其量,我们只有标注少数样本,但是这还不足以训练监督学习模型。

         此外,随着时间的推移,会不断获得更新鲜的数据,例如当来自新发现的鸟类物种的数据。在大型数据集上训练深度神经网络会消耗大量计算能力(例如,ResNet-200 在 8 个 GPU 上进行训练需要大约三周时间)。因此,在大多数情况下,必须重新训练模型以适应新可用的数据是不可行的。

        这就是“Few-Shot Learning”概念的用武之地。

二、什么是少镜头学习?

        小样本学习 (FSL) 是一种机器学习框架,它使预训练模型能够对新类别的数据(预训练模型在训练期间未见过的数据)进行泛化,每个类仅使用几个标记样本。它属于元学习的范式(元学习意味着学习学习ÿ


http://www.niftyadmin.cn/n/468977.html

相关文章

二叉树OJ题:LeetCode--100.相同的树

朋友们、伙计们,我们又见面了,本期来给大家解读一下LeetCode中第100道二叉树OJ题,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! 数据结构与算法专栏:数据结构与算法 个 人…

go系列-读取文件

1 概述 2 整个文件读入内存 直接将数据直接读取入内存,是效率最高的一种方式,但此种方式,仅适用于小文件,对于大文件,则不适合,因为比较浪费内存。 2.1 直接指定文化名读取 在 Go 1.16 开始,i…

10年内打造量子超级计算机,行吗?

光子盒研究院 在未来十年内,微软打算建造一台量子超级计算机。 本周四,微软制定了一个开发自己的量子超级计算机的战略蓝图。设计它的团队将花费至少10年的研究时间,来建造一台能够每秒进行一百万次可靠量子操作的机器。 微软声称&#xff0c…

详解MySQL的常用数据类型

文章目录 一、MySQL 数据类型1.1、mysql中编码和字符 二、数值类型2.1、整数类型的长度2.2、浮点型 三、字符串类型3.1、字符串类型长度 四、日期和时间类型4.1、DATETIME 五、二进制数据类型六、使用建议 一、MySQL 数据类型 MySQL支持很多数据类型,以便我们能在复…

使用ROS功能包camera_calibration进行单目相机和双目相机的内参和外参标定

1.概述 本文总结使用ROS标定单目和双目相机的过程,同时提供生成棋盘格文件的方法。 参考链接: [1]使用ros标定相机的内参和外参 [2]ROS下采用camera_calibration进行双目相机标定 2.生成棋盘格文件 棋盘格可以自己买一个,或者打印一个粘在…

GDB使用方法总结

启动 在shell下敲gdb命令即可启动gdb,启动后会显示下述信息,出现gdb提示符。 ➜ example gdb GNU gdb (Ubuntu 8.1.1-0ubuntu1) 8.1.1 Copyright (C) 2018 Free Software Foundation, Inc. License GPLv3: GNU GPL v…

如何向领导建议数字化转型应着手数据治理?_光点科技

在当今数字化时代,企业的数字化转型已经成为一个迫切的任务。然而,数字化转型不仅仅涉及技术的引入,更需要在数据治理方面进行全面的改进。 一、数据治理是数字化转型的基石。 数据是企业最重要的资产之一,通过对数据的管理和利用…

liunx服务器使用selenium

文章目录 前言一、服务器下载google-chrome、chromedriver1、下载chrome2、下载chromedriver 二、安装Xvfb和python库pyvirtualdisplay、selenium1、安装Xvfb2、安装python库pyvirtualdisplay 三、配置好后测试总结 前言 最近在本地windows系统(下面简称本地&#…