语音识别文字 免费 openai-whisper

news/2024/5/20 9:12:10 标签: 语音识别, whisper, 人工智能, openai

语音和别文字

git地址

https://github.com/openai/whisper

简单的测试一下功能 具体使用请访问 git

环境搭建

python 环境

  1. pip install git+https://github.com/openai/whisper.git
  2. 自行安装 ffmpeg 命令行工具

测试效果

# "/Users/mac/Downloads/aad.mp3" 为本地mp3 路径
whisper "/Users/mac/Downloads/aad.mp3" --model medium

结果

# 包含文件 :
aad.json
aad.srt
aad.tsv
aad.txt
aad.vtt

# 文件所处位置
open .

日志输出

Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:05.000] 我心上的姑娘
[00:18.000 --> 00:21.000] 姑娘 我心上的姑娘
[00:21.000 --> 00:23.000] 你為什麼惆悵
[00:23.000 --> 00:26.000] 我在北方 你在南方
[00:26.000 --> 00:29.000] 姑娘 我心上的姑娘
[00:29.000 --> 00:34.000] 你要把我原諒 原諒我的周四夜香
[00:34.000 --> 00:38.000] 彎彎的眉
[00:38.000 --> 00:42.000] 她撈進了我的心房
[00:42.000 --> 00:46.000] 小小的嘴
[00:46.000 --> 00:52.000] 她會不會印在我臉上
[00:52.000 --> 00:56.000] 你的辮子長長 你的眼睛亮亮
[00:56.000 --> 01:00.000] 我的心兒晃晃 我的大腦缺氧
[01:00.000 --> 01:04.000] 還有我的姑娘 還有我的姑娘
[01:04.000 --> 01:09.000] 忘掉你的憂傷 尋過曉的微光
[01:09.000 --> 01:13.000] 熱情就像太陽 熱情就像月亮
[01:13.000 --> 01:17.000] 你是我的星光 你是我的信仰
[01:17.000 --> 01:21.000] 還有我的姑娘 還有我的姑娘
[01:21.000 --> 01:25.000] 有你才是假象
[01:25.000 --> 01:28.000] 哪怕流浪
[01:43.000 --> 01:46.000] 姑娘 我心上的姑娘
[01:46.000 --> 01:48.000] 你為什麼惆悵
[01:48.000 --> 01:51.000] 我在北方 你在南方
[01:51.000 --> 01:54.000] 姑娘 我心上的姑娘
[01:54.000 --> 01:59.000] 你要把我原諒 原諒我的周四夜香
[01:59.000 --> 02:03.000] 彎彎的眉
[02:03.000 --> 02:07.000] 她撈進了我的心房
[02:07.000 --> 02:11.000] 小小的嘴
[02:11.000 --> 02:17.000] 她會不會印在我臉上
[02:18.000 --> 02:22.000] 你的辮子長長 你的眼睛亮亮
[02:22.000 --> 02:26.000] 我的心兒晃晃 我的大腦缺氧
[02:26.000 --> 02:30.000] 還有我的姑娘 還有我的姑娘
[02:30.000 --> 02:34.000] 忘掉你的憂傷 尋過曉的微光
[02:34.000 --> 02:38.000] 熱情就像太陽 熱情就像月亮
[02:38.000 --> 02:42.000] 你是我的星光 你是我的信仰
[02:42.000 --> 02:46.000] 還有我的姑娘 還有我的姑娘
[02:46.000 --> 02:50.000] 有你才是假象
[02:50.000 --> 02:53.000] 哪怕流浪
[03:00.000 --> 03:03.000] 姑娘 我心上的姑娘
[03:03.000 --> 03:07.000] 你為什麼惆悵
[03:07.000 --> 03:10.000] 我在南方
[03:12.000 --> 03:14.000] 詞曲 李宗盛

http://www.niftyadmin.cn/n/5450520.html

相关文章

后端常见面经之JVM

JVM组成 有垃圾回收的是哪些地方? 垃圾回收主要是针对堆内存中的对象进行的,包括以下几个方面: 堆内存:垃圾回收主要针对堆内存中不再被引用的对象进行回收,包括新生代和老年代中的对象。 永久代/元空间&#xff1a…

Python爬虫学习完整版

一、什么是爬虫 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或者脚本。由于互联网数据的多样性和资源的有限性,根据用户需求定向抓取相关网页并分析也成为如今主流的爬取策略。 1 爬虫可以做什么 你可以爬取网络上的的图片&#…

如何查看ubuntu服务器上防火墙信息

1、检查防火墙状态: Ubuntu 18.04及更高版本使用的是ufw(Uncomplicated Firewall)。您可以使用以下命令检查ufw是否已安装并处于运行状态: sudo ufw status如果ufw已安装并正在运行,则会显示防火墙的状态&#xff08…

计算机网络常见题(持续更新中~)

1 描述一下HTTP和HTTPS的区别 2 Cookie和Session有什么区别 3 如果没有Cookie,Session还能进行身份验证吗? 4 BOI,NIO,AIO分别是什么 5 Netty的线程模型是怎么样的 6 Netty是什么?和Tomcat有什么区别,特点是什么? 7 TCP的三次…

npm常用命令解释

详细介绍npm(Node Package Manager)的常用命令及其作用: 查看npm版本 npm -v这个命令用于检查当前安装的npm工具本身的版本。 升级npm npm install npmlatest -g这条命令用于将全局安装的npm升级到最新版。-g表示全局安装,npmlat…

ubuntu的常用操作

一、用户 1.1 创建新用户 1.1.1 添加、修改、删除 1.2 超级用户root 切换到root用户,有全部权限,可以直接使用任何命令。 我们在什么时候才会切换到root用户进行操作呢?当我们使用某些命令,不想前面一直加sudo的话,…

C++ 简单模拟实现 STL 中的 list 与 queue

目录 一,list 1, list 的节点与迭代器 2,list 的数据结构、一些简单的功能、构造函数 3,list 的对元素操作 4,C 11 的一些功能 5,完整代码: 二,queue 一,list std…

TrOCR—基于Transformer的OCR入门

导 读 本文主要介绍TrOCR:基于Transformer的OCR入门。 背景介绍 多年来,光学字符识别 (OCR) 出现了多项创新。它对零售、医疗保健、银行和许多其他行业的影响是巨大的。尽管有着悠久的历史和多种最先进的模型,研究人员仍在不断创新。与深…