+DL+Whisper のバックアップ(No.1)

※前提条件：本情報はWhisper 1.5.0を基づいて説明してる

Whisper †[edit]

这个方案就是 OpenAI 开源的 Whisper，当然是用 Python 写的了，只需要简单安装几个包，然后几行代码一写，稍等片刻（根据你的机器性能和音视频长度不一），最终的文本内容就出来了，就是这么简单。

GitHub 仓库地址：

https://github.com/openai/whisper

NuGet安装下面两个包

NuGet安装下面两个包

Whisper.net.Runtime.Cublas: Cublas 是 NVIDIA 提供的一个线性代数库，它包含一系列用于解决线性代数问题的函数，例如矩阵和向量相乘、矩阵相乘等。
Whisper.net.Runtime.Clblast: Clblast 是一个用于 OpenCL 的 BLAS (基础线性代数子程序) 库，它提供了一系列用于执行线性代数运算的函数。

虽然已经很简单了，但是对于程序员来说还是不够简洁，毕竟程序员都很“懒”，Whisper 虽说安装和调用已经很简单了，但还是需要独立安装 PyTorch 、ffmpeg 甚至 Rust。

于是，就有了更快、更简洁的 Fast-Whisper。Fast-Whisper 并不是简单封装了一下 Whisper，而是是使用 CTranslate2 重新实现 OpenAI 的 Whisper 模型，CTranslate2 是 Transformer 模型的快速推理引擎。

总结一下，也就是比 Whisper 更快，官方的说法是比 Whisper 快了 4-8 倍。不仅能支持 GPU ，还能支持 CPU，连我这台破 Mac 也能用。

GitHub 仓库地址：

https://github.com/SYSTRAN/faster-whisper

XXX

コメント：