+DL+Vosk の変更点

追加された行はこの色です。
削除された行はこの色です。
+DL+Vosk へ行く。
+DL+Vosk の差分を削除
#author("2024-07-18T10:16:21+08:00","default:Admin","Admin")
#author("2024-07-18T10:22:07+08:00","default:Admin","Admin")
[[Deep Learning]]

&color(red){※前提条件：本情報はUbentu15.04を基づいて説明してる};

Vosk是最紧凑、最轻量级的语音转文本引擎之一。这个开源工具包可以在多种设备上离线运行，包括：Android、iOS和Raspberry Pi。它支持20多种语言或方言，包括：英语、中文、葡萄牙语、波兰语、德语等。

Vosk提供了小型语言模型，不占用太多空间，理想情况下，大约只有50MB。然而，一些大型模型可以占用高达1.4GB。该工具响应速度快，可以连续将语音转换为文本。

优点
- 支持各种编程语言开发，如Java、Python、C++、Kotlyn和Shell等等。
- 它有各种各样的用例，从传输到开发聊天机器人和虚拟助手。
- 具有快速的响应时间。

缺点
- 引擎的准确性可能会因语言和口音而出现差异。

官网

 https://alphacephei.com/vosk/

Model的下载网站

 https://alphacephei.com/vosk/models

下载后的model是个文件夹: E:\vosk\vosk-model-small-cn-0.22
#codeprettify{{
├am
├conf
├graph
├ivector
└README
}}

中文的 vosk-model-small-cn-0.22 才42M，他的说明是： Lightweight model for Android and RPi，但是我试着在PC端也可以调用，准确率也可以。

下载的Model如何读入，在Github的例子里面没找到，需要按照下面的方式读入。

#codeprettify{{
try (Model model = new Model("E:\\vosk\\vosk-model-small-cn-0.22")
{
    ... your code here...
}
}}


#hr();
コメント：
#comment_kcaptcha