#author("2024-07-18T10:16:21+08:00","default:Admin","Admin") #author("2024-07-18T10:22:07+08:00","default:Admin","Admin") [[Deep Learning]] &color(red){※前提条件:本情報はUbentu15.04を基づいて説明してる}; Vosk是最紧凑、最轻量级的语音转文本引擎之一。这个开源工具包可以在多种设备上离线运行,包括:Android、iOS和Raspberry Pi。它支持20多种语言或方言,包括:英语、中文、葡萄牙语、波兰语、德语等。 Vosk提供了小型语言模型,不占用太多空间,理想情况下,大约只有50MB。然而,一些大型模型可以占用高达1.4GB。该工具响应速度快,可以连续将语音转换为文本。 优点 - 支持各种编程语言开发,如Java、Python、C++、Kotlyn和Shell等等。 - 它有各种各样的用例,从传输到开发聊天机器人和虚拟助手。 - 具有快速的响应时间。 缺点 - 引擎的准确性可能会因语言和口音而出现差异。 官网 https://alphacephei.com/vosk/ Model的下载网站 https://alphacephei.com/vosk/models 下载后的model是个文件夹: E:\vosk\vosk-model-small-cn-0.22 #codeprettify{{ ├am ├conf ├graph ├ivector └README }} 中文的 vosk-model-small-cn-0.22 才42M,他的说明是: Lightweight model for Android and RPi,但是我试着在PC端也可以调用,准确率也可以。 下载的Model如何读入,在Github的例子里面没找到,需要按照下面的方式读入。 #codeprettify{{ try (Model model = new Model("E:\\vosk\\vosk-model-small-cn-0.22") { ... your code here... } }} #hr(); コメント: #comment_kcaptcha