●△●
Buzz是一款可以自动识别语音为文本字幕的软件工具,基于OpenAI开源的Whisper自动语音识别模型,可以批量将音频或者是视频中的内容自动转化为带有时间的字幕,速度非常快,是一款能极大
ESPnet是一个基于Apache 2.0许可证发布的开源语音转文本软件,它提供端到端语音处理功能,涵盖了ASR、翻译、语音合成、增强和日志化等任务。该工具包采用Pytorch
E S P n e t shi yi ge ji yu A p a c h e 2 . 0 xu ke zheng fa bu de kai yuan yu yin zhuan wen ben ruan jian , ta ti gong duan dao duan yu yin chu li gong neng , han gai le A S R 、 fan yi 、 yu yin he cheng 、 zeng qiang he ri zhi hua deng ren wu 。 gai gong ju bao cai yong P y t o r c h . . .
业界良心OpenAI开源的Whisper模型是开源语音转文字领域的执牛耳者,白璧微瑕之处在于无法通过苹果M芯片优化转录效率,Whisper.cpp 则是 Whisper 模型的 C/C++ 移
Part1:开源项目分享 vosk:一个采用了深度学习技术的轻量级语音识别库。能在较短的时间内完成语音转文
(ˉ▽ˉ;)
ASRT是一套基于深度学习实现的语音识别系统,全称为Auto Speech Recognition Tool,由AI柠檬博主开发并在GitHub上开源(GPL 3.0协议)。本项目声学模型通过采用卷
>0<
中国软件巨头百度的研究人员也在开发他们自己的语音文字转换引擎,叫做“DeepSpeech2”。它是一个端对端的开源引擎,使用“PaddlePaddle”深度学习框架进行英语或汉语的文
这里有一个好用的开源项目 Transcribe,无需下载巨大的模型文件,只需要三个文件即可实现神奇的语音转文字。 Transcribe 是一个基于 OpenAI 训练并开源的神经网络,支持英语、中文等多
?^?
②DeepSpeech: DeepSpeech是由Mozilla开发的开源语音识别引擎,使用基于深度学习的模型进行语音转文字。它提供
Assemblyai是一个使用深度学习技术的语音识别API,支持多种语言,包括中文。它使用了一种叫做“自适应密度比对”的算法,可以在较短的时间内完成语音转文字的任务
发表评论