上次说了关于OCR识别的软件,这次来说一下语音识别的,所谓的语音识别,也就是把声音波形信号数据转化为文字信息,语音识别技术范围很广,比如Siri、小爱音箱、聊天软件的语音转换文字等。

语音转换过程

语音识别最终目的是转换成可辨认的文字,目前语音识别技术还仍有很长远的路要走,各大厂商宣称识别准确率97%,其实实际上有些识别不是太精准,毕竟涉及到太多词汇,需要训练大量模型,但普通日常用也就足够了,现在还是调用的各大厂商的接口引擎,比较出名的是科大讯飞百度语音等。
现在也出了很多工具,质量参差不齐,一般用途是音频转换为字幕,或者人工语音合成,还有TTS(文本转语音)等,很多开发者去研究训练数据集,过去靠耳听很费时间,有很多复杂词汇,现在有技术帮助也是好事,能省时省力,希望将来能达到准确率100%吧。

在线类

名称说明
讯飞听见国内比较有名的厂商,最好用,也有收费的
网易见外网易见外识别率不太精准,可作为备用
microsoft Azure微软语音很牛逼,可以用来制作成有声小说,生成出来的人声很自然
迅捷录音转文字助手这款没有用过,也可以作为备用
SpeechTexter国外的网站,不知道效果如何

软件类

软件名说明
VideoSrt可以识别视频语音自动生成字幕SRT文件的开源工具
pyTranscriber这软件会调用google speech api接口,需要全程代理google
讯飞输入法其实输入法现在也附带了语音功能,没错,最好用的还是讯飞
Arctime虽然它本身是字幕制作软件,但也包含了语音识别功能,有这个软件的话可以试试
字幕组机翻小助手同样也是字幕软件,也包含了语音转文字功能

语音识别我平时也不太常用,目前就想到这些工具…大家有遇到好的软件欢迎在评论里补充!我有时遇到喜欢的游戏语音就扒下来,然后发现听不懂才会去识别……不过有时候玩玩语音识别也挺好玩的,会打开新的世界~你们也可以去试试!