ChatGPT语音转文字来了:每分钟收费4分钱 中文还不太行

2023年3月3日 194人浏览 / 0人评论 / 添加收藏

作为当前最火的

实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。

这次商业化之后,Whisper API的收费也很低廉,每分钟只要0.006美元,人民币约为4分钱,预计会让很多语音相关的企业压力很大。

Whisper API支持对语音文件进行转录和翻译,并支持包括英语、

不过不同语言的准确率差别不小,Whisper large-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。

至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。

至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。

全部评论