湘潭赵氏族谱网>>小憩驿站

 主题:语音识别开放平台小试

赵永红  发表于2018-04-17 12:15:42.0


 

有几个小时录音资料需要整理下,上网看了下,有百度、讯飞两种

百度:(识别结果很垃圾,估计该公司不是技术导向,否则随便上个开发人员就发现了)
1.不是说没1分钟限制了么?给长点文件不行,还容易OutOfMemory...(这是低智商问题,不会分块编码上传么?)
2.转换效果很无语,1分钟音频 转换出来 3~4个字(同一个文件提交三次,识别结果大同小异,就是出来3~4个字,叫我“晚安”休息去,很幽默,时间还早,转战去注册讯飞了)

讯飞:(这个还可以)
1、百度通不过的那1分钟文件能识别出来近百来字,虽然也有雷人的“到新年机构智商的人越来越多”,总比百度翻译出来“晚安”好
2、我是昨晚晚上11点测试那1分钟的,切,跑了快1个小时没出来结果,第2天才看到。。。不知道讯飞的cpu深夜在干嘛去了。
3、今早上按3分钟,5分钟,7分钟,20分钟,30分钟强,1小时强扔过去任务,这次跑得倒挺快,短的3个任务很快就有识别结果出现了(相比下晚上11点那个蜗牛等待还行)
4、比百度好的是分块上传,识别率还行。
5、缺点是网站导航不算好,对开发人员,最醒目的应该就是下载、文档、测试权限,别兜圈子,浪费时间。

注:音频文件按wav 16000频率 单声道进行测试的。

 


用图文帖子回复 用所见即所得帖子回复
用 户 名           密 码     新用户注册
标    题  
标题图标  
无图标 原创 转贴 文章 问题 主意 请进 注意
你好 赞扬 反对 喜欢 不爽 有趣 无聊 好奇 疲倦
摆谱 高兴 忧愁 吐舌 发愁 挤眼 生气 大笑 大哭
晕倒 弱智 急死 鬼脸 羞涩 傻笑 伤心 痛苦 恶魔
帖子内容