研学家(广东)教育科技有限公司为您免费提供人文科技研学,夏/冬令营,研学旅行基地等相关信息发布和资讯展示,敬请关注!  
研学家(广东)教育科技有限公司

全国咨询热线:

020-31606515

新闻类别

新闻详细

人文科技研学:智能语音

来源:http://www.yxjjy.com/news594923.html  发布时间:2021-4-19 10:41:00

智能语音场景化需要关注的问题

      以语音质检为例,如果以模型质检点相关的文本来训练往往都能实现90%+,甚至更高的水平,而全文转译却很难达到,但这并不影响语音质检的实际应用,因为在该场景下,只要与质检点及模型相关的那部分语音识别准确率能达到即可为质检工作提供高效及有力的支撑。

      大部分质检的实际工作的真实关注点是所谓的“质检项”是否满足即可,全文的语音转译是否准确在该场景下是一种类似”白噪音“的存在,准确与否在大多数的情况下并不会影响该场景的真实应用,这就是一种”应用为先“的思考考量。

      因此,请不妨尝试着以这个思路来分析一下你手中的业务场景:“你想要识别的内容”应该不会很多很多,而自然语言中其实还含有与你希望利用的业务价值大量无关的,诸如无意义语气词,重复语句等。所以,语音识别并不一定需要非常高的准确率,它并不会实际阻碍你去利用该技术实现语音文本分析及探索业务价值。

      图像识别技术(OCR)技术就是一个很好的案例来说明这个问题,从普遍的识别准确性来看(类似于语音的全文转译准确率),OCR并不如大家想像中的智能,准确率亦没有想像中的高,通用性场景下基本都低于85%。以停车场车牌识别为例,该场景车牌识别上却非常普遍好用,准确度也高,就是利用了这种场景化下的针对训练(车牌识别所需的范围是相对可控的,要识别的对象也很有限——近场识别,字母、数字,车牌形状统一),同时抛弃了其他无用识别的干扰。
      研学家有人文科技研学,夏/冬令营,研学旅行基地,研学家教育等一系列研学课程都能够激发孩子的潜力与学习兴趣,欢迎咨询。



全国咨询热线:

020-31606515

Add:

广东省广州市黄埔区萝岗敏捷广场D3-801

Fax: 020-61711072

E-mail: 279837828@qq.com

扫码加微信

扫码关注研学旅行