时间:2022-12-26 11:08:05
作者:极悦注册科技
浏览: 次
近年来,语音识别技术已深入到日常生活中的方方面面,语音助手、智能音箱、智能客服等都是较为典型的应用场景。在这些实际应用过程中数据标注起着重要作用,训练数据的准确性很大程度上影响了算法模型的表现。
语音标注是数据标注行业中一种比较常见的标注类型。的就是标注员把语音中包含的文字信息、各种声音先“提取”出来,再进行转写或者合成,加上对应的标签,标注后的数据主要被用在人工智能机器学习中,可应用在语音识别、对话机器人等领域。
语音标注中常见的标注类型有ASR语音转写、语音切割、语音清洗、情绪判定、声纹识别、音素标注、韵律标注、发音校对等。
ASR语音转写:ASR语音转写就是通过理解把语音信号转变为相应的文本或命令的过程的高技术。
语音切割:语音切割是识别自然语言中的单词,音节或音素之间的边界的过程。语音切割是语音识别技术领域的一个重要的子问题。
语音清洗:语音清洗是对语音进行重新审查和校验的过程,目的在于删除重复的信息,纠正存在的错误,并提供语音一致性。
情绪判定:情绪判定又称情感标注,是针对一些对话数据,对音频内的人物语言内容进行情绪意图的判定。
声纹识别:声纹识别是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。
音素标注:音素标注语言由语音、词汇和语法三部分要素组成,音素标注就是根据音标、组成音素和读音对语音进行标注。
韵律标注:语音合成系统中的韵律标注一般采用基于文本信息预测韵律的方式。韵律标注是要标注的韵律符号的位置,韵律是句子中字词之间的停顿。
发音校对:发音校对发音校对就是对整个口语训练过程中的数据的采集以及对不标准的发音进行纠正的过程。