错误转换词典制作系统的制作方法
2021-01-28 12:01:02|244|起点商标网
[0001]
本发明涉及错误转换词典制作系统。
背景技术:
[0002]
日本特许第4852448号公报中,记载一种错误倾向学习语音识别装置。此错误倾向学习语音识别装置是使用由表现正确答案候补的错误倾向的特征函数和其权重所定义的错误修正模型,进行各种计算,学习错误倾向。
[0003]
现有技术文献
[0004]
专利文献
[0005]
专利文献1:日本特许第4852448号公报
技术实现要素:
[0006]
发明所欲解决的课题
[0007]
记载于日本特许第4852448号公报的错误倾向学习语音识别装置,其为了掌握错误倾向而需要进行各种计算。因此,有所谓处理变复杂的问题。
[0008]
此说明书所记载的一发明,其目的在于提供一种可迅速且简便地制作适当的错误转换用语词典的系统、以及使用所述错误转换用语词典的语音识别系统。
[0009]
解决课题的技术方案
[0010]
此说明书所记载的发明之一是将用语输入至系统,使其转换成语音信息,并将经转换的语音信息进行语音解析。然后,所述系统在经语音解析而得的用语和被输入的用语不一致的情形,会将经语音解析而得的用语存储作为被输入的用语的错误转换用语。
[0011]
此说明书所记载的发明之一是涉及错误转换词典制作系统1。
[0012]
此系统具有:用语输入部3,其输入用语;
[0013]
语音数据转换部5,其将被输入至用语输入部的用语亦即输入用语转换成语音数据,获得输入用语语音数据;
[0014]
语音数据解析部7,其接收从语音数据转换部输出的输入用语语音数据,进行语音解析,将输入用语语音数据转换成用语,获得语音解析用语;以及
[0015]
错误转换用语识别部9,其从用语输入部或语音数据转换部接收输入用语,从语音数据解析部接收语音解析用语,在输入用语和语音解析用语不一致的情形,将语音解析用语设为输入用语的错误转换用语;
[0016]
并且,从错误转换用语识别部接收输入用语和其错误转换用语,使输入用语和其错误转换用语相关联,并存储在错误转换词典11。
[0017]
此错误转换词典制作系统的优选例是:
[0018]
用语输入部包含:电子文件接收部,其接收电子文件;以及用语提取部,其提取电子文件接收部接收到的电子文件所含的用语。
[0019]
此说明书所记载的发明之一是涉及一种系统,其是包含上述的错误转换词典制作
系统的语音识别系统,具有:
[0020]
语音输入部,其输入语音;
[0021]
语音解析部,其将被输入至语音输入部的语音进行语音解析,获得解析语;
[0022]
错误转换用语判断部,其判断解析语是否和被存储在错误转换词典的任一错误转换用语一致;以及
[0023]
修正语候补提取部,其在错误转换用语判断部判断解析语和被存储在错误转换词典的任一错误转换用语一致的情形中,求取和一致的错误转换用语对应的输入用语作为正确用语的候补。
[0024]
发明效果
[0025]
若根据本发明,可迅速且简便地制作适当的错误转换用语词典。而且,若使用此种错误转换用语词典,则可容易地使语音识别的精确度提升。
附图说明
[0026]
图1是表示错误转换词典制作系统的基本构成例的概念图。
[0027]
图2是表示计算机的基本构成的方框图。
[0028]
图3是表示错误转换词典制作系统的基本动作例的流程图。
[0029]
图4是用于说明用语输入部的例子的概念图。
[0030]
图5是用于说明语音识别系统的概念图。
具体实施方式
[0031]
以下,使用附图说明用于实施本发明的方式。本发明不受限于以下说明的方式,也包含在技艺人士可清楚得知的范围内由以下方式进行适当修正的方式。
[0032]
图1是表示错误转换词典制作系统的基本构成例的概念图。如图1所示,错误转换词典制作系统1具有:用语输入部3、语音数据转换部5、语音数据解析部7、错误转换用语识别部9以及错误转换词典11。此系统基本上是被安装于计算机(以及软件)。此系统期望是通过计算机而自动进行处理的系统。并且,此系统可为在有来自用户的输入的情形,也可将所述输入作为信息之一而进行处理的系统。本说明书中的各要素或由部所表示的要素会作为计算机中进行各种处理的单元而发挥功能。
[0033]
图2是表示计算机的基本构成的方框图。如此图所示,计算机具有:输入部21、输出部23、控制部25、运算部27以及存储部29,各要素是通过总线31等而被连接,可进行信息的授受。例如,在存储部中,可存储控制程序,也可存储各种信息。在从输入部输入预定信息的情形,控制部会读取被存储在存储部的控制程序。然后,控制部会适当地读取被存储在存储部的信息,并传往运算部。并且,控制部会适当地将被输入的信息传往运算部。运算部会使用接收到的各种信息而进行运算处理,并存储在存储部。控制部会读取被存储在存储部的运算结果,并从输出部输出。如此进行而执行各种处理。执行此各种处理的便是各单元。
[0034]
错误转换词典制作系统1是用于制作错误转换词典的系统。错误转换词典是一用语群组所含的用语、和在将所述用语进行语音识别时有可能被错误转换的错误转换用语的清单。错误转换词典是能在计算机中使用的电子词典(存储部)。例如,单词转换词典在进行一会话的语音解析时,会读取和所述会话对应的错误转换词典,已进行语音解析的单词若
是错误转换用语,则被转换成其关联(正确)的用语,或被使用在用于读取正确用语作为修正语候补。此错误转换用语词典也可为例如一演示、一疾病(的附件)、新闻的一原稿、预定翻译的一原稿、预定朗读的书或一技术领域的错误转换用语词典。
[0035]
用语输入部3是用于将用语输入至系统的要素。用语输入部3也可为例如键盘等指示设备。例如,用户使用键盘键入「糖尿病」。然后,键盘将和用语「糖尿病」相关的信息输入至系统。如此进行,用语被输入至系统。
[0036]
语音数据转换部5是用于将被输入至用语输入部3的用语亦即输入用语(例:糖尿病)转换成语音数据而获得输入用语语音数据(例:由频率数据所表示的「糖尿病」)的要素。所谓语音数据,是若被从喇叭等输出装置输出,则成为人可听懂的语音(频率数据)的数据。例如,语音数据转换装置是将通过键盘所输入的用语以语音的形态从喇叭输出。此语音数据转换部5只要适当使用众所周知的语音数据转换装置即可。此外,语音数据转换部5也可从喇叭等输出装置,实际地以语音的形态(以人可听懂的状态)输出。并且,语音数据转换部5也可将输入用语转换成计算机可处理的语音数据,而实际上不输出语音。此外,此情形的语音数据,例如优选为通过经由喇叭而成为人可听懂的状态的语音数据。并且,特别是可在杂音环境下放置错误转换词典制作系统1,而在所述状态下使语音从喇叭输出。通过如此进行,可重现于实际的会话环境下的语音识别状况。杂音环境下的例子是学术会议、演讲、室外、医院、公司以及施工现场。此外,此错误转换词典制作系统具有将在此等杂音环境中的杂音数据输出的杂音输出部,在语音数据转换部5将输入用语转换成语音数据时,可使用合并输入用语和杂音数据的数据作为语音数据。此方法可实际上从喇叭输出杂音,将所输出的被输入的用语从喇叭输出,并转换成语音数据。并且,可将基于输入用语的语音数据和杂音数据进行混合,制作输入用语语音数据。
[0037]
语音数据解析部7是用于从语音数据转换部5接收输入用语语音数据(例:由频率数据所表示的「糖尿病」),进行语音解析,将输入用语语音数据转换成用语,获得语音解析用语(例:堂鸟冰)的要素。语音数据解析部7例如可将被输入的语音(振动信息)转换成包含频率的电子数据亦即输入用语语音数据,解析所述包含频率的电子数据,并转换成用语。如此进行而语音数据解析部7可获得语音解析用语(例:堂鸟冰)。将语音数据转换成用语的语音转换装置是众所周知的。因此,作为语音数据解析部7,可适当使用具有众所周知的语音转换算法的装置。
[0038]
错误转换用语识别部9是在输入用语和语音解析用语不一致的情形,用于将语音解析用语设为输入用语的错误转换用语的要素。
[0039]
错误转换用语识别部9是从用语输入部3或语音数据转换部5接收输入用语(例:糖尿病)。另一方面,错误转换用语识别部9是从语音数据解析部7接收语音解析用语(例:堂鸟冰)。然后,错误转换用语识别部9判断输入用语(例:糖尿病)和语音解析用语(例:堂鸟冰)是否一致。然后,在输入用语和语音解析用语不一致的情形,将语音解析用语(例:堂鸟冰)设为输入用语(糖尿病)的错误转换用语。如此进行所求得的语音解析用语(例:堂鸟冰)会作为对应的输入用语(糖尿病)的错误转换用语而被适当地存储在错误转换词典11。
[0040]
图3是表示错误转换词典制作系统的基本动作例的流程图。
[0041]
例如,包含多个用语的演示文件(例如,由powerpoint(注册商标)所制作的演示文件)被拖放至语音识别应用程序。然后,错误转换词典制作系统解析演示文件所含的用语,
将演示文件所含的用语(例:糖尿病)输入至错误转换词典制作系统1(用语输入工序:s101)。被输入的用语等的数据会被适当地存储在存储部,根据所需从存储部读取,用于各种运算处理。
[0042]
被输入至错误转换词典制作系统1的用语(例:糖尿病)会被转换成输入用语语音数据(例:糖尿病;例:频率数据)(语音数据转换工序:s102)。如此进行所得的输入用语语音数据会被适当地存储在存储部,根据所需从存储部读取,用于各种运算处理。
[0043]
错误转换词典制作系统1会接收输入用语语音数据(例:糖尿病),进行语音解析,将输入用语语音数据转换成用语,获得语音解析用语(例:堂鸟冰)(语音数据解析工序:s103)。语音解析只要适当地使用众所周知的算法即可。如此进行所得的语音解析用语会被适当地存储在存储部,根据所需从存储部读取,用于各种运算处理。
[0044]
错误转换词典制作系统1会接收输入用语和语音解析用语(此等也可从存储部读取),判断输入用语和语音解析用语是否一致(错误转换用语识别工序:s104)。
[0045]
在输入用语和语音解析用语一致的情形(s105),也可不更新错误转换词典11。
[0046]
在输入用语和语音解析用语不一致的情形(s106),将语音解析用语(例:堂鸟冰)设为输入用语(糖尿病)的错误转换用语。
[0047]
如此进行所求取的语音解析用语(例:堂鸟冰)会作为对应的输入用语(糖尿病)的错误转换用语而被适当地存储在错误转换词典11。如此进行而更新错误转换词典11(错误转换词典更新工序:s107)。
[0048]
图4是用于说明用语输入部的例子的概念图。此用语输入部3包含:电子文件接收部41和用语提取部43。而且,电子文件接收部41会接收电子文件,用语提取部43会提取接收到的电子文件所含的用语。将如此进行所提取的用语作为输入用语而输入至系统。电子文件的例子可为word(注册商标)等的原稿,也可为漫画的原作的电子数据,也可为脚本及台本,也可为powerpoint(注册商标)等的演示资料。此等所含的用语可在电子状态下简单地提取。然后,所述用语分别作为输入用语而被输入至系统。
[0049]
例如,将一新闻报道进行用语转换的情形,也可从新闻的台本提取用语。并且,也可使用和所述新闻相关的标题语自动地检索网站,提取相符合的网站所含的用语作为输入用语。只要如此进行,则变得可在报导一新闻时迅速地准备错误转换用语。
[0050]
并且,例如在医药代表进行一演示的情形,可以下述方式进行:系统接收演示数据,并自动提取所述演示数据所含的用语。再者,在所述演示资料中包含特定的药剂名或疾病名的情形,可以以下方式进行:自动地从存储部读取和所述药剂相关的附件等关于所述药剂的资料,并提取附件等所含的用语。再者,在具有和所述药剂相关的错误转换词典的情形,也可以下述方式进行:自动地读取所述错误转换词典所含的和错误转换用语对应的用语的清单。针对疾病名也是同样。
[0051]
此说明书也提供一种计算机能读取的程序及存储所述程序的信息记录介质(cd-rom等),所述程序是用于使计算机发挥作为上述错误转换词典制作系统的功能。
[0052]
所述程序例如是一种使计算机发挥作为错误转换词典制作系统的功能的程序,所述错误转换词典制作系统具有:
[0053]
用语输入单元,其输入用语;
[0054]
语音数据转换单元,其将被输入至用语输入单元的用语亦即输入用语转换成语音
数据,获得输入用语语音数据;
[0055]
语音数据解析单元,其接收从语音数据转换单元输出的输入用语语音数据,进行语音解析,将输入用语语音数据转换成用语,获得语音解析用语;以及
[0056]
错误转换用语识别单元,其从用语输入单元或所述语音数据转换单元接收输入用语,从语音数据解析单元接收语音解析用语,在输入用语和语音解析用语不一致的情形,将语音解析用语设为所述输入用语的错误转换用语;
[0057]
并且,从错误转换用语识别单元接收输入用语和所述错误转换用语,使输入用语和所述错误转换用语相关联,并存储在错误转换词典。
[0058]
所述用语输入单元可包含:
[0059]
电子文件接收单元,其接收电子文件;以及
[0060]
用语提取单元,其提取电子文件接收单元接收到的电子文件所含的用语。
[0061]
接下来,针对语音识别系统51进行说明。
[0062]
图5是用于说明语音识别系统的概念图。如图5所示,此语音识别系统51包含:错误转换词典11、语音输入部53、语音解析部55、错误转换用语判断部57以及修正语候补提取部59。此系统可包含先前说明的错误转换词典制作系统。并且,也可为包含通过上述错误转换词典制作系统而被更新的错误转换词典11的系统。
[0063]
语音识别系统51是将语音信息转换成文字信息的系统。将语音信息转换成文字信息的语音识别装置是众所周知的。因此,语音识别系统51只要适当地采用众所周知的语音识别装置的要素即可。
[0064]
语音输入部53是输入语音的要素。语音输入部53的例子是麦克风。麦克风可将接收到的频率信息(振动信息)转换成计算机可处理的电信号。
[0065]
语音解析部55是用于从语音输入部53接收语音信息(电信号)并进行解析的要素。此解析算法是众所周知的。例如,语音解析部55是解析基于被输入至语音输入部的语音的电信号所含的频率。然后,语音解析部55获得解析语。
[0066]
错误转换用语判断部57是判断解析语是否和被存储在错误转换词典11的任一错误转换用语一致的要素。如同上述,在求取解析语的情形,计算机会读取被存储在错误转换词典11的错误转换用语。然后,计算机会判断已读取的错误转换用语和解析语是否一致。
[0067]
修正语候补提取部59在解析语和已读取的一错误转换用语一致的情形中,会从错误转换词典11读取和所述错误转换用语对应的输入用语作为正确用语的候补。如此进行而能求取正确用语的候补。
[0068]
例如,在进行附字幕的新闻报导的情形,期望在报导的同时播送字幕。在此种情形,只要求取正确用语的候补作为报导用的用语并输出(作为新闻的字幕而播送)即可。
[0069]
此说明书也提供一种计算机能读取的程序、及存储所述程序的信息记录介质(cd-rom等),所述程序是用于使计算机发挥作为上述语音识别系统的功能。
[0070]
所述程序是使计算机发挥作为系统的功能的程序,所述系统具有:
[0071]
语音输入单元,其输入语音;
[0072]
语音解析单元,其将被输入至语音输入单元的语音进行语音解析,获得解析语;
[0073]
错误转换用语判断单元,其判断解析语是否和被存储在错误转换词典的任一错误转换用语一致;以及
[0074]
修正语候补提取单元,其在错误转换用语判断单元判断解析语和被存储在错误转换词典的任一错误转换用语一致的情形中,求取和一致的错误转换用语对应的输入用语作为正确用语的候补。
[0075]
错误转换词典例如是通过上述说明的程序而被更新。
[0076]
产业上的可利用性
[0077]
此发明因能使用在语音识别系统,故能被利用在信息产业。
[0078]
附图标记说明
[0079]1ꢀꢀ
错误转换词典制作系统
[0080]3ꢀꢀ
用语输入部
[0081]5ꢀꢀ
语音数据转换部
[0082]7ꢀꢀ
语音数据解析部
[0083]9ꢀꢀ
错误转换用语识别部
[0084]
11 错误转换词典
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除
热门咨询
tips