一種中文人名播報(bào)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)通訊領(lǐng)域,特別涉及一種中文人名播報(bào)方法及相關(guān)的裝置。
【背景技術(shù)】
[0002]詞法分析:是計(jì)算機(jī)科學(xué)中將字符序列轉(zhuǎn)換為單詞序列的過程。進(jìn)行詞法分析的程序或者函數(shù)叫做詞法分析器,也叫掃描器。供語法分析器調(diào)用。由于漢語不像英文單詞是以空格分開的,因此詞法分析一般都是結(jié)合語義分析技術(shù)相結(jié)合使用。
[0003]句法分析:所謂句法分析(Parsing)就是指對(duì)句子中的詞語語法功能進(jìn)行分析,比如“我來晚了”,這里“我”是主語,“來”是謂語,“晚了”是補(bǔ)語。句法分析現(xiàn)在主要的應(yīng)用在于中文信息處理,如機(jī)器翻譯等。它是語塊分析(chunking)思想的一個(gè)直接實(shí)現(xiàn),語塊分析通過識(shí)別出高層次的結(jié)構(gòu)單元來簡化句子的描述。從不同的句子中找到語塊規(guī)律的一條途徑是學(xué)習(xí)一種語法,這種語法能夠解釋所找到的分塊結(jié)構(gòu)。這屬于語法歸納的范疇。
[0004]語音合成(Text To Speech, TTS):語音合成就是一個(gè)將文本轉(zhuǎn)化為語音輸出的過程,這個(gè)過程的工作主要是將輸入的文本按字或詞分解為音素,并且對(duì)文本中的數(shù)字、貨幣單位、單詞變形以及標(biāo)點(diǎn)等要特殊處理的符號(hào)進(jìn)行分析,以及將音素生成數(shù)字音頻然后用揚(yáng)聲器播放出來或者存為聲音文件以后用多媒體軟件播放。
[0005]目前漢語人名中普遍存在多音字,有些多音字的發(fā)音又是姓氏中所獨(dú)有的,例如,曾(zeng)沈(shen)翟(zhai)單(shan),在一些常用詞匯中的讀音為曾(ceng)沈(chen)翟(di)單(dan)。另外一些歷史人名中有些特殊的發(fā)音,例如劉禪(shan),關(guān)云長(chang),賈平凹(wa),在一些常用詞匯中的讀音為禪(chan)長(zhang)凹(ao)。對(duì)于姓名的多音字,TTS播報(bào)引擎基本上按照常用詞匯的發(fā)音進(jìn)行播報(bào),經(jīng)常播出讓人啼笑皆非的效果,例如人名:曾(ceng) —庭。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供一種中文人名播報(bào)方法及裝置,通過對(duì)待播報(bào)文本字符串中的人名字符串進(jìn)行多音字讀音標(biāo)識(shí),并按照所標(biāo)識(shí)的多音字讀音播報(bào)人名字符串,解決中文人名中多音字播報(bào)不準(zhǔn)確的問題。
[0007]根據(jù)本發(fā)明的一個(gè)方面,提供了一種中文人名播報(bào)方法,包括:
[0008]終端側(cè)將含有人名字符串的待播報(bào)文本字符串發(fā)送至網(wǎng)絡(luò)側(cè);
[0009]接收來自網(wǎng)絡(luò)側(cè)的已對(duì)所述人名字符串完成讀音標(biāo)識(shí)的待播報(bào)文本字符串;
[0010]按照所述讀音字符串播報(bào)所述人名字符串。
[0011]根據(jù)本發(fā)明的另一個(gè)方面,提供了一種中文人名播報(bào)方法,包括:
[0012]在預(yù)置的讀音數(shù)據(jù)庫中,搜索待播報(bào)文本字符串中的人名字符串;
[0013]通過所述讀音數(shù)據(jù)庫中的讀音字符串對(duì)所述人名字符串進(jìn)行讀音標(biāo)識(shí);
[0014]將已進(jìn)行讀音標(biāo)識(shí)的待播報(bào)文本字符串發(fā)送至終端側(cè),以供終端側(cè)按照所述讀音字符串播報(bào)所述人名字符串。
[0015]優(yōu)選地,在預(yù)置的讀音數(shù)據(jù)庫中,搜索待播報(bào)文本字符串中的人名字符串的步驟之前,還包括:
[0016]網(wǎng)絡(luò)側(cè)接收來自終端側(cè)的待播報(bào)文本字符串;
[0017]對(duì)所述待播報(bào)文本字符串進(jìn)行語義分析,得到所述待播報(bào)文本字符串中的人名字符串。
[0018]優(yōu)選地,所述讀音數(shù)據(jù)庫包括歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫,網(wǎng)絡(luò)側(cè)在所述歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫中,搜索待播報(bào)文本字符串中的人名字符串。
[0019]優(yōu)選地,所述的通過所述讀音數(shù)據(jù)庫中的讀音字符串對(duì)所述人名字符串進(jìn)行讀音標(biāo)識(shí)的步驟包括:
[0020]網(wǎng)絡(luò)側(cè)在所述歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫中提取對(duì)應(yīng)于所述人名字符串的讀音字符串;
[0021]將所述讀音字符串插入到所述待播報(bào)文本字符串的指定位置,標(biāo)識(shí)所述人名的讀曰。
[0022]根據(jù)本發(fā)明的另一個(gè)方面,提供了一種中文人名播報(bào)裝置,包括:
[0023]終端側(cè)收發(fā)模塊,用于將含有人名字符串的待播報(bào)文本字符串發(fā)送至網(wǎng)絡(luò)側(cè),并接收來自網(wǎng)絡(luò)側(cè)的已對(duì)所述人名字符串完成讀音標(biāo)識(shí)的待播報(bào)文本字符串;
[0024]終端側(cè)播報(bào)模塊,用于按照所述讀音字符串播報(bào)所述人名字符串。
[0025]根據(jù)本發(fā)明的另一方面,提供了一種中文人名播報(bào)裝置,包括:
[0026]網(wǎng)絡(luò)側(cè)搜索模塊,用于在預(yù)置的讀音數(shù)據(jù)庫中,搜索待播報(bào)文本字符串中的人名字符串;
[0027]網(wǎng)絡(luò)側(cè)標(biāo)識(shí)模塊,用于通過所述讀音數(shù)據(jù)庫中的讀音字符串對(duì)所述人名字符串進(jìn)行讀音標(biāo)識(shí);
[0028]網(wǎng)絡(luò)側(cè)發(fā)送模塊,用于將已進(jìn)行讀音標(biāo)識(shí)的待播報(bào)文本字符串發(fā)送至終端側(cè),以供終端側(cè)按照所述讀音字符串播報(bào)所述人名字符串。
[0029]優(yōu)選地,還包括:
[0030]網(wǎng)絡(luò)側(cè)接收模塊,用于在所述網(wǎng)絡(luò)側(cè)搜索模塊搜索待播報(bào)文本字符串中的人名字符串之前,接收來自終端側(cè)的待播報(bào)文本字符串;
[0031]網(wǎng)絡(luò)側(cè)分析模塊,用于對(duì)所述待播報(bào)文本字符串進(jìn)行語義分析,得到所述待播報(bào)文本字符串中的人名字符串。
[0032]優(yōu)選地,所述讀音數(shù)據(jù)庫包括歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫,所述網(wǎng)絡(luò)側(cè)搜索模塊在所述歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫中,搜索待播報(bào)文本字符串中的人名字符串。
[0033]優(yōu)選地,所述網(wǎng)絡(luò)側(cè)標(biāo)識(shí)模塊在所述歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫中提取對(duì)應(yīng)于所述人名字符串的讀音字符串,并將所提取的讀音字符串插入到所述待播報(bào)文本字符串的指定位置,標(biāo)識(shí)所述人名的讀音。
[0034]與現(xiàn)有技術(shù)相比較,本發(fā)明的有益效果在于:
[0035]本發(fā)明通過文本中的語義解析出人名并標(biāo)識(shí),從而達(dá)到在終端側(cè)TTS播報(bào)的時(shí)候可以根據(jù)標(biāo)識(shí)將人名中的多音字按照正確發(fā)音播報(bào)的目的。
【附圖說明】
[0036]圖1是本發(fā)明提供的終端側(cè)的中文人名播報(bào)方法原理框圖;
[0037]圖2是本發(fā)明提供的終端側(cè)的中文人名播報(bào)裝置框圖;
[0038]圖3是本發(fā)明提供的網(wǎng)絡(luò)側(cè)的中文人名播報(bào)方法原理框圖;
[0039]圖4是本發(fā)明提供的網(wǎng)絡(luò)側(cè)的中文人名播報(bào)裝置框圖;
[0040]圖5 (a)是本發(fā)明實(shí)施例提供的歷史人名讀音知識(shí)庫圖表;
[0041]圖5(b)是本發(fā)明實(shí)施例提供的姓氏讀音知識(shí)庫圖表;
[0042]圖6是本發(fā)明實(shí)施例提供的“曾一庭看《三國演義》這部小說,他非常喜歡關(guān)云長這個(gè)角色?!苯?jīng)過句法分析和語法分析后所得出的兩顆語法樹;
[0043]圖7是本發(fā)明實(shí)施例提供的中文人名播報(bào)流程圖。
【具體實(shí)施方式】
[0044]以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)說明,應(yīng)當(dāng)理解,以下所說明的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0045]圖1是本發(fā)明提供的終端側(cè)的中文人名播報(bào)方法原理框圖,如圖1所示,步驟包括:
[0046]步驟SlOl:終端側(cè)將含有人名字符串的待播報(bào)文本字符串發(fā)送至網(wǎng)絡(luò)側(cè),
[0047]步驟S102:接收來自網(wǎng)絡(luò)側(cè)的已對(duì)所述人名字符串完成讀音標(biāo)識(shí)的待播報(bào)文本字符串人名字符串。
[0048]步驟S103:按照所述讀音字符串播報(bào)所述人名字符串。
[0049]為實(shí)現(xiàn)對(duì)中文人名的正確播報(bào),終端側(cè)利用網(wǎng)絡(luò)側(cè)對(duì)人名字符串進(jìn)行處理,具體地說,若所述人名中存在多音字,則網(wǎng)絡(luò)側(cè)對(duì)該多音字進(jìn)行讀音標(biāo)識(shí),從而使得終端側(cè)的語音合成引擎能夠按照所標(biāo)識(shí)的讀音正確播報(bào)所述人名中的多音字。
[0050]圖2是本發(fā)明提供的終端側(cè)的中文人名播報(bào)裝置框圖,如圖2所示,包括終端側(cè)收發(fā)模塊21和終端側(cè)播報(bào)模塊22。其中:
[0051]所述終端側(cè)收發(fā)模塊21將含有人名字符串的待播報(bào)文本字符串發(fā)送至網(wǎng)絡(luò)側(cè),并接收來自網(wǎng)絡(luò)側(cè)的已對(duì)所述人名字符串完成讀音標(biāo)識(shí)的待播報(bào)文本字符串;所述終端側(cè)播報(bào)模塊22按照所述讀音字符串播報(bào)所述人名字符串。
[0052]圖3是本發(fā)明提供的網(wǎng)絡(luò)側(cè)的中文人名播報(bào)方法原理框圖,如圖3所示,步驟包括:
[0053]步驟S301:網(wǎng)絡(luò)側(cè)收到終端側(cè)的待播報(bào)文本字符串后,對(duì)所述待播報(bào)文本字符串進(jìn)行語義分析,得到所述待播報(bào)文本字符串中的人名字符串。在預(yù)置的讀音數(shù)據(jù)庫中,搜索所述人名字符串。若搜索到相應(yīng)的人名字符串,則說明所述人名中具有多音字。
[0054]所述步驟S301中的讀音數(shù)據(jù)庫包括歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫,網(wǎng)絡(luò)側(cè)在所述歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫中,搜索待播報(bào)文本字符串中的人名字符串。
[0055]步驟S302:通過所述讀音數(shù)據(jù)庫中的讀音字符串對(duì)所述人名字符串進(jìn)行讀音標(biāo)識(shí)。
[0056]具體地說,網(wǎng)絡(luò)側(cè)在所述歷史人名發(fā)音知識(shí)庫和/或姓氏發(fā)音知識(shí)庫中提取對(duì)應(yīng)于所述人名字符串的讀音字符串,并將所述讀音字符串插入到所述待播報(bào)文本字符串的指定位置,標(biāo)識(shí)所述人名的讀音。
[0057]步驟S303:將已進(jìn)行讀音標(biāo)識(shí)的待播報(bào)文本字符串發(fā)送至終端側(cè),以供終端側(cè)按照所述讀音字符串播報(bào)所述人名字符串。
[0058]圖4