- 2019年7月10日-12日,,上海攬境展覽主辦的2019年藍(lán)鯨國(guó)際標(biāo)簽展、包裝展...[詳情]
2019年藍(lán)鯨標(biāo)簽展_藍(lán)鯨軟包裝展_藍(lán)鯨
- 今日排行
- 本周排行
- 本月排行
- 膠印油墨
- 膠印材料
- 絲印材料
印刷體文字的識(shí)別研究方法分類介紹
2010-12-06 15:17 來(lái)源:中國(guó)中部印刷網(wǎng) 責(zé)編:江佳
- 摘要:
- 識(shí)別方法是整個(gè)系統(tǒng)的核心,。用于漢字識(shí)別的模式識(shí)別方法可以大致分為結(jié)構(gòu)模式識(shí)別、統(tǒng)計(jì)模式識(shí)別及兩者的結(jié)合,。下面分別進(jìn)行介紹,。
(9)特征點(diǎn)特征,。早在1957年,Solatron Electronics Group公司發(fā)布了第一個(gè)利用窺視孔(peephole)方法的OCR系統(tǒng),。其主要思想是利用字符點(diǎn)陣中一些有代表性的黑點(diǎn)(筆劃),,白點(diǎn)(背景)作為特征來(lái)區(qū)分不同的字符。后有人又將這種方法運(yùn)用到漢字識(shí)別中,,對(duì)其中的黑點(diǎn)又增加了屬性的描述,,如端點(diǎn)、折點(diǎn),、交叉點(diǎn)等,。也獲得了比較好的效果。其特點(diǎn)是對(duì)于內(nèi)部筆劃粘連的字符的識(shí)別的適應(yīng)性較強(qiáng),,直觀性好,,但是不易表示為矢量形式,不適合作為粗分類的特征,,匹配難度大,。
當(dāng)然還有許多種不同的統(tǒng)計(jì)特征,諸如圖描述法,、包含配選法,、脫殼透視法、差筆劃法等,,這里就不一一介紹了,。
統(tǒng)計(jì)識(shí)別與結(jié)構(gòu)識(shí)別的結(jié)合
結(jié)構(gòu)模式識(shí)別與統(tǒng)計(jì)模式識(shí)別各有優(yōu)缺點(diǎn),,隨著我們對(duì)于兩種方法認(rèn)識(shí)的深入,這兩種方法正在逐漸融合,。網(wǎng)格化特征就是這種結(jié)合的產(chǎn)物,。字符圖象被均勻地或非均勻地劃分為若干區(qū)域,稱之為“網(wǎng)格”,。在每一個(gè)網(wǎng)格內(nèi)尋找各種特征,,如筆劃點(diǎn)與背景點(diǎn)的比例,交叉點(diǎn),、筆劃端點(diǎn)的個(gè)數(shù),,細(xì)化后的筆劃的長(zhǎng)度、網(wǎng)格部分的筆劃密度等等,。特征的統(tǒng)計(jì)以網(wǎng)格為單位,,即使個(gè)別點(diǎn)的統(tǒng)計(jì)有誤差也不會(huì)造成大的影響,增強(qiáng)了特征的抗干擾性,。這種方法正得到日益廣泛的應(yīng)用,。
人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,以下稱ANN)是一種模擬人腦神經(jīng)元細(xì)胞的網(wǎng)絡(luò)結(jié)構(gòu),,它是由大量簡(jiǎn)單的基本元件-神經(jīng)元相互連接成的自適應(yīng)非線性動(dòng)態(tài)系統(tǒng),。雖然目前對(duì)于人腦神經(jīng)元的研究還很不完善,我們無(wú)法確定ANN的工作方式是否與人腦神經(jīng)元的運(yùn)作方式相同,,但是ANN正在吸引著越來(lái)越多的注意力,。
ANN中的各個(gè)神經(jīng)元的結(jié)構(gòu)與功能較為簡(jiǎn)單,但大量的簡(jiǎn)單神經(jīng)元的組合卻可以非常復(fù)雜,,我們從而可以通過(guò)調(diào)整神經(jīng)元間的連接系數(shù)完成分類,、識(shí)別等復(fù)雜的功能。ANN還具有一定的自適應(yīng)的學(xué)習(xí)與組織能力,,組成網(wǎng)絡(luò)的各個(gè)“細(xì)胞”可以并行工作,,并可以通過(guò)調(diào)整“細(xì)胞”間的連接系數(shù)完成分類、識(shí)別等復(fù)雜的功能,。這是馮·諾依曼的計(jì)算機(jī)無(wú)法做到的,。
ANN可以作為單純的分類器(不包含特征提取,選擇),也可以用作功能完善的分類器,。在英文字母與數(shù)字的識(shí)別等類別數(shù)目較少的分類問(wèn)題中,,常常將字符的圖象點(diǎn)陣直接作為神經(jīng)網(wǎng)絡(luò)的輸入。不同于傳統(tǒng)的模式識(shí)別方法,,在這種情況下,神經(jīng)網(wǎng)絡(luò)所“提取”的特征并無(wú)明顯的物理含義,,而是儲(chǔ)存在神經(jīng)物理中各個(gè)神經(jīng)元的連接之中,,省去了由人來(lái)決定特征提取的方法與實(shí)現(xiàn)過(guò)程,。從這個(gè)意義上來(lái)說(shuō),ANN提供了一種“字符自動(dòng)識(shí)別”的可能性,。此外,,ANN分類器是一種非線性的分類器,它可以提供我們很難想象到的復(fù)雜的類間分界面,,這也為復(fù)雜分類問(wèn)題的解決提供了一種可能的解決方式,。
目前,在對(duì)于象漢字識(shí)別這樣超多類的分類問(wèn)題,,ANN的規(guī)模會(huì)很大,,結(jié)構(gòu)也很復(fù)雜,現(xiàn)在還遠(yuǎn)未達(dá)到實(shí)用的程度,。其中的原因很多,,主要的原因還在于我們對(duì)人腦的工作方式以及ANN本身的許多問(wèn)題還沒(méi)有找到完美的答案。
【點(diǎn)擊查看更多精彩內(nèi)容】
相關(guān)新聞:
塑膠記憶印刷體預(yù)計(jì)2010年可望進(jìn)入市場(chǎng)
紅樓夢(mèng)印刷體祖本212.8萬(wàn)元人民幣成交(圖)
全國(guó)首部印刷體“工尺譜”出版發(fā)行
- 關(guān)于我們|聯(lián)系方式|誠(chéng)聘英才|幫助中心|意見(jiàn)反饋|版權(quán)聲明|媒體秀|渠道代理
- 滬ICP備18018458號(hào)-3法律支持:上海市富蘭德林律師事務(wù)所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098