Advisor: Prof. Chin-Shyurng Fahn

TEL: 02-2733-3141 # 7425

Location: RB307-3

Designer: Yu-Ta Lin

以類神經網路為基礎的常用中文多字型字集之辨認系統

 

  本文提出一個階層式的類神經網路系統用以辨認多種印刷字型之常用中 文5401字;在大分類的階段,係應用非監督性學習的自適應共振理論( Adaptive Resonance Theory;ART)類神經網路,它比起一般所使用的決策樹判定法更具有優異的分類效能,且可視分類的穩定情況而自行調整分類的個數並達到穩定分類的效果,經我們修正之後的ART網路學習演算法更能在大量輸入資料下快速地穩定收斂,這是傳統的類神經網路難以達到的目標;在細分類的階段,則採用監督性學習的簡化型模糊ART映射( Simplified Fuzzy ARTMAP;SFAM)類神經網路,由於此網路並非利用能量函數遞減的方式來達到收斂的效果,因此可以避免一般監督性學習網路所遭遇的穩定性、區域能量極小值及訓練時間過長等問題,經我們改進後的SFAM網路,稱之為簡化型ART映射(Simplified ARTMAP;SAM)類神經網路,它可使得整個辨認系統節省更多的記憶體空間,同時於訓練過程中能快速地達到100%的收斂效果,並且對訓練樣本的辨認率亦達到100%的成效。在文字特徵抽取方面,我們亦利用類神經網路的方法作細線化處理,再以位於四個方向的筆畫之比重方式抽取特徵值,促使掃描進來的失真字形資料也能保有主要的特徵值,因而使本系統能達到極高的辨認效果;目前本系統所辨認的中文印刷字型有:楷書、明體、隸書、黑體、圓體及仿宋體六種字型。