Advisor: Prof. Chin-Shyurng Fahn

TEL: 02-2733-3141 # 7425

Location: RB307-3

Designer: Yu-Ta Lin

以類神經網路辨認常用中文字集之研究

 

  光學文字辨認(Optical Character Recognition),簡稱OCR,對中文資料的電腦化扮演了重要的角色,它可以快速而且正確的輸入中文資料,在本文中,我們應用了類神經式圖型識別(Pattern Recognition)的方法作中文光學文字辨認系統的研究。由於常用中文字有5401個之多,我們設計了一個階層式的類神經網路加以辨認;在大分類的階段,係使用非監督性學習的類神經網路,於此我們提出一個短小精幹的網路,比起一般的決策樹(Decision Tree)演算法更具有優異的分類效能,而在細分類的階段,則採用監督性學習的類神經網路,其中我們加入了兩個修正的訓練條件,使得網路於訓練過程中具有100%的收斂結果,同時於辨認過程裡達到100%的辨認成效。在文字特徵值抽取方面,我們僅以投影值法則來執行,再配合上述性能優越的類神經網路,可使本系統達成快速辨認中文字之需求;在IBM 486-33 AT 的機器上,其辨認速度是每分鐘約1800字,即5401個常用中文字的辨認時間僅需約3分鐘,此時本系統所辨認的字體係選定楷書單字體。