Advisor: Prof. Chin-Shyurng Fahn

TEL: 02-2733-3141 # 7425

Location: RB307-3

Designer: Yu-Ta Lin

基於支向機的方法在實際場景影像定位文字

 

  影像中的文字常受到人為和環境的影響,其大小、樣式、顏色、角度和排列方式都會隨之變化,使得自動化的文字定位技術充滿挑戰性。在本論文中,我們提出一個植基於支向機的文字定位技術,它的主要架構分成三個部份:候選文字區塊的產生、特徵抽取,以及驗證。首先,候選文字區塊的產生部份,係使用Canny邊緣檢測技術得到二值化的細邊緣影像,復以Suzuki等人提出的方法標記相連成份區塊,經初步條件濾除後得到基本的候選文字區塊。至於區塊特徵抽取部份,則先利用二維小波分解技術將相連成份區塊分為四個頻帶,再提取每個頻帶的直方圖與共生矩陣的特徵,接著以主成份分析、線性鑑別分析和獨立成份分析三種方法對四個頻帶所取出的特徵經轉換矩陣降低維度,並比較三者對文字定位系統的影響。而文字區塊驗證部份係採用1-Norm Soft Margin的支向機,其中先利用核心函數計算既有訓練樣本在特徵空間中的內積關係,然後用循序最小優化法得到最佳的決策函數來驗證候選區塊是否含有文字資訊,最後把驗證後的文字區塊融合成文字行。經實驗證明,區塊的特徵經過降低維度處理後,不但能大大提升系統的執行效能,而且定位的效果仍然維持在高正確率。