Advisor: Prof. Chin-Shyurng Fahn

TEL: 02-2733-3141 # 7425

Location: RB307-3

Designer: Yu-Ta Lin

以相連區塊為主的方法在自然場景影像中的文字定位

 

  隨著電腦科技的日益進步,使得以電腦輔助的自動化處理也越來越廣泛,尤其是結合日常生活方面的應用,其中光學文字辨識系統就是一個相當典型的例子。在光學文字辨識系統中,文字定位的前置處理扮演著相當重要的角色,特別是處於複雜背景或自然場景的影像。在本篇論文中,我們利用相連區塊的資訊在自然場景影像中進行文字區塊的定位。首先,我們將輸入的自然場景影像由RGB彩色空間轉為YIQ彩色空間,隨後使用一個有效的邊緣偵測運算子對Y分量所形成的影像做邊緣偵測以及二值化處理。接著,我們分別對二值化的兩個二元值做連接處理而得到影像中的相連區塊,再根據相連區塊在影像中的色彩、位置以及大小資訊分類出可能的文字區塊。最後,根據這些區塊在幾何上的特徵來辨別出真正的文字區塊。實驗的結果顯示我們的方法能夠正確而且快速的定位出自然場景影像中的文字區塊。