原名「台灣學術線上」
包含TAO期刊庫 + TAO書籍庫 + 論文 + 史料文獻
首頁 | 關於TAO | 瀏覽 | 進階查詢 | 參考工具 | 會員服務 | 已購專書 | RSS服務 | 電子報 | FAQ  
查詢範圍:
   
查詢模式:
熱門查詢詞:
dvd農業經營管理年刊教育實踐與研究臺灣都市與區域發展之
   
   
   
     
   
 
項次 書目
1
題名:中文文件影像中之特殊字體偵測     (22點)
Special Typeface Identification in Chinese Document Images
著者:曾逸鴻(Yi-Hong Tseng) ;林裕淵(Yu-Yuan Lin)
出版地區:台灣
出版城市:彰化縣
學科:自科綜合 ; 應科綜合
關鍵字:特殊字體偵測 ; 投影輪廓 ; 文字辨識 ; 黑點群長 ; special typefaces ; projection profiles ; character recognition ; black run lengths
刊名:科學與工程技術期刊
卷期:3卷4期(2007.12)
頁碼:29-39
語言:繁體中文
摘要: 中文摘要PDF ; 英文摘要PDF

光學文字辨識是近二十年來被廣泛研究的題目,利用文字辨識技術將文件數位化,既可減少紙張的存放空間,又可以自動將文件分類以方便日後檢索。目前市面上文字辨識相關產品,都聲稱文字辨識率可高達90%以上。然而,這些數據大都是根據正常字體之印刷文字影像的辨識結果統計。對於印刷文件中常見的特殊字體(如粗體字、中空字、底線字與斜體字),辨識效果會與正常字體有明顯的差異。若同時使用多字體的辨識核心來做辨識,對於數量龐大的中文字集,會導致辨識速度下降。本研究提出方法來自動偵測出印刷文字區塊影像中,各內容文字所屬的特殊字體。 首先,利用文字區塊影像的水平與投影方向投影輪廓分析,可先將各文字行與可能的文字元件擷取出,再統計各元件大小、元件間距離、元件內筆劃寬度與元件黑點群長度等特性,以判斷各字元所屬的字體。後續進行文字辨識時,可使用該特殊字體字元所訓練出的辨識核心去比對,便可在盡量維持辨識速度下,提升含特殊字體文件的整體辨識效果。
Optical character recognition (OCR) has been a common research topic during the past twenty years. Digitizing paper documents by applying OCR techniques can decrease their storage space. These digitized images can also be classified and retrieved conveniently. Commercial OCR products purport to provide a satisfactory character recognition engine with accuracy above 90%. This accuracy is generally measured by recognizing printed characters having normal typefaces. However, for several special typefaces such as italic, underline, hollow, and boldface, poor recognition accuracy is obtained by commercial systems. Since the number of Chinese characters is large, the recognition speed is slow when a multi-engine OCR system is used. This study proposes an approach for identifying the special typeface of each character in a text-block image. In the proposed approach, text lines and character components are extracted by analyzing the projection profiles of the images. Then, several characteristics such as component size, gaps between pairs of components, stroke width, and black run length, are computed and analyzed to identify the special typeface of each character. Finally, a specific recognition engine is applied to recognize an unknown character image according to the corresponding identified typeface.


    

本卷期目次
科學與工程技術期刊 3卷4期 (2007.12)
“陳有蘭溪十八重溪匯流處下游”疏濬工程粒狀污染物排放係數推估/ 李清華施俊安方信雄林明德林隆儒秦丘翰
在MgO緩衝層以射頻濺鍍法製備La3Ga5SiO14薄膜與特性之研究/ 胡毅王逢偉林和龍
以HAVi多媒體網路整合於OSGi家用閘道器之設計與實作/ 彭興國張晉源薛念林
類神經網路於MIMO半導體製程控制的應用/ 呂明山張仁達
Optimal Load Tracking Design for a Catalytic-Partial-Oxidation-Based Fuel Processing System/ Huan-Liang Tsai
發光二極體接面溫度的自動量測系統/ 廖豐標杜振德林睿蜻林雲翔劉秉承黃文祥
射出模模座設計管理的原型系統建構/ 劉大銘蕭立奇徐聿茜陳俊宇
整合式多期規劃供應鏈模式/ 藍俊雄邱誌偉胡鴻慶
中文文件影像中之特殊字體偵測/ 曾逸鴻林裕淵
超音波定位系統之設計策略/ 盧樹台
射出模模座設計管理的原型系統建構/ 劉大銘蕭立奇徐聿茜陳俊宇
Optimal Load Tracking Design for a Catalytic-Partial-Oxidation-Based Fuel Processing System/ Huan-Liang Tsai
中文文件影像中之特殊字體偵測/ 曾逸鴻林裕淵
超音波定位系統之設計策略/ 盧樹台
「陳有蘭溪十八重溪匯流處下游」疏濬工程粒狀污染物排放係數推估/ 李清華施俊安方信雄林明德林隆儒秦丘翰
類神經網路於MIMO半導體製程控制的應用/ 呂明山張仁達
在MgO緩衝層以射頻濺鍍法製備La3Ga5SiO14薄膜與特性之研究/ 胡毅王逢偉林和龍
以HAVi多媒體網路整合於OSGi家用閘道器之設計與實作/ 彭興國張晉源薛念林
整合式多期規劃供應鏈模式/ 藍俊雄邱誌偉胡鴻慶
發光二極體接面溫度的自動量測系統/ 廖豐標杜振德林睿蜻林雲翔劉秉承黃文祥
 
   
 
   

與TAO合作 | 隱私與版權聲明 | 聯絡方式 | 下載Adobe Reader
地址:台北市中正區(100)北平東路30-12號3樓
電話:(02)2393-6968 傳真:(02)2393-6877
Email: service@wordpedia.com
Wordpedia Family: 學校、企業版入口 | 遠流影音館
Copyright©2011 Wordpedia Co., Ltd. All Rights Reserved.