基于matlab的文字識(shí)別算法 - 全文

前言

從圖像中提取文字屬于信息智能化處理的前沿課題，是當(dāng)前人工智能與模式識(shí)別領(lǐng)域中的研究熱點(diǎn)。由于文字具有高級(jí)語義特征，對(duì)圖片內(nèi)容的理解、索引、檢索具有重要作用，因此，研究圖片文字提取具有重要的實(shí)際意義。又由于靜態(tài)圖像文字提取是動(dòng)態(tài)圖像文字提取的基礎(chǔ)，故著重介紹了靜態(tài)圖像文字提取技術(shù)。

隨著計(jì)算機(jī)科學(xué)的飛速發(fā)展，以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介，在圖像中，文字信息（如新聞標(biāo)題等字幕）包含了豐富的高層語義信息，提取出這些文字，對(duì)于圖像高層語義的理解、索引和檢索非常有幫助。

圖像文字提取又分為動(dòng)態(tài)圖像文字提取和靜態(tài)圖像文字提取兩種，其中，靜態(tài)圖像文字提取是動(dòng)態(tài)圖像文字提取的基礎(chǔ)，其應(yīng)用范圍更為廣泛，對(duì)它的研究具有基礎(chǔ)性，所以本文主要討論靜態(tài)圖像的文字提取技術(shù)。靜態(tài)圖像中的文字可分成兩大類：一種是圖像中場(chǎng)景本身包含的文字，稱為場(chǎng)景文字；另一種是圖像后期制作中加入的文字，稱為人工文字，如右圖所示。場(chǎng)景文字由于其出現(xiàn)的位置、小、顏色和形態(tài)的隨機(jī)性，一般難于檢測(cè)和提取；而人工文字則字體較規(guī)范、大小有一定的限度且易辨認(rèn)，顏色為單色，相對(duì)與前者更易被檢測(cè)和提取，又因其對(duì)圖像內(nèi)容起到說明總結(jié)的作用，故適合用來做圖像的索引和檢索關(guān)鍵字。對(duì)圖像中場(chǎng)景文字的研究難度大，目前這方面的研究成果與文獻(xiàn)也不是很豐富，本文主要討論圖像中人工文字提取技術(shù)。

靜態(tài)圖像中文字的特點(diǎn)

靜態(tài)圖像中文字（本文特指人工文字，下同）具有以下主要特征：

（1）文字位于前端，且不會(huì)被遮擋；

（2）文字一般是單色的；

（3）文字大小在一幅圖片中固定，并且寬度和高度大體相同，從滿足人眼視覺感受的角度來說，圖像中文字的尺寸既不會(huì)過大也不會(huì)過?。?/p>

（4）文字的分布比較集中；

（5）文字的排列一般為水平方向或垂直方向；

（6）多行文字之間，以及單行內(nèi)各個(gè)字之間存在不同于文字區(qū)域的空隙。在靜態(tài)圖片文字的檢測(cè)與提取過程中，一般情況下都是依據(jù)上述特征進(jìn)行處理的。

數(shù)字圖象處理

靜態(tài)圖像文字提取一般分為以下步驟：文字區(qū)域檢測(cè)與定位、文字分割與文字提取、文字后處理。其流程如圖所示。

基于matlab的文字識(shí)別算法

文字提取、識(shí)別的詳細(xì)步驟

1. 在Matlab中調(diào)用i1=imread（‘字符.jpg’），可得到原始圖像，如圖所示：

2. 調(diào)用i2=rgb2gray（i1），則得到了灰度圖像，如圖所示：

調(diào)用a=size（i1）;b=size（i2）;可得到：a=3，b=2 即三維圖像變成了二維灰度圖像

3. 調(diào)用i3=（i2》=thresh）;其中thresh為門限，

圖基于matlab的文字識(shí)別算法之間這里，?

得到二值圖像，如圖所示：?

基于matlab的文字識(shí)別算法

4. 把二值圖像放大觀察，可看到離散的黑點(diǎn) 對(duì)其采用腐蝕膨脹處理，得到處理后的圖像，如圖所示

? 基于matlab的文字識(shí)別算法

可見，腐蝕膨脹處理后的圖像質(zhì)量有了很大的改觀。橫向、縱向分別的腐蝕膨脹運(yùn)算比橫向、縱向同時(shí)的腐蝕膨脹運(yùn)算好上很多，圖6可看出差別：

? 基于matlab的文字識(shí)別算法

5、對(duì)腐蝕膨脹后的圖像進(jìn)行Y方向上的區(qū)域選定，限定區(qū)域后的圖像如圖所示：掃描方法：中間往兩邊掃

? 基于matlab的文字識(shí)別算法

縱向掃描后的圖像與原圖像的對(duì)照，如圖8所示：

? 基于matlab的文字識(shí)別算法

6、對(duì)腐蝕膨脹后的圖像進(jìn)行X方向上的區(qū)域選定，限定區(qū)域后的圖像如圖9所示：掃描方法：兩邊往中間掃

? 基于matlab的文字識(shí)別算法

縱向掃描后的圖像與原圖像的對(duì)照，如圖所示：

? 基于matlab的文字識(shí)別算法

7. 調(diào)用i8=（iiXY~=1），使背景為黑色（0），字符為白色（1），便于后期處理。背景交換后的圖像如圖11所示：

8. 調(diào)用自定義函數(shù)（字符獲取函數(shù)）i9=getchar（i8），得到圖像如圖所示：

9、調(diào)用自定義的字符獲取函數(shù)對(duì)圖像進(jìn)行字符切割，并把切割的字符裝入一維陣列，切割過程如圖12所示：

10.調(diào)用以下代碼，可將陣列word中的字符顯示出來，如圖13所示：
?
? ? ? ? for j=1:cnum %cnum為統(tǒng)計(jì)的字符個(gè)數(shù)

? ? ? ? subplot（5，8，j），imshow（word{j}），title（int2str（j））; %顯示字符?

? ? ? end

?可以看到，字符寬度不一致
?

11. 調(diào)用以下代碼，將字符規(guī)格化，便于識(shí)別： for j=1:cnum word{j}=imresize（word{j}，［40 40］）; %字符規(guī)格化成40×40的 end 得到規(guī)格化之后的字符如圖14所示：

12. 調(diào)用以下代碼創(chuàng)建字符集：

code=char（‘由于作者水平有限書中難免存在缺點(diǎn)和疏漏之處懇請(qǐng)讀批評(píng)指正，?！?

將創(chuàng)建的字符集保存在一個(gè)文件夾里面，以供匹配時(shí)候調(diào)用，如圖15所示：

13. 字符匹配采用模板匹配算法：將現(xiàn)有字符逐個(gè)與模板字符相減，認(rèn)為相減誤差最小的現(xiàn) 有字符與該模板字符匹配。

? 基于matlab的文字識(shí)別算法

也就是說，字符A與模板字符T1更相似，我們可以認(rèn)為字符集中的字符T2就是字符A。經(jīng)模板匹配，可得字符信息如下：由于讀者書評(píng)有限書中難免存在缺點(diǎn)和紕漏之處，懇請(qǐng)讀者批評(píng)指正。效果如圖16所示：

? 基于matlab的文字識(shí)別算法

14、調(diào)用以下代碼，將字符放入newtxt.txt文本：

new=［‘newtxt’，‘.txt’］; c=fopen（new，‘a(chǎn)+’）; fprintf（c，‘%s ’，Code（1:cnum））; fclose（c）; newtxt.txt文本內(nèi)容如圖17所示：

? 基于matlab的文字識(shí)別算法

總結(jié)

1、算法具有局限性。對(duì)于左右結(jié)構(gòu)的字符（如：川）容易造成誤識(shí)別，“川”字將會(huì)被識(shí)別成三部分。當(dāng)圖片中文字有一定傾斜角度時(shí)，這將造成識(shí)別困難。

2、模板匹配效率低。對(duì)于處理大小為m×m的字符，假設(shè)有n個(gè)模板字符，則識(shí)別一個(gè)字符至

少需要m×m×n×2次運(yùn)算，由于漢字有近萬個(gè)，這將使得運(yùn)算量十分巨大！此次字符識(shí) 別一共花了2.838秒。

3、伸縮范圍比較小。對(duì)于受污染的圖片，轉(zhuǎn)換成二值圖像將使字符與污染源混合在一起。

對(duì)于具體的圖片，需反復(fù)選擇合適的thresh進(jìn)行二值化處理，甚至在處理之前必須進(jìn)行各種濾波。

閱讀全文

上一頁 1 2全文

本文導(dǎo)航

第 1 頁：基于matlab的文字識(shí)別算法
第 2 頁：文字提取、識(shí)別的詳細(xì)步驟（二）

matlab(227703) matlab(227703)

評(píng)論

相關(guān)推薦

OpenVINO場(chǎng)景文字檢測(cè)與文字識(shí)別教程

OpenVINO是英特爾推出的深度學(xué)習(xí)模型部署框架，當(dāng)前最新版本是OpenVINO2023版本。OpenVINO2023自帶各種常見視覺任務(wù)支持的預(yù)訓(xùn)練模型庫Model Zoo，其中支持場(chǎng)景文字檢測(cè)

2023-09-24 15:31:00

209

使用LabVIEW 實(shí)現(xiàn)物體識(shí)別、圖像分割、文字識(shí)別、人臉識(shí)別等深度視覺

LabVIEW可以實(shí)現(xiàn)深度學(xué)習(xí)嘛，今天我們一起來看看使用LabVIEW 實(shí)現(xiàn)物體識(shí)別、圖像分割、文字識(shí)別、人臉識(shí)別等深度視覺

2023-08-11 16:02:21

326

人臉識(shí)別的算法有哪些

人臉識(shí)別的算法有哪些人臉識(shí)別算法現(xiàn)在已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域，如安防、商業(yè)、醫(yī)療等。人臉識(shí)別算法可以分為傳統(tǒng)人臉識(shí)別算法和深度學(xué)習(xí)人臉識(shí)別算法。傳統(tǒng)人臉識(shí)別算法包括以下幾種： 1. 特征提取算法

2023-08-09 18:34:09

743

圖片文字識(shí)別：揭開數(shù)字世界的神秘面紗

隨著數(shù)字化時(shí)代的到來，我們生活中的大部分?jǐn)?shù)據(jù)都以圖片的形式存在。然而，這些圖片中蘊(yùn)含的信息往往比文字更豐富，如何從這些圖片中提取有價(jià)值的信息，是數(shù)字世界中一個(gè)十分重要的問題。這時(shí)，圖片文字識(shí)別技術(shù)

2023-05-11 18:20:04

234

模糊數(shù)學(xué)matlab

模糊數(shù)學(xué)matlab模糊數(shù)學(xué)+變分法+Matlab基礎(chǔ)教程.doc  模式識(shí)別及識(shí)別的直接方法在日常生活中生活中，經(jīng)常需要進(jìn)行各種判斷、預(yù)測(cè)。如圖象文字識(shí)別、故障（疾?。┑脑\斷

2008-06-18 13:36:26

Matlab航跡規(guī)劃仿真—A*算法

Matlab航跡規(guī)劃仿真—A*算法

2022-11-14 10:54:39

749

基于MATLAB的遺傳算法

基于MATLAB的遺傳算法程序分享

2022-09-30 14:28:28

MATLAB優(yōu)化算法匯總03

MATLAB優(yōu)化算法匯總03

2021-10-08 11:01:09

MATLAB優(yōu)化算法匯總02

MATLAB優(yōu)化算法匯總02

2021-10-08 10:59:39

MATLAB優(yōu)化算法匯總01

MATLAB優(yōu)化算法匯總01

2021-10-08 10:57:12

流形學(xué)習(xí)LLE算法的配套Matlab源碼匯總

流形學(xué)習(xí)LLE算法的配套Matlab源碼匯總

2021-08-25 09:30:43

淺析HarmonyOS基于AI的通用文字識(shí)別技術(shù)

在資訊大爆炸的時(shí)代，我們經(jīng)常面臨文件、圖片找不到的情況，HarmonyOS基于AI的通用文字識(shí)別技術(shù)，可以有效幫助我們解決這些難題。基于AI的通用文字識(shí)別，將OCR技術(shù)和AI分詞技術(shù)集成，可以

2021-08-20 10:42:26

2662

非線性整數(shù)規(guī)劃的遺傳算法及MATLAB程序下載

非線性整數(shù)規(guī)劃的遺傳算法及MATLAB程序下載

2021-06-15 10:55:24

使用Matlab算法集合用于數(shù)字信號(hào)處理的應(yīng)用

使用Matlab算法集合用于數(shù)字信號(hào)處理的應(yīng)用說明。

2021-05-27 09:34:34

Matlab的模式識(shí)別和計(jì)算智力使用技巧

Matlab的模式識(shí)別和計(jì)算智力使用技巧說明。

2021-05-27 09:21:30

基于MATLAB的車牌識(shí)別系統(tǒng)

基于MATLAB的車牌識(shí)別系統(tǒng)設(shè)計(jì)說明。

2021-04-16 09:30:42

計(jì)算機(jī)文字識(shí)別技術(shù)研究

計(jì)算機(jī)文字識(shí)別技術(shù)研究。

2021-03-24 14:15:39

OCR文字識(shí)別視覺檢測(cè)系統(tǒng)應(yīng)用程序免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是OCR文字識(shí)別視覺檢測(cè)系統(tǒng)應(yīng)用程序免費(fèi)下載。

2020-05-28 17:31:00

怎樣簡(jiǎn)單識(shí)別圖片文字轉(zhuǎn)換到Word

　　工作中我們經(jīng)常會(huì)處理到各種各樣的圖片文件，有時(shí)候還需要將圖片文件上的信息整理到Word一類的文檔中，這樣編輯起來就很方便，那怎樣簡(jiǎn)單識(shí)別圖片文字轉(zhuǎn)換到Word呢？下面我們就一起來來看下吧

2019-03-27 13:50:47

533

怎樣簡(jiǎn)單識(shí)別提取圖中文字

分享一種簡(jiǎn)單識(shí)別提取圖中文字的方法，問題就可以輕松解決了?！　⒖脊ぞ撸貉附軴CR文字識(shí)別軟件　　操作步驟：　　1：因?yàn)榻酉聛硎褂玫降氖荘C端的工具，所以整個(gè)步驟都是在電腦中進(jìn)行的，將OCR文字識(shí)別軟件

2019-03-26 14:41:15

704

如何使用MATLAB進(jìn)行語音識(shí)別算法研究的論文資料免費(fèi)下載

算法： DTW算法、VQ算法和HMM算法。并且在MATLAB環(huán)境中提取了孤立字語音（十個(gè)數(shù)字0~9的漢語發(fā)音）的LPCC、MFCC特征參數(shù)，用它們配合上述3種語音識(shí)別算法實(shí)現(xiàn)了對(duì)這些孤立字語音的識(shí)別。

2018-12-21 15:03:31

基于sopc嵌入式文字識(shí)別系統(tǒng)設(shè)計(jì)

設(shè)計(jì)了一種基于SoPC的嵌入式文字識(shí)別系統(tǒng)。在FPGA平臺(tái)下，基于SoPC框架搭建軟硬件協(xié)同系統(tǒng)，設(shè)計(jì)硬件電路完成文字圖像的采集和預(yù)處理，嵌入Linux系統(tǒng)，使用其下的識(shí)別引擎完成文字圖像的識(shí)別

2018-12-19 11:43:58

1115

如何在電腦中對(duì)圖片文字進(jìn)行局部識(shí)別

? ? 相信很多人和小編一樣電腦中保存了一些帶有文字的圖片，有時(shí)候因?yàn)樾枰獣?huì)將里面的文字進(jìn)行提取，然而又不想對(duì)著圖片一個(gè)字一個(gè)字的打出來，這個(gè)時(shí)候就需要對(duì)圖片中的文字進(jìn)行局部識(shí)別了，那要怎樣去操作呢

2018-11-13 14:07:12

354

如何提取和檢測(cè)視頻中的文字？數(shù)字視頻中文字的檢測(cè)提取技術(shù)的分析

的檢測(cè)與分割以及視頻文字識(shí)別（Video OCR）等。對(duì)于不同的典型算法，分析了其理論基礎(chǔ)和應(yīng)用特點(diǎn)，并且通過對(duì)比指出其不足和應(yīng)用的局限。最后，本文還展望了該技術(shù)未來發(fā)展的方向。

2018-09-17 17:58:00

Matlab教程之Matlab安裝教程和如何使用Matlab生成DSP C6748可用的算法

Matlab 作為最常見的數(shù)學(xué)軟件，具有便捷的開發(fā)及仿真功能。使用 Matlab 編寫算法，并將算法生成可以用于 DSP C6748 的 C/C++代碼，將大大減輕 DSP 算法開發(fā)難度。

2018-09-14 10:53:00

Matlab關(guān)于Apriori算法設(shè)計(jì)

本文詳細(xì)介紹了Matlab關(guān)于Apriori算法設(shè)計(jì)。Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法Apriori使用一種稱作逐層搜索的迭代方法，“K-1項(xiàng)集”用于搜索“K項(xiàng)集”。

2018-02-02 16:20:15

4662

蟻群算法matlab程序代碼

本文詳細(xì)解析了關(guān)于蟻群算法matlab程序代碼，具體步驟請(qǐng)看下文。

2018-02-02 10:21:21

37152

基于FPGA的OCR文字識(shí)別技術(shù)的深度解析

OCR在通用文字識(shí)別等場(chǎng)景下有廣泛應(yīng)用，基于FPGA異構(gòu)加速的OCR識(shí)別相比CPU/GPU實(shí)現(xiàn)具有延時(shí)小、成本低的優(yōu)勢(shì)。我們?cè)O(shè)計(jì)了多FPGA芯片協(xié)同的異構(gòu)加速架構(gòu)，能快速適配業(yè)務(wù)OCR模型變化，檢測(cè)

2018-01-26 12:19:00

3457

BP算法及其matlab實(shí)現(xiàn)

高級(jí)自動(dòng)控制算法：BP算法及其matlab實(shí)現(xiàn)

2017-12-02 11:45:47

基于matlab的車牌識(shí)別技術(shù)_冀光強(qiáng)

基于matlab的車牌識(shí)別技術(shù)_冀光強(qiáng)

2017-03-18 09:18:05

Android文字識(shí)別

Android文字識(shí)別

2016-12-20 22:40:34

使用Matlab生成可供DSPC6748使用的算法

使用 Matlab 生成可供 DSP C6748 使用的算法

2016-11-14 17:33:11

基于MATLAB的遺傳算法的源程序

基于MATLAB的遺傳算法的源程序，下來看看

2016-07-20 16:51:51

車牌識(shí)別-matlab

完整的車牌識(shí)別MATLAB源代碼，車牌定位，區(qū)域切割，字符切割，字符識(shí)別

2016-06-16 17:57:46

Matlab語言常用算法程序集

Matlab語言常用算法程序集，又需要的下來看看。

2016-05-19 14:31:12

MATLAB車牌識(shí)別過程

MATLAB車牌識(shí)別技術(shù)外加源程序，試過可以實(shí)現(xiàn)該功能。

2016-05-13 15:51:21

MATLAB數(shù)學(xué)建模算法及實(shí)例分析

MATLAB數(shù)學(xué)建模算法及實(shí)例分析，了解MATLAB

2016-01-22 14:06:50

指紋識(shí)別matlab源代碼

指紋識(shí)別matlab源代碼，利用matlab實(shí)現(xiàn)指紋識(shí)別的算法

2016-01-20 15:53:35

算法大全__Matlab在線性代數(shù)中的應(yīng)用

算法大全__Matlab在線性代數(shù)中的應(yīng)用。

2016-01-14 17:56:24

基于MATLAB的指紋識(shí)別系統(tǒng)

基于MATLAB的指紋識(shí)別系統(tǒng) 有需要的下來看看

2015-12-29 17:25:29

PID算法Matlab仿真程序和C程序

PID算法Matlab仿真程序和C程序有需要的看一看，不收積分。

2015-11-20 17:06:14

模糊推理的Mamdani算法及其Matlab實(shí)現(xiàn)

模糊濾波的mamdani算法及其Matlab實(shí)現(xiàn)

2015-11-17 18:23:01