一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用Python和OpenCV進(jìn)行圖像拼接

新機器視覺 ? 來源:新機器視覺 ? 作者:新機器視覺 ? 2022-10-26 15:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圖像拼接是計算機視覺中最成功的應(yīng)用之一。如今,很難找到不包含此功能的手機或圖像處理API。在本文中,我們將討論如何使用Python和OpenCV進(jìn)行圖像拼接。也就是,給定兩張共享某些公共區(qū)域的圖像,目標(biāo)是“縫合”它們并創(chuàng)建一個全景圖像場景。當(dāng)然也可以是給定多張圖像,但是總會轉(zhuǎn)換成兩張共享某些公共區(qū)域圖像拼接的問題,因此本文以最簡單的形式進(jìn)行介紹。

本文主要的知識點包含一下內(nèi)容:

關(guān)鍵點檢測

局部不變描述符(SIFT,SURF等)

特征匹配

使用RANSAC進(jìn)行單應(yīng)性估計

透視變換

我們需要拼接的兩張圖像如下:

特征檢測與提取

給定上述一對圖像,我們希望將它們縫合以創(chuàng)建全景場景。重要的是要注意,兩個圖像都需要有一些公共區(qū)域。當(dāng)然,我們上面給出的兩張圖像時比較理想的,有時候兩個圖像雖然具有公共區(qū)域,但是同樣還可能存在縮放、旋轉(zhuǎn)、來自不同相機等因素的影響。但是無論哪種情況,我們都需要檢測圖像中的特征點。

關(guān)鍵點檢測

最初的并且可能是幼稚的方法是使用諸如Harris Corners之類的算法來提取關(guān)鍵點。然后,我們可以嘗試基于某種相似性度量(例如歐幾里得距離)來匹配相應(yīng)的關(guān)鍵點。眾所周知,角點具有一個不錯的特性:角點不變。這意味著,一旦檢測到角點,即使旋轉(zhuǎn)圖像,該角點仍將存在。

但是,如果我們旋轉(zhuǎn)然后縮放圖像怎么辦?在這種情況下,我們會很困難,因為角點的大小不變。也就是說,如果我們放大圖像,先前檢測到的角可能會變成一條線!

總而言之,我們需要旋轉(zhuǎn)和縮放不變的特征。那就是更強大的方法(如SIFT,SURF和ORB)。

關(guān)鍵點和描述符

諸如SIFT和SURF之類的方法試圖解決角點檢測算法的局限性。通常,角點檢測器算法使用固定大小的內(nèi)核來檢測圖像上的感興趣區(qū)域(角)。不難看出,當(dāng)我們縮放圖像時,該內(nèi)核可能變得太小或太大。為了解決此限制,諸如SIFT之類的方法使用高斯差分(DoD)。想法是將DoD應(yīng)用于同一圖像的不同縮放版本。它還使用相鄰像素信息來查找和完善關(guān)鍵點和相應(yīng)的描述符。

首先,我們需要加載2個圖像,一個查詢圖像和一個訓(xùn)練圖像。最初,我們首先從兩者中提取關(guān)鍵點和描述符。通過使用OpenCV detectAndCompute()函數(shù),我們可以一步完成它。請注意,為了使用detectAndCompute(),我們需要一個關(guān)鍵點檢測器和描述符對象的實例。它可以是ORB,SIFT或SURF等。此外,在將圖像輸入給detectAndCompute()之前,我們將其轉(zhuǎn)換為灰度。

def detectAndDescribe(image, method=None):
    """
    Compute key points and feature descriptors using an specific method
    """


    assert method is not None, "You need to define a feature detection method. Values are: 'sift', 'surf'"


    # detect and extract features from the image
    if method == 'sift':
        descriptor = cv2.xfeatures2d.SIFT_create()
    elif method == 'surf':
        descriptor = cv2.xfeatures2d.SURF_create()
    elif method == 'brisk':
        descriptor = cv2.BRISK_create()
    elif method == 'orb':
        descriptor = cv2.ORB_create()


    # get keypoints and descriptors
    (kps, features) = descriptor.detectAndCompute(image, None)


    return (kps, features)

我們?yōu)閮蓚€圖像都設(shè)置了一組關(guān)鍵點和描述符。如果我們使用SIFT作為特征提取器,它將為每個關(guān)鍵點返回一個128維特征向量。如果選擇SURF,我們將獲得64維特征向量。下圖顯示了使用SIFT,SURF,BRISK和ORB得到的結(jié)果。

使用ORB和漢明距離檢測關(guān)鍵點和描述符

使用SIFT檢測關(guān)鍵點和描述符

使用SURF檢測關(guān)鍵點和描述符

使用BRISK和漢明距離檢測關(guān)鍵點和描述符

特征匹配

如我們所見,兩個圖像都有大量特征點?,F(xiàn)在,我們想比較兩組特征,并盡可能顯示更多相似性的特征點對。使用OpenCV,特征點匹配需要Matcher對象。在這里,我們探索兩種方式:暴力匹配器(BruteForce)和KNN(k最近鄰)。

BruteForce(BF)Matcher的作用恰如其名。給定2組特征(來自圖像A和圖像B),將A組的每個特征與B組的所有特征進(jìn)行比較。默認(rèn)情況下,BF Matcher計算兩點之間的歐式距離。因此,對于集合A中的每個特征,它都會返回集合B中最接近的特征。對于SIFT和SURF,OpenCV建議使用歐幾里得距離。對于ORB和BRISK等其他特征提取器,建議使用漢明距離。我們要使用OpenCV創(chuàng)建BruteForce Matcher,一般情況下,我們只需要指定2個參數(shù)即可。第一個是距離度量。第二個是是否進(jìn)行交叉檢測的布爾參數(shù)。具體代碼如下:

def createMatcher(method,crossCheck):

“Create and return a Matcher Object”

if method == ‘sift’ or method == ‘surf’:

bf = cv2.BFMatcher(cv2.NORM_L2, crossCheck=crossCheck)

elif method == ‘orb’ or method == ‘brisk’:

bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=crossCheck)

return bf

交叉檢查布爾參數(shù)表示這兩個特征是否具有相互匹配才視為有效。換句話說,對于被認(rèn)為有效的一對特征(f1,f2),f1需要匹配f2,f2也必須匹配f1作為最接近的匹配。此過程可確保提供更強大的匹配功能集,這在原始SIFT論文中進(jìn)行了描述。

但是,對于要考慮多個候選匹配的情況,可以使用基于KNN的匹配過程。KNN不會返回給定特征的單個最佳匹配,而是返回k個最佳匹配。需要注意的是,k的值必須由用戶預(yù)先定義。如我們所料,KNN提供了更多的候選功能。但是,在進(jìn)一步操作之前,我們需要確保所有這些匹配對都具有魯棒性。

比率測試

為了確保KNN返回的特征具有很好的可比性,SIFT論文的作者提出了一種稱為比率測試的技術(shù)。一般情況下,我們遍歷KNN得到匹配對,之后再執(zhí)行距離測試。對于每對特征(f1,f2),如果f1和f2之間的距離在一定比例之內(nèi),則將其保留,否則將其丟棄。同樣,必須手動選擇比率值。

本質(zhì)上,比率測試與BruteForce Matcher的交叉檢查選項具有相同的作用。兩者都確保一對檢測到的特征確實足夠接近以至于被認(rèn)為是相似的。下面2個圖顯示了BF和KNN Matcher在SIFT特征上的匹配結(jié)果。我們選擇僅顯示100個匹配點以清晰顯示。

使用KNN和SIFT的定量測試進(jìn)行功能匹配

在SIFT特征上使用暴力匹配器進(jìn)行特征匹配

需要注意的是,即使做了多種篩選來保證匹配的正確性,也無法完全保證特征點完全正確匹配。盡管如此,Matcher算法仍將為我們提供兩幅圖像中最佳(更相似)的特征集。接下來,我們利用這些點來計算將兩個圖像的匹配點拼接在一起的變換矩陣。

這種變換稱為單應(yīng)矩陣。簡而言之,單應(yīng)性是一個3x3矩陣,可用于許多應(yīng)用中,例如相機姿態(tài)估計,透視校正和圖像拼接。它將點從一個平面(圖像)映射到另一平面。

估計單應(yīng)性

隨機采樣一致性(RANSAC)是用于擬合線性模型的迭代算法。與其他線性回歸器不同,RANSAC被設(shè)計為對異常值具有魯棒性。

像線性回歸這樣的模型使用最小二乘估計將最佳模型擬合到數(shù)據(jù)。但是,普通最小二乘法對異常值非常敏感。如果異常值數(shù)量很大,則可能會失敗。RANSAC通過僅使用數(shù)據(jù)中的一組數(shù)據(jù)估計參數(shù)來解決此問題。下圖顯示了線性回歸和RANSAC之間的比較。需要注意數(shù)據(jù)集包含相當(dāng)多的離群值。

我們可以看到線性回歸模型很容易受到異常值的影響。那是因為它試圖減少平均誤差。因此,它傾向于支持使所有數(shù)據(jù)點到模型本身的總距離最小的模型。包括異常值。相反,RANSAC僅將模型擬合為被識別為點的點的子集。

這個特性對我們的用例非常重要。在這里,我們將使用RANSAC來估計單應(yīng)矩陣。事實證明,單應(yīng)矩陣對我們傳遞給它的數(shù)據(jù)質(zhì)量非常敏感。因此,重要的是要有一種算法(RANSAC),該算法可以從不屬于數(shù)據(jù)分布的點中篩選出明顯屬于數(shù)據(jù)分布的點。

估計了單應(yīng)矩陣后,我們需要將其中一張圖像變換到一個公共平面上。在這里,我們將對其中一張圖像應(yīng)用透視變換。透視變換可以組合一個或多個操作,例如旋轉(zhuǎn),縮放,平移或剪切。我們可以使用OpenCV warpPerspective()函數(shù)。它以圖像和單應(yīng)矩陣作為輸入。

# Apply panorama correction
width = trainImg.shape[1] + queryImg.shape[1]
height = trainImg.shape[0] + queryImg.shape[0]


result = cv2.warpPerspective(trainImg, H, (width, height))
result[0:queryImg.shape[0], 0:queryImg.shape[1]] = queryImg


plt.figure(figsize=(20,10))
plt.imshow(result)


plt.axis('off')
plt.show()

如我們所見,結(jié)果中包含了兩個圖像中的內(nèi)容。另外,我們可以看到一些與照明條件和圖像邊界邊緣效應(yīng)有關(guān)的問題。理想情況下,我們可以執(zhí)行一些處理技術(shù)來標(biāo)準(zhǔn)化亮度,例如直方圖匹配,這會使結(jié)果看起來更真實和自然一些。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1620

    瀏覽量

    64048
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86758

原文標(biāo)題:使用OpenCV進(jìn)行圖像全景拼接

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    itop-3568開發(fā)板機器視覺opencv開發(fā)手冊-圖像繪制-畫線

    用 imshow()函數(shù)對畫線之后的圖像進(jìn)行展示; 第 8 行使用了 waitKey()函數(shù),持續(xù)顯示展示照片直到按鍵的按下。 保存退出之后,在終端界面中輸入以下命令進(jìn)行 python
    發(fā)表于 06-04 10:38

    基于LockAI視覺識別模塊:C++圖像采集例程

    本文主要演示如何使用LockAI視覺識別模塊進(jìn)行視頻流的讀取,同時使用Edit模塊進(jìn)行圖像傳輸?;A(chǔ)知識講解1.1OpenCV簡介OpenCV
    的頭像 發(fā)表于 04-30 18:23 ?228次閱讀
    基于LockAI視覺識別模塊:C++<b class='flag-5'>圖像</b>采集例程

    如何用OpenCV的相機捕捉視頻進(jìn)行人臉檢測--基于米爾NXP i.MX93開發(fā)板

    攝像頭)1、安裝python3-opencvaptinstallpython3-opencv(左右移動查看全部內(nèi)容)2、查看攝像頭支持的格式與分辨率root@debi
    的頭像 發(fā)表于 04-15 11:51 ?338次閱讀
    如何用<b class='flag-5'>OpenCV</b>的相機捕捉視頻<b class='flag-5'>進(jìn)行</b>人臉檢測--基于米爾NXP i.MX93開發(fā)板

    快速部署!米爾全志T527開發(fā)板的OpenCV行人檢測方案指南

    sudo apt-get install libopencv-dev python3-opencv 2.在全志T527開發(fā)板?安裝pipsudo apt-get install python3-pip 二
    發(fā)表于 04-11 18:14

    異形拼接處理器可以實現(xiàn)的效果

    異形拼接處理器可以實現(xiàn)的效果非常多樣化和創(chuàng)新,以下是對其可實現(xiàn)效果的進(jìn)一步補充: 一、創(chuàng)意拼接顯示 1、任意角度拼接:異形拼接處理器支持0~360度任意角度的
    的頭像 發(fā)表于 03-21 12:39 ?253次閱讀
    異形<b class='flag-5'>拼接</b>處理器可以實現(xiàn)的效果

    【AI實戰(zhàn)項目】基于OpenCV的“顏色識別項目”完整操作過程

    適用于哪些場景,然后通過Python編寫代碼來實現(xiàn)這些算法,并應(yīng)用于實際項目中,實現(xiàn)圖像的檢測、識別、分類、定位、測量等目標(biāo)。華清遠(yuǎn)見【python+OpenCV
    的頭像 發(fā)表于 12-09 16:42 ?1413次閱讀
    【AI實戰(zhàn)項目】基于<b class='flag-5'>OpenCV</b>的“顏色識別項目”完整操作過程

    RK3568 + OpenCV 會碰撞出什么火花?案例詳解:2-1 基于OpenCV的畫線實驗

    一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時提供了Python、Ruby、MATLAB等語言的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法。 OpenCV具有以下特點: 不管是科學(xué)研究,還是商業(yè)
    發(fā)表于 12-03 14:09

    一個月速成python+OpenCV圖像處理

    適用于哪些場景,然后通過Python編寫代碼來實現(xiàn)這些算法,并應(yīng)用于實際項目中,實現(xiàn)圖像的檢測、識別、分類、定位、測量等目標(biāo)。本文將介紹一個高效學(xué)習(xí)Python+O
    的頭像 發(fā)表于 11-29 18:27 ?460次閱讀
    一個月速成<b class='flag-5'>python+OpenCV</b><b class='flag-5'>圖像</b>處理

    使用Python進(jìn)行串口通信的案例

    當(dāng)然!以下是一個使用Python進(jìn)行串口通信的簡單示例。這個示例展示了如何配置串口、發(fā)送數(shù)據(jù)以及接收數(shù)據(jù)。我們將使用 pyserial 庫,這是一個非常流行的用于串口通信的Python庫。 首先,你
    的頭像 發(fā)表于 11-22 09:11 ?1468次閱讀

    OpenCV教程之OpenCV圖像閾值處理

    閾值的基本概念是為了簡化圖像進(jìn)行分析。當(dāng)我們將圖像轉(zhuǎn)換為灰度圖像時,必須記住灰度圖像仍然至少有255個值。閾值是將所有內(nèi)容轉(zhuǎn)換為白色或黑色
    的頭像 發(fā)表于 11-16 10:16 ?643次閱讀
    <b class='flag-5'>OpenCV</b>教程之<b class='flag-5'>OpenCV</b><b class='flag-5'>圖像</b>閾值處理

    如何用OpenCV的相機捕捉視頻進(jìn)行人臉檢測--基于米爾NXP i.MX93開發(fā)板

    提供了一個非常簡單的接口,用于相機捕捉一個視頻(我用的電腦內(nèi)置攝像頭) 1、安裝python3-opencv apt install python3-opencv 2、查看攝像頭支持的格式與分辨率
    發(fā)表于 11-15 17:58

    手寫圖像模板匹配算法在OpenCV中的實現(xiàn)

    OpenCV中的模板匹配是支持基于NCC相似度查找的,但是不是很好用,一個主要的原因是查找最大閾值,只能匹配一個,自己比對閾值,又導(dǎo)致無法正確設(shè)定閾值范圍,所以問題很多。于是我重新寫了純Python版本的NCC圖像模板匹配的代碼
    的頭像 發(fā)表于 11-11 10:12 ?769次閱讀
    手寫<b class='flag-5'>圖像</b>模板匹配算法在<b class='flag-5'>OpenCV</b>中的實現(xiàn)

    使用Python進(jìn)行圖像處理

    下面是一個關(guān)于使用Python在幾行代碼中分析城市輪廓線的快速教程。
    的頭像 發(fā)表于 11-07 10:14 ?587次閱讀
    使用<b class='flag-5'>Python</b><b class='flag-5'>進(jìn)行</b><b class='flag-5'>圖像</b>處理

    基于OPENCV的相機捕捉視頻進(jìn)行人臉檢測--米爾NXP i.MX93開發(fā)板

    攝像頭)1、安裝python3-opencvaptinstallpython3-opencv2、查看攝像頭支持的格式與分辨率root@de
    的頭像 發(fā)表于 11-07 09:03 ?1475次閱讀
    基于<b class='flag-5'>OPENCV</b>的相機捕捉視頻<b class='flag-5'>進(jìn)行</b>人臉檢測--米爾NXP i.MX93開發(fā)板

    使用Python進(jìn)行Ping測試

    )請求包,然后等待目標(biāo)主機返回響應(yīng)包,從而測量網(wǎng)絡(luò)的延遲和丟包情況。隨著Python編程語言的廣泛應(yīng)用,越來越多的網(wǎng)絡(luò)工程師開始使用Python進(jìn)行自動化網(wǎng)絡(luò)測試和管理任務(wù)。本篇文章將詳細(xì)介紹如何使用
    的頭像 發(fā)表于 08-12 17:56 ?1008次閱讀
    使用<b class='flag-5'>Python</b><b class='flag-5'>進(jìn)行</b>Ping測試