淺談DeepLabV3\U2Net\HRNet-seg模型的圖像分割調(diào)優(yōu)

01 ? ? ? 序

很久沒(méi)有寫(xiě)過(guò)博客了，最近忙于做項(xiàng)目，閉了后簡(jiǎn)單寫(xiě)一下心得體會(huì)。近期主要是在做服飾場(chǎng)景相關(guān)的項(xiàng)目，今天簡(jiǎn)單寫(xiě)寫(xiě)其中做的一個(gè)服飾分割。

初版代碼已經(jīng)提交，歡迎大家提issue和pr

https://github.com/FlyEgle/segmentationlight

02 ? ? ? 背景

主要場(chǎng)景就是對(duì)模特進(jìn)行服飾摳圖，要求邊緣處理相對(duì)平滑，扣取召回和準(zhǔn)確率比較高，能夠覆蓋95%以上的場(chǎng)景case。同時(shí)需要考慮模型FLOPs以及結(jié)構(gòu)便宜性，便于后期有壓縮的需求。

03 ? ? ? 模型選擇

有考慮過(guò)如下三種模型：

DeepLabV3

U2Net

HRNet-seg

這里DeepLabV3有空洞卷積存在，對(duì)于細(xì)致的扣圖，效果不是很好，更加適用于連通性比較強(qiáng)的物體分割以及多類(lèi)別分割。

HRNet-seg存在一個(gè)問(wèn)題，最后輸出的featuremap分別是[1/4, 1/8, 1/16, 1/32]，雖然是有不斷的高低分辨率的交互，但是1/4還是有點(diǎn)捉襟見(jiàn)肘，會(huì)影響一些小的pixel，空洞以及邊緣效果。所以做了簡(jiǎn)單的修該如下：

FPN+upsmaple形式

FPN+upsample

upsmaple+cat

upsmaple+cat 相對(duì)來(lái)說(shuō)FPN的收斂速度會(huì)更快一些，計(jì)算量更小，性能略高，相比原始HRseg的輸出來(lái)說(shuō)，細(xì)致化了很多。 3. U2net的計(jì)算量要比HRnet-fpn更小，同時(shí)，U2net更加注重刻畫(huà)細(xì)節(jié)。由于場(chǎng)景只有一個(gè)類(lèi)別，所以U2Net不太需要考慮類(lèi)別的關(guān)系，對(duì)于模型本身來(lái)說(shuō)更加適配。 4. 有嘗試過(guò)修改U2net，包括增加attention，增加refine Module，多監(jiān)督約束以及修改結(jié)構(gòu)等，不過(guò)最終都比較雞肋了，寫(xiě)paper還是可以的，從實(shí)際case效果上看幾乎無(wú)差。也嘗試過(guò)x2，x4channel，性能上也沒(méi)明顯提升。不過(guò)對(duì)于專(zhuān)一場(chǎng)景來(lái)說(shuō)，模型本身不是重點(diǎn)。

u2net模型結(jié)構(gòu)

04 ? ? ? 損失設(shè)計(jì)

任務(wù)只要求區(qū)分前景和背景，自然可以理解為二分類(lèi)或者是1分類(lèi)問(wèn)題，所以基礎(chǔ)loss的選擇就可以是softmax+CE(二分類(lèi))，sigmoid+bce(前景)。sigmoid相比softmax對(duì)于邊緣效果更佳友好(可以調(diào)節(jié)閾值)，為了保證連通區(qū)域，采用了bce+3*dice作為baseline損失。這里在320x320尺寸下，做了一些對(duì)比實(shí)驗(yàn)，可以看到bce+iou指標(biāo)最高，不過(guò)case by case的話(huà)視覺(jué)效果沒(méi)有bce+dice好。降低dice的系數(shù)，也是因?yàn)橛袝r(shí)候dice過(guò)強(qiáng)忽略了bce判別正負(fù)樣本的情況。

損失函數(shù) 也嘗試過(guò)一些其他的loss，如focalloss，tv， L1等損失組合，意義不是很大，代碼如下：

# ----------------- DICE Loss--------------------class DiceLoss(nn.Module):
    def __init__(self):
        super(DiceLoss, self).__init__()
 
    def forward(self, logits, targets, mask=False):
        num = targets.size(0)
        smooth = 1.


        probs = torch.sigmoid(logits)
        m1 = probs.view(num, -1)
        m2 = targets.view(num, -1)
        intersection = (m1 * m2)
 
        score = 2. * (intersection.sum(1) + smooth) / (m1.sum(1) + m2.sum(1) + smooth)
        score = 1 - score.sum() / num
        return score# -------------------- BCELoss -----------------------class BCELoss(nn.Module):
    """binary bceloss with sigmoid"""
    def __init__(self):
        super(BCELoss, self).__init__()


    def forward(self, inputs, targets, weights=None, mask=False):
        assert len(inputs.shape) == 4, "inputs shape must be NCHW"
        if len(targets.shape) != 4:
            targets = targets.unsqueeze(1).float()
        else:
            targets = targets.float()
        if mask:
            inputs  = inputs * targets
        losses = F.binary_cross_entropy_with_logits(inputs, targets, weights)
        return losses# ----------------- DICE+BCE Loss--------------------class DiceWithBCELoss(nn.Module):
    def __init__(self, weights, mining=False):
        super(DiceWithBCELoss, self).__init__()
        self.dice_loss = DiceLoss()
        if mining:
            self.bce_loss = BalanceCrossEntropyLoss() 
        else:
            self.bce_loss = BCELoss()
        self.weights = weights


    def forward(self, preds, targets):
        bceloss = self.bce_loss(preds, targets)
        diceloss = self.dice_loss(preds, targets)
????????return?self.weights['bce']?*?bceloss?+?self.weights['dice']*diceloss

05 ? ? ? 訓(xùn)練優(yōu)化

1. 分辨率

baseline模型的訓(xùn)練尺寸為320x320，隨之提升到了640x640，這里采用兩種方法，一個(gè)是from strach訓(xùn)練一個(gè)是load 320的pretrain 進(jìn)行訓(xùn)練。相比于strach，pretrain的效果會(huì)更好，隨著數(shù)據(jù)的迭代和累積，不斷的采用上一個(gè)最好效果的weights來(lái)做下一次訓(xùn)練模型的pretrain，最終訓(xùn)練尺寸為800x800。嘗試過(guò)采用更大的分辨率960和1024來(lái)進(jìn)行訓(xùn)練，在個(gè)人的場(chǎng)景上基本沒(méi)有顯著提升。（ps: 1024尺寸下的bs太小了，加了accumulate grad后性能下降的明顯）

2. 數(shù)據(jù)增強(qiáng)

數(shù)據(jù)增強(qiáng)采用基本都是常規(guī)的，隨機(jī)crop，隨機(jī)翻轉(zhuǎn)，隨機(jī)旋轉(zhuǎn)，隨機(jī)blur，這里colorjitter會(huì)影響性能就沒(méi)有用了。

def build_transformers(crop_size=(320, 320)):
    if isinstance(crop_size, int):
        crop_size = (crop_size, crop_size)
    
    data_aug = [
        # RandomCropScale(scale_size=crop_size, scale=(0.4, 1.0)),
        RandomCropScale2(scale_size=crop_size, scale=(0.3, 1.2), prob=0.5),
        RandomHorizionFlip(p=0.5),
        RandomRotate(degree=15, mode=0),
        RandomGaussianBlur(p=0.2),
    ]


    to_tensor = [
        Normalize(normalize=True, mean=IMAGENET_DEFAULT_MEAN, std=IMAGENET_DEFAULT_STD),
        ToTensor(channel_first=True)
    ]


    final_aug = data_aug + to_tensor
    return Compose(final_aug)

比較重要的一點(diǎn)的是randomcrop，調(diào)整了crop的區(qū)域?yàn)閇0.3,1.2]，一方面是因?yàn)閏rop區(qū)域太小，容易忽視整體性，另一方面是crop大一些可以相應(yīng)的對(duì)應(yīng)大分辨率。要注意的是，crop的區(qū)域是需要包含前景，可以通過(guò)設(shè)定前景占比來(lái)進(jìn)行調(diào)整，也可以理解為手動(dòng)balance數(shù)據(jù)。

class RandomCropScale2:
    """RandomCrop with Scale the images & targets, if not crop fit size, need to switch the prob to do reisze to keep the over figure        scale_size :  (list) a sequence of scale        scale      :  default is (0.08, 1.0),  crop region areas        ratio      :  default is (3. / 4., 4. / 3.), ratio for width / height    Returns:        scale_image : (ndarray) crop and scale image        scale_target: (ndarray) crop and scale target, shape  is same with image    """
    def __init__(self, scale_size, scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.), prob=0.5):
        self.scale_size = scale_size
        self.scale = scale 
        self.ratio = ratio   


        # self.prob = np.random.uniform(0, 1) > prob
        self.prob = prob
        self.scale_func = Scale(self.scale_size)

        # center crop
        # self.centercrop = CenterCrop(self.scale_size)

        if (self.scale[0] > self.scale[1]) or (self.ratio[0] >  self.ratio[1]):
            warnings.warn("Scale and ratio  should be of kind (min, max)")

    def _isBG(self, tgts):
        """If the targets all is 0, 0 is background        """
        if np.sum(tgts) == 0:
            return True 
        else:
            return False

    # TODO: fix empty bug
    def _crop_imgs(self, imgs, tgts):
        height, width, _ = imgs.shape 
        area =  height * width 


        for _ in range(10):
            target_area = area * np.random.uniform(self.scale[0], self.scale[1])
            aspect_ratio = np.random.uniform(self.ratio[0], self.ratio[1])


            w = int(round(math.sqrt(target_area * aspect_ratio)))
            h = int(round(math.sqrt(target_area / aspect_ratio)))


            if 0 < w < width and 0 < h < height:
                random_y = np.random.randint(0, height - h + 1)
                random_x = np.random.randint(0, width - w + 1)
                
                crop_image = imgs[random_y:random_y+h, random_x:random_x+w]
                crop_target = tgts[random_y:random_y+h, random_x:random_x+w]


                if not self._isBG(crop_target):
                    crop_image, crop_target = self.scale_func(crop_image, crop_target)
                    return crop_image, crop_target

            # switch prob or center crop
            if np.random.uniform(0, 1) > self.prob:
                # center crop
                in_ratio = float(width) / float(height)
                if in_ratio < min(self.ratio):
                    w = width
                    h = int(round(w / min(self.ratio)))
                elif in_ratio > max(self.ratio):
                    h = height
                    w = int(round(h * max(self.ratio)))
                else:
                    w = width
                    h = height 
                
                # navie center crop
                crop_x = max((width - w) // 2, 0)
                crop_y = max((height  - h) // 2, 0)
                imgs = imgs[crop_y:crop_y+height,  crop_x:crop_x+width]
                tgts = tgts[crop_y:crop_y+height, crop_x:crop_x+width]

            # scale 
            crop_image, crop_target = self.scale_func(imgs, tgts)
            return crop_image, crop_target


    def __call__(self, imgs, tgts):
        crop_image, crop_target = self._crop_imgs(imgs, tgts)
????????return?crop_image,?crop_target

3. 數(shù)據(jù)

這個(gè)就仁者見(jiàn)仁智者見(jiàn)智了，查缺補(bǔ)漏就好，一般新數(shù)據(jù)，我會(huì)用模型過(guò)濾一遍，卡個(gè)0.98或者0.99的miou，小于這個(gè)閾值的用于訓(xùn)練，大于閾值的采樣訓(xùn)練。訓(xùn)練這里采用的是ADAMW優(yōu)化器，1e-2的weights decay，5e-4到1e-4調(diào)整學(xué)習(xí)率，視情況而定。（ADAMW偶爾會(huì)出現(xiàn)nan的問(wèn)題，要查找是否數(shù)據(jù)有nan，如果沒(méi)有大概率是因?yàn)橛衎n導(dǎo)致的數(shù)值溢出，可以調(diào)小LR或者更換優(yōu)化器）采用了CircleLR進(jìn)行衰減，效果還算ok，跑相同300個(gè)epoch，比CosineLR要好一點(diǎn)點(diǎn)。最終場(chǎng)景驗(yàn)證數(shù)據(jù)可以到達(dá)99%+的miou。

06 ? ? ? 邊緣優(yōu)化

Sigmoid訓(xùn)練后，可以簡(jiǎn)單的卡個(gè)閾值來(lái)進(jìn)行邊緣平滑處理，可以二值也可以過(guò)渡。

output[output >= thre] = 1 or None
output[output < thre] = 0

邊緣

粗看邊緣還算可以，但是細(xì)看就發(fā)現(xiàn)鋸齒很明顯了，還需要進(jìn)一步處理，這里簡(jiǎn)單做了一個(gè)算法，縮放現(xiàn)有的mask（這里縮放可以用contour，也可以用腐蝕，也可以用shapely），把原始圖像做blur，把外圈的blur貼回來(lái)。

def edgePostProcess(mask, image):
    """Edge post Process    Args:        
mask: a ndarray map, value is [0,255], shape is (h, w, 3)   
     image: a ndarray map, value is 0-255, shape  is(h, w, 3)  
  Returns:     
   outputs: edge blur image    """
    mask[mask==255] = 1
    mask = getShrink(mask)

    image = image * mask 
    image[image==0] = 255
    blur_image = cv2.GaussianBlur(image, (5, 5), 0)
    new_mask = np.zeros(image.shape, np.uint8)
    contours, hierachy = cv2.findContours(
        mask[:,:,0],
        cv2.RETR_EXTERNAL,
        cv2.CHAIN_APPROX_SIMPLE
    )
    cv2.drawContours(new_mask, contours, -1, (255, 255, 255), 5)
    output = np.where(new_mask==np.array([255, 255, 255]), blur_image, image)
    return output

邊緣其實(shí)可以看到，邊緣只是blur了，但是貼到白背景上可以發(fā)現(xiàn)視覺(jué)效果會(huì)好很多，這也是欺騙人眼的一個(gè)方法。放一張高圓圓的照片吧，看一下分割后的結(jié)果

07 ? ? ? 代碼

這套代碼框架寫(xiě)了個(gè)把個(gè)月，包括了FCNs，SegNets，DeepLab，UNet，U2Net，HRNet等一些常用模型的實(shí)現(xiàn)，loss，aug，lrshedule等，以及VOC上的一些pretrain。整體代碼簡(jiǎn)單明了，模塊分明，如果有需要后面可以考慮開(kāi)源。

model zoo 最后，本人不是主要做分割的，只是項(xiàng)目需要了就寫(xiě)了一套代碼框架，做了一些相關(guān)的實(shí)驗(yàn)探索，有一定的場(chǎng)景調(diào)優(yōu)，不一定具備共性，歡迎大家討論~

編輯：黃飛

閱讀全文

圖像分割(17844) 圖像分割(17844)

評(píng)論

相關(guān)推薦

使用LabVIEW實(shí)現(xiàn)基于pytorch的DeepLabv3圖像語(yǔ)義分割

使用LabVIEW實(shí)現(xiàn)deeplabV3語(yǔ)義分割

2023-03-22 15:06:52

1253

使用LabVIEW實(shí)現(xiàn) DeepLabv3+ 語(yǔ)義分割含源碼

使用LabVIEW實(shí)現(xiàn) DeepLabv3+ 語(yǔ)義分割含源碼

2023-05-26 10:23:01

522

圖像分割

`哪位大神知道圖像分割如何做，如圖中如何將中間的那一個(gè)部分提取出來(lái)`

2017-05-04 21:46:30

圖像分割不能運(yùn)行

我正在做labview的圖像處理，其中有一步是要求進(jìn)行圖像分割，但我編完程序之后老是卡掉，運(yùn)行不了，求大神幫我看看哪里出錯(cuò)了。

2013-05-21 10:00:03

圖像處理算法介紹：閾值分割

對(duì)于直方圖雙峰不明顯，或圖像目標(biāo)和背景比例差異懸殊，迭代法所選取的閾值不如最大類(lèi)間方差法。3、直方圖凹面分析法方法對(duì)某些只有單峰直方圖的圖像，可以作出分割。從直觀上說(shuō)，圖像直方圖雙峰之間的谷底，應(yīng)該是

2016-04-27 14:22:58

HBase性能調(diào)優(yōu)概述

HBase性能調(diào)優(yōu)

2019-07-03 11:35:56

KeenTune的算法之心——KeenOpt 調(diào)優(yōu)算法框架 | 龍蜥技術(shù)

了不同的道路。（圖1/條條調(diào)優(yōu)路）對(duì)于機(jī)器學(xué)習(xí)模型超參數(shù)調(diào)優(yōu)來(lái)說(shuō)，調(diào)優(yōu)的時(shí)間開(kāi)銷(xiāo)主要來(lái)自?xún)蓚€(gè)方面：（1）調(diào)優(yōu)算法搜索策略所需要的運(yùn)算耗時(shí)。（2）機(jī)器學(xué)習(xí)模型訓(xùn)練的耗時(shí)。對(duì)于近年來(lái)逐漸廣為人知的基于高保真

2022-10-28 10:36:50

flume讀取文件延遲調(diào)優(yōu)說(shuō)明

flume讀取文件延遲調(diào)優(yōu)

2020-07-17 16:38:06

van-自然和醫(yī)學(xué)圖像的深度語(yǔ)義分割：網(wǎng)絡(luò)結(jié)構(gòu)

概率值最大的分割結(jié)果，作為最后的分割圖。U-Net中常常會(huì)問(wèn)為什么適用于醫(yī)學(xué)圖像這個(gè)問(wèn)題.。首先分析醫(yī)學(xué)影像數(shù)據(jù)特點(diǎn)：圖像語(yǔ)義較為簡(jiǎn)單，結(jié)構(gòu)較為固定：都是一個(gè)固定的器官的成像。而且器官本身結(jié)構(gòu)固定

2021-12-28 11:03:35

van-自然和醫(yī)學(xué)圖像的深度語(yǔ)義分割：網(wǎng)絡(luò)結(jié)構(gòu)

2021-12-28 11:06:01

【Firefly RK3399試用體驗(yàn)】之三——基于閾值的圖像分割

本帖最后由 1413909 于 2017-7-6 20:30 編輯在圖像處理中，有一個(gè)很重要的部分就是圖像分割，這也是機(jī)器視覺(jué)中對(duì)圖像做的最基礎(chǔ)的處理，圖像分割的方法有基于閾值的圖像分割

2017-07-06 20:30:30

一種基于Deep U-Net的多任務(wù)學(xué)習(xí)框架

參考的。多任務(wù)U-Net圖像分割多任務(wù)深度U-Net是在二維U-Net基礎(chǔ)上發(fā)展而來(lái)的。數(shù)據(jù)集的圖像在x-y平面上的最大尺寸為640 × 640，通過(guò)增加池化層來(lái)增加U-Net的接收域。它由5個(gè)下采樣塊和5個(gè)上

2022-11-10 15:35:57

一種新的粘連字符圖像分割方法

損傷，影響后期識(shí)別。參考文獻(xiàn)[2]采用了輪廓分裂與區(qū)域合并相結(jié)合的算法，能夠分割粘連字符，但過(guò)程復(fù)雜且準(zhǔn)確率不高，抗干擾性一般。參考文獻(xiàn)[3]提出了一種基于骨架形態(tài)分析的粘連分割算法,但該方法利用閾值

2009-09-19 09:19:17

使用全卷積網(wǎng)絡(luò)模型實(shí)現(xiàn)圖像分割

OpenCv-C++-深度神經(jīng)網(wǎng)絡(luò)（DNN）模塊-使用FCN模型實(shí)現(xiàn)圖像分割

2019-05-28 07:33:35

功耗調(diào)優(yōu)時(shí)經(jīng)常用到的幾個(gè)方法

前言不清楚當(dāng)前產(chǎn)品的整機(jī)功耗，就不清楚怎么調(diào)優(yōu)獲取產(chǎn)品的整機(jī)及各個(gè)模塊的功耗數(shù)據(jù)，需要測(cè)量正確的功耗測(cè)量方法，快速的了解整機(jī)的功耗分布，為功耗調(diào)優(yōu)提供方向。功耗測(cè)量功耗拆解，是功耗調(diào)優(yōu)的前提，需要

2021-12-21 06:31:28

印刷電路板的圖像分割

自適應(yīng)閾值分割算法：　?。?）將圖像分成4個(gè)子圖像；　?。?b class="flag-6" style="color: red">2）計(jì)算每個(gè)字圖像的均值；　?。?b class="flag-6" style="color: red">3）根據(jù)均值設(shè)置閾值，閾值只應(yīng)用在對(duì)應(yīng)的子圖像；　?。?）根據(jù)閾值，對(duì)每個(gè)子塊進(jìn)行分割?！　〈怂惴ㄖ校瑢⒕底鳛樽?/div>

2018-08-29 10:53:08

基于GAC模型實(shí)現(xiàn)交互式圖像分割的改進(jìn)算法

的基于GAC模型的交互式圖像分割算法可以描述如下：　　(1)預(yù)處理。采用TV_L1模型對(duì)圖像進(jìn)行平滑(取λ=0.5)。　　(2)用8鄰點(diǎn)差分格式計(jì)算梯度和圖像等照度線(xiàn)的曲率: 　　(3)按照

2009-09-19 09:19:45

基于MLP的快速醫(yī)學(xué)圖像分割網(wǎng)絡(luò)UNeXt相關(guān)資料分享

1、基于MLP的快速醫(yī)學(xué)圖像分割網(wǎng)絡(luò)UNeXt　　方法概述　　之前我們解讀過(guò)基于 Transformer 的 U-Net變體，近年來(lái)一直是領(lǐng)先的醫(yī)學(xué)圖像分割方法，但是參數(shù)量往往不樂(lè)觀，計(jì)算復(fù)雜，推理

2022-09-23 14:53:05

基于改進(jìn)遺傳算法的圖像分割方法

基于改進(jìn)遺傳算法的圖像分割方法提出一種應(yīng)用于圖像分割的改進(jìn)遺傳算法,算法中引入了優(yōu)生算子、改進(jìn)的變異算子和新個(gè)體,避免了局部早熟,提高了收斂速度和全局收斂能力。　　關(guān)鍵詞: 圖像分割&

2009-09-19 09:36:47

智能車(chē)競(jìng)賽淺談——圖像篇

u16 time_out=0;if(mt9v03x_finish_flag) {Get_Use_Image();// 取出賽道及顯示所需圖像數(shù)據(jù)Get_Bin_Image(3

2022-09-24 15:05:15

深度學(xué)習(xí)在醫(yī)學(xué)圖像分割與病變識(shí)別中的應(yīng)用實(shí)戰(zhàn)

U-Net網(wǎng)絡(luò)結(jié)構(gòu) def unet(input_shape): inputs = Input(input_shape) # 編碼器部分 conv1 = Conv2D(32, (3, 3

2023-09-04 11:11:23

基于向量流場(chǎng)節(jié)點(diǎn)的圖像分割算法

人工干預(yù)使蛇模型只能用于半自動(dòng)的圖像分割，該文在梯度向量流(GVF)蛇模型的基礎(chǔ)上提出一種基于流場(chǎng)節(jié)點(diǎn)與最小路徑方法的全自動(dòng)圖像分割算法。在圖像的GVF 場(chǎng)上檢測(cè)出流場(chǎng)節(jié)

2009-03-25 08:53:38

基于多級(jí)混合模型的圖像分割方法

本文研究了典型的基于區(qū)域的圖像分割方法主動(dòng)形狀模型（Active Shape Model, ASM）和基于邊緣的圖像分割snake 算法，分析了算法適用條件和各自的優(yōu)缺點(diǎn)。結(jié)合snake 模型與主動(dòng)形狀模型

2009-07-08 09:58:09

基于方向氣球力活動(dòng)輪廓模型的圖像分割

針對(duì)傳統(tǒng)參數(shù)活動(dòng)輪廓模型存在對(duì)輪廓線(xiàn)初始位置敏感的缺點(diǎn)，提出了方向氣球力活動(dòng)輪廓模型并應(yīng)用于MRI 圖像分割。該模型利用底層圖像分割的結(jié)果確定外力的方向，使氣球力方

2009-07-15 10:51:34

基于C-V 的壓力模型對(duì)飛機(jī)紅外圖像分割

針對(duì)飛機(jī)紅外圖像中存在的背景噪聲大、目標(biāo)幾何結(jié)構(gòu)復(fù)雜、圖像對(duì)比度低所造成參數(shù)活動(dòng)輪廓模型進(jìn)行圖像分割的困難，本文利用獲得的各區(qū)域灰度信息，進(jìn)行Chen-Vese 能量函數(shù)最

2009-08-05 15:01:11

圖像的亮度矩和閾值分割

圖像的亮度矩和閾值分割:簡(jiǎn)要介紹圖像的亮度矩以及在保持圖像亮度矩不變的條件下對(duì)圖像進(jìn)行兩級(jí)閹值分割的方法，并對(duì)這種方法得到的方程組采用最小=乘法進(jìn)行求解，以減小噪

2009-10-26 11:22:45

基于改進(jìn)的活動(dòng)輪廓模型在圖像分割中的應(yīng)用

活動(dòng)輪廓模型在圖像分割過(guò)程中有廣泛應(yīng)用。本文首先介紹了活動(dòng)輪廓模型，并指出了該模型的缺陷，在此基礎(chǔ)上本文提出了一種改進(jìn)的方法，與現(xiàn)在流行的改進(jìn)方法不同之處為

2009-12-12 11:44:11

基于C-V的壓力模型對(duì)飛機(jī)紅外圖像分割

2009-12-30 15:05:46

基于MAR-MRF的SAR圖像分割方法

該文提出了一種基于多尺度自回歸模型和馬爾科夫隨機(jī)場(chǎng)的SAR 圖像分割算法。算法引入多尺度自回歸模型，建立層與層之間以及相鄰層的像素點(diǎn)之間的數(shù)學(xué)關(guān)系，并將此模型與馬爾

2010-02-10 13:51:20

水平集方法在肝臟CT圖像分割中的應(yīng)用

本文從理論上分析了無(wú)需重新初始化的水平集方法的主動(dòng)輪廓圖像分割模型,此模型有很大的優(yōu)越性,但對(duì)于目標(biāo)與背景對(duì)比度較小這種情況不能得到一個(gè)好的分割效果。該模型應(yīng)用于

2010-02-21 14:32:53

基于閾值法在圖像分割技術(shù)中的應(yīng)用

基于閾值法在圖像分割技術(shù)中的應(yīng)用圖像的研究和應(yīng)用中，人們往往僅對(duì)圖像中的某些部分感興趣，這些部分稱(chēng)為目標(biāo)或前景(其他部分稱(chēng)為背景)，他們一般對(duì)應(yīng)圖像中特

2010-04-21 10:22:15

1174

PCB缺陷檢測(cè)中圖像分割算法

圖像分割在圖像處理中占有重要的地位，分割結(jié)果的好壞直接影響圖像的后續(xù)處理。本文介紹了4種常用的圖像分割方法及其在PCB缺陷檢測(cè)中的應(yīng)用，并且利用實(shí)際的分割效果對(duì)4種分割

2011-06-16 15:31:29

基于多通道Gabor小波濾波器的圖像分割研究

本文討論了目前基于Gabor濾波器的多通道方法應(yīng)用于圖像分割的現(xiàn)狀，給出了Gabor濾波器進(jìn)行圖像分割的原理、過(guò)程、實(shí)驗(yàn)結(jié)果及分析。介紹了圖像邊緣檢測(cè)、圖像閾值分割的各種算法，

2012-05-04 14:29:16

淺談圖像閾值分割技術(shù)

圖像分割是一種關(guān)鍵的圖像技術(shù)，在理論研究和實(shí)際應(yīng)用中都得到了人們的廣泛重視。圖像分割的方法和種類(lèi)有很多，有些分割運(yùn)算可直接應(yīng)用于任何圖像，而另一些只能適用于特殊類(lèi)

2013-01-08 16:11:19

基于交叉視覺(jué)皮質(zhì)模型的圖像快速分割新算法

為了使光學(xué)圖像分割處理達(dá)到實(shí)時(shí)性標(biāo)準(zhǔn)，本文引入了具有生物學(xué)背景的交叉視覺(jué)皮質(zhì)模型用于圖像分割。在不降低分割效果的前提下，將交叉視覺(jué)皮質(zhì)模型的閾值衰減函數(shù)調(diào)整為線(xiàn)性

2013-05-15 11:08:46

圖像分割—基于圖的圖像分割

圖像分割—基于圖的圖像分割圖像分割—基于圖的圖像分割

2015-11-19 16:17:11

基于Matlab圖像分割的研究

圖像分割在圖像處理過(guò)渡到圖像分析這個(gè)過(guò)程中起著非常重要的作用，它是圖像工程的核心，圖像分割的研究具有重要的理論和應(yīng)用價(jià)值。介紹了圖像分割的基本理論和常用方法，借助Matlab平臺(tái)對(duì)閾值的分割、區(qū)域

2016-01-04 15:10:49

基于改進(jìn)活動(dòng)輪廓模型的圖像分割

基于改進(jìn)活動(dòng)輪廓模型的圖像分割_王芳

2017-01-07 19:00:39

串并行分割法在分形圖像壓縮的應(yīng)用_段軍

2017-03-19 11:28:16

基于SOPC技術(shù)的圖像分割系統(tǒng)設(shè)計(jì)張學(xué)東

基于SOPC技術(shù)的圖像分割系統(tǒng)設(shè)計(jì)_張學(xué)東

2017-03-17 08:00:00

Tsallis熵的參數(shù)在圖像閾值分割中的應(yīng)用_宋亞玲

2017-03-19 18:58:37

基于多尺度局部特征的圖像分割模型_李軍

2017-03-19 19:19:35

基于二次圖像分割的目標(biāo)提取算法

圖像分割技術(shù)研究，指依據(jù)圖像的一些特性（如灰度強(qiáng)度、顏色、紋理等）將網(wǎng)像中的各個(gè)像素歸類(lèi)成互相都不相交的、具有某種相似性的均勻子區(qū)域的過(guò)程，是圖像處理領(lǐng)域中的一項(xiàng)重要內(nèi)容。本文根據(jù)分割方法的不同特點(diǎn)

2017-11-07 14:05:41

結(jié)合動(dòng)態(tài)亮度的活動(dòng)輪廓模型分割相似圖像組

，是能較好地分割目標(biāo)特征缺失或錯(cuò)誤的相似圖像組的一種活動(dòng)輪廓模型，但其對(duì)于局部灰度不均的相似圖像組分割效果較差對(duì)此，本文提出了包含演化曲線(xiàn)內(nèi)外的動(dòng)態(tài)亮度信息的改進(jìn)的ACGS模型。在全局信息的基礎(chǔ)上引入曲線(xiàn)

2017-11-09 15:47:05

基于紋理幾何結(jié)構(gòu)的紋理描述圖像分割

偏置場(chǎng)變分水平集圖像分割模型利用原始圖像的局部灰度信息，可以對(duì)灰度不均勻圖像進(jìn)行有效的分割，但當(dāng)灰度圖像中存在紋理時(shí)，分割效果往往很差。針對(duì)這一問(wèn)題，提出抑制紋理信息的偏置場(chǎng)變分水平集圖像分割模型

2017-11-22 17:29:13

opencv的圖像分割與融合技術(shù)

圖像閾值化分割是一種傳統(tǒng)的最常用的圖像分割方法，因其實(shí)現(xiàn)簡(jiǎn)單、計(jì)算量小、性能較穩(wěn)定而成為圖像分割中最基本和應(yīng)用最廣泛的分割技術(shù)。它特別適用于目標(biāo)和背景占據(jù)不同灰度級(jí)范圍的圖像。它不僅可以極大的壓縮

2017-12-04 15:04:16

10060

基于改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型的圖像分割

針對(duì)馬爾可夫鏈蒙特卡羅方法普遍存在的迭代收斂性問(wèn)題，在具有空間平滑約束的高斯混合模型條件上提出改進(jìn)空間約束貝葉斯網(wǎng)絡(luò)模型并在圖像分割領(lǐng)域進(jìn)行具體應(yīng)用。所提模型應(yīng)用隱狄利克雷分布（ LDA）概率密度

2017-12-05 17:55:55

基于像素聚類(lèi)進(jìn)行圖像分割的算法

B型心臟超聲圖像分割是計(jì)算心功能參數(shù)前重要的一步。針對(duì)超聲圖像的低分辨率影響分割精度及基于模型的分割算法需要大樣本訓(xùn)練集的問(wèn)題，結(jié)合B型心臟超聲圖像的先驗(yàn)知識(shí)，提出了一種基于像素聚類(lèi)進(jìn)行圖像分割

2017-12-06 16:44:11

圖像分割基礎(chǔ)算法及實(shí)現(xiàn)實(shí)例

圖像分割就是把圖像分成若干個(gè)特定的、具有獨(dú)特性質(zhì)的區(qū)域并提出感興趣目標(biāo)的技術(shù)和過(guò)程。它是由圖像處理到圖像分析的關(guān)鍵步驟?，F(xiàn)有的圖像分割方法主要分以下幾類(lèi)：基于閾值的分割方法、基于區(qū)域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。

2017-12-18 18:19:33

9051

圖像分割評(píng)價(jià)方法研究

　閥值分割法是一種傳統(tǒng)的圖像分割方法，因其實(shí)現(xiàn)簡(jiǎn)單、計(jì)算量小、性能較穩(wěn)定而成為圖像分割中最基本和應(yīng)用最廣泛的分割技術(shù)。閥值分割法的基本原理是通過(guò)設(shè)定不同的特征閥值，把圖像像素點(diǎn)分為具有不同灰度級(jí)

2017-12-19 09:13:13

30496

圖像分割和圖像邊緣檢測(cè)

　圖像分割的研究多年來(lái)一直受到人們的高度重視，至今提出了各種類(lèi)型的分割算法。Pal把圖像分割算法分成了6類(lèi)：閾值分割，像素分割、深度圖像分割、彩色圖像分割，邊緣檢測(cè)和基于模糊集的方法。但是，該方法

2017-12-19 09:29:38

10131

圖像分割技術(shù)的原理及應(yīng)用

圖像分割至今尚無(wú)通用的自身理論。隨著各學(xué)科許多新理論和新方法的提出，出現(xiàn)了許多與一些特定理論、方法相結(jié)合的圖像分割方法。特征空間聚類(lèi)法進(jìn)行圖像分割是將圖像空間中的像素用對(duì)應(yīng)的特征空間點(diǎn)表示，根據(jù)它們?cè)谔卣骺臻g的聚集對(duì)特征空間進(jìn)行分割

2017-12-19 15:00:30

40226

圖像分割的基本方法解析

本文詳細(xì)介紹了圖像分割的基本方法有：基于邊緣的圖像分割方法、閾值分割方法、區(qū)域分割方法、基于圖論的分割方法、基于能量泛函的分割方法、基于聚類(lèi)的分割方法等。圖像分割指的是根據(jù)灰度、顏色、紋理和形狀

2017-12-20 11:06:04

108007

基于活動(dòng)輪廓模型的圖像分割

針對(duì)目前基于參數(shù)活動(dòng)輪廓模型（ PACM）的圖像分割方法不能精確定位到角點(diǎn)，不連續(xù)邊緣易受周?chē)鸁o(wú)關(guān)信息影響的缺陷，提出一種基于參數(shù)活動(dòng)輪廓模型的圖像分割新方法。該方法首先構(gòu)造邊緣保護(hù)項(xiàng)，將其引入

2017-12-22 14:25:29

基于內(nèi)容的圖像分割方法綜述

圖像分割是指將圖像分成若干具有相似性質(zhì)的區(qū)域的過(guò)程，是許多圖像處理任務(wù)的預(yù)處理步驟．近年來(lái)，國(guó)內(nèi)外學(xué)者主要研究基于圖像內(nèi)容的分割算法，在廣泛調(diào)研大量文獻(xiàn)和最新成果的基礎(chǔ)上，將圖像分割算法分為基于圖論

2018-01-02 16:52:41

基于圖像局部灰度差異的噪聲圖像分割模型

圖像分割在計(jì)算機(jī)視覺(jué)處理技術(shù)中占據(jù)重要位置，是圖像處理和分析的關(guān)鍵步驟?；谒郊椒ǖ幕顒?dòng)輪廓模型被成功應(yīng)用于在圖像分割領(lǐng)域，并取得了長(zhǎng)足的發(fā)展，但噪聲圖像和弱邊界的分割問(wèn)題，仍然具有挑戰(zhàn)性

2018-04-17 11:41:18

如何使用One-class SVM進(jìn)行噪聲圖像分割方法的詳細(xì)資料說(shuō)明

　為解決現(xiàn)有無(wú)監(jiān)督圖像分割模型對(duì)強(qiáng)噪聲環(huán)境魯棒性差、無(wú)法適應(yīng)復(fù)雜混合噪聲的問(wèn)題，提出了一種基于One-classSVM方法的改進(jìn)后的噪聲魯棒圖像分割模型。首先，基于One-classSVM構(gòu)建

2019-04-11 17:43:50

DeepLab進(jìn)行語(yǔ)義分割的研究分析

DeepLab是谷歌使用tensorflow基于CNN開(kāi)發(fā)的語(yǔ)義分割模型，至今已更新4個(gè)版本。最新版本是DeepLabv3+，在此模型中進(jìn)一步將深度可分離卷積應(yīng)用到孔空間金字塔池化和解碼器模塊，從而

2019-10-24 08:00:00

百度飛槳雙技術(shù)助力無(wú)人機(jī)應(yīng)用，實(shí)現(xiàn)多場(chǎng)景應(yīng)用和準(zhǔn)確率提升

PaddleSeg是基于飛槳開(kāi)發(fā)的端到端圖像分割開(kāi)發(fā)套件，覆蓋了DeepLabv3+， U-Net， ICNet， PSPNet， HRNet， Fast-SCNN等主流分割網(wǎng)絡(luò)。通過(guò)模塊化的設(shè)計(jì)，以配置化方式驅(qū)動(dòng)模型組合，幫助開(kāi)發(fā)者更便捷地完成從訓(xùn)練到部署的全流程圖像分割應(yīng)用。

2020-09-20 10:53:09

1760

圖像分割技巧資料

圖像分割也是 Kaggle 中的一類(lèi)常見(jiàn)賽題，比如衛(wèi)星圖像分割與識(shí)別、氣胸疾病圖像分割等。除了密切的團(tuán)隊(duì)配合、給力的 GPU 配置等條件，技巧在這類(lèi)比賽中也發(fā)揮了很大的作用。

2020-09-24 11:11:56

1573

深度學(xué)習(xí)中圖像分割的方法和應(yīng)用

分析和分類(lèi)以及機(jī)器人和自動(dòng)駕駛車(chē)輛的圖像處理等應(yīng)用上。許多計(jì)算機(jī)視覺(jué)任務(wù)需要對(duì)圖像進(jìn)行智能分割，以理解圖像中的內(nèi)容，并使每個(gè)部分的分析更加容易。今天的圖像分割技術(shù)使用計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)模型來(lái)理解圖像的每個(gè)像素

2020-11-27 10:29:19

2857

圖像分割的背景知識(shí)

U-Net是一種卷積神經(jīng)網(wǎng)絡(luò)，最初是為分割生物醫(yī)學(xué)圖像而開(kāi)發(fā)的。當(dāng)它被可視化的時(shí)候，它的架構(gòu)看起來(lái)像字母U，因此被命名為U-Net。其體系結(jié)構(gòu)由兩部分組成，左側(cè)為收縮路徑，右側(cè)為擴(kuò)展路徑。收縮路徑的目的是獲取上下文，而擴(kuò)展路徑的作用是幫助精確定位。

2020-12-28 14:22:51

2259

改進(jìn)ResU-Net有利于角膜神經(jīng)圖像自動(dòng)分割

角膜神經(jīng)圖像的自動(dòng)分割對(duì)于糖尿病神經(jīng)病變等疾病的診斷與篩査至關(guān)重要。針對(duì)由于角膜神經(jīng)圖像存在對(duì)比度低且包含非神經(jīng)結(jié)構(gòu)而造成分割效率較低的問(wèn)題，在 Resu-Net結(jié)構(gòu)基礎(chǔ)上引入多尺度殘差、注意力機(jī)制

2021-03-12 15:13:58

結(jié)合雙目圖像的深度信息跨層次特征的語(yǔ)義分割模型

為改善單目圖像語(yǔ)義分割網(wǎng)絡(luò)對(duì)圖像深度變化區(qū)域的分割效果，提出一種結(jié)合雙目圖像的深度信息和跨層次特征進(jìn)行互補(bǔ)應(yīng)用的語(yǔ)義分割模型。在不改變已有單目孿生網(wǎng)絡(luò)結(jié)構(gòu)的前提下，利用該模型分別提取雙目左、右輸入

2021-03-19 14:35:24

基于Deeplabv3架構(gòu)的串聯(lián)空洞卷積神經(jīng)網(wǎng)絡(luò)

室外網(wǎng)球場(chǎng)實(shí)景環(huán)境下的語(yǔ)義分割是開(kāi)發(fā)網(wǎng)球運(yùn)動(dòng)服務(wù)機(jī)器人需要解決的一項(xiàng)關(guān)鍵技術(shù)。針對(duì)室外網(wǎng)球場(chǎng)環(huán)境由于光照、視角等因素的變化導(dǎo)致難以進(jìn)行精細(xì)分割的問(wèn)題，提出一種基于 Deeplabv3架構(gòu)的串聯(lián)空洞

2021-04-29 14:51:08

基于SEGNET模型的圖像語(yǔ)義分割方法

使用原始 SEGNET模型對(duì)圖像進(jìn)行語(yǔ)義分割時(shí)，未對(duì)圖像中相鄰像素點(diǎn)間的關(guān)系進(jìn)行考慮，導(dǎo)致同一目標(biāo)中像素點(diǎn)類(lèi)別預(yù)測(cè)結(jié)果不一致。通過(guò)在 SEGNET結(jié)構(gòu)中加入一條自上而下的通道，使得 SEGNET包含

2021-05-27 14:54:54

一種高精度的肝臟圖像自動(dòng)分割算法

在利用卷積神經(jīng)網(wǎng)絡(luò)分割肝臟邊界較模糊的影像數(shù)據(jù)時(shí)容易丟失位置信息，導(dǎo)致分割精度較低。針對(duì)該問(wèn)題，提出一種基于分水嶺修正與U-Net模型相結(jié)合的肝臟圖像自動(dòng)分割算法。利用U-Net分層學(xué)習(xí)圖像特征

2021-05-27 15:17:35

基于變分水平集模型的多相圖像分割

多相圖像分割通常利用多個(gè)水平集函數(shù)分別定義不同區(qū)域的特征函數(shù)，其極值求解問(wèn)題需要對(duì)多個(gè)函數(shù)分別求極值，計(jì)算效率較低。針對(duì)三維多相圖像，提出一種改進(jìn)的變分水平集模型，采用一個(gè)多層水平集函數(shù)的n層水平

2021-05-28 10:26:59

基于U-net分割的遙感圖像配準(zhǔn)方法

在利用航拍遙感圖像進(jìn)行土地測(cè)量與變化檢測(cè)時(shí)，需要對(duì)圖像進(jìn)行配準(zhǔn)處理。為實(shí)現(xiàn)目標(biāo)區(qū)域的高精度匹配，提出一種遙感圖像配準(zhǔn)方法。對(duì)圖像進(jìn)行U-net分割，以適用于小樣本數(shù)據(jù)集的處理，針對(duì)不同區(qū)域特征的誤差

2021-05-28 14:41:39

基于拆棍變分貝葉斯推斷的圖像分割算法

為提高圖像分割的抗噪魯棒性并解決分割數(shù)目的自適應(yīng)確定問(wèn)題，通過(guò)在聚類(lèi)標(biāo)簽先驗(yàn)概率的折棍構(gòu)造過(guò)程中建立 Markov隨機(jī)場(chǎng)，將空間相關(guān)性約束引λ Dirichlet過(guò)程混合模型的概率建模，使聚類(lèi)的空間

2021-06-04 15:27:33

基于Contourlet域下的聲吶圖像分割算法

水下環(huán)境復(fù)雜多變，導(dǎo)致聲吶技術(shù)成像后的圖像質(zhì)量差，影響目標(biāo)識(shí)別。為此，提出一種基于 Contourlet域下多尺度高斯馬爾可夫隨機(jī)場(chǎng)（GMRF）模型的水平集聲吶圖像分割算法。采用

2021-06-15 11:43:36

基于測(cè)地線(xiàn)活動(dòng)輪廓模型的合成孔徑雷達(dá)圖像分割

2021-07-02 11:10:31

淺談關(guān)于深度學(xué)習(xí)方法的圖像分割

許多計(jì)算機(jī)視覺(jué)任務(wù)需要對(duì)圖像進(jìn)行智能分割，以理解圖像中的內(nèi)容，并使每個(gè)部分的分析更加容易。今天的圖像分割技術(shù)使用計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)模型來(lái)理解圖像的每個(gè)像素所代表的真實(shí)物體，這在十年前是無(wú)法想象

2021-07-06 10:50:35

1981

改進(jìn)自適應(yīng)GACV的水下圖像分割算法研究

改進(jìn)自適應(yīng)GACV的水下圖像分割算法研究(通信電源技術(shù)20年第13期)-基于改進(jìn)自適應(yīng)GACV的水下圖像分割算法研究摘要論文針對(duì)水下彩色圖像對(duì)比度低、模糊、偏色等退化問(wèn)題，研究了幾何活動(dòng)輪廓模型

2021-09-22 15:32:10

使用OpenVINO? 部署PaddleSeg模型庫(kù)中的DeepLabV3+模型

下的DeepLabV3+路面語(yǔ)義分割模型轉(zhuǎn)換為OpenVINO ? 工具套件的IR模型并且部署到CPU上。 ? 為了使本文擁有更廣的受眾面，文章的目標(biāo)部署平臺(tái)選擇了CPU和iGPU。關(guān)于如何部署到邊緣設(shè)備例如Intel

2021-11-22 14:58:12

8970

數(shù)坤科技3D卷積神經(jīng)網(wǎng)絡(luò)模型用于肝臟MR圖像的精準(zhǔn)分割

該項(xiàng)研究采用了基于多序列的3D卷積神經(jīng)網(wǎng)絡(luò)模型，由數(shù)坤科技自主研發(fā)，用于肝臟MR圖像的精準(zhǔn)分割。

2022-04-02 16:06:11

3522

一個(gè)具有泛化性的小樣本語(yǔ)義分割（GFS-Seg）

訓(xùn)練語(yǔ)義分割模型需要大量精細(xì)注釋的數(shù)據(jù)，這使得它很難快速適應(yīng)不滿(mǎn)足這一條件的新類(lèi)，F(xiàn)S-Seg 在處理這個(gè)問(wèn)題時(shí)有很多限制條件。

2022-09-13 08:56:04

1542

當(dāng)UNet與HRNet碰撞會(huì)產(chǎn)生怎樣的火花？U-HRNet不做選擇

U-Net在一定程度上緩解了上述兩個(gè)問(wèn)題。然而，在U-Net中，每個(gè)階段只保留一個(gè)分辨率，不同尺度之間沒(méi)有融合，只有與殘差分支合并。作者認(rèn)為，HRNet的最大優(yōu)勢(shì)是能夠并行維護(hù)多尺度并始終執(zhí)行多尺度融合。

2022-11-07 14:27:00

978

在NGC上玩轉(zhuǎn)圖像分割！NeurIPS頂會(huì)模型、智能標(biāo)注10倍速神器、人像分割SOTA方案、3D醫(yī)療影像分割利器應(yīng)有盡有

PaddleSeg 近期帶來(lái)重大升級(jí)，覆蓋最新頂會(huì)模型、10 倍提速的智能標(biāo)注工具、實(shí)時(shí)人像分割 SOTA 方案、全新 3D 醫(yī)療影像分割方案等。歡迎廣大開(kāi)發(fā)者使用 NVIDIA 與飛槳聯(lián)合深度

2022-11-21 21:05:02

731

輕松學(xué)Pytorch之Deeplabv3推理

Torchvision框架中在語(yǔ)義分割上支持的是Deeplabv3語(yǔ)義分割模型，而且支持不同的backbone替換，這些backbone替換包括MobileNetv3、ResNet50、ResNet101。

2022-12-21 15:40:23

667

3D UX-Net：超強(qiáng)的醫(yī)學(xué)圖像分割新網(wǎng)絡(luò)

整體來(lái)說(shuō)，這些模型性能是越來(lái)越高，在幾個(gè)主流的 3D 數(shù)據(jù)基準(zhǔn)測(cè)試中也實(shí)現(xiàn)了大大小小的 SOTA，特別是 3D 醫(yī)學(xué)圖像分割這塊。當(dāng)然，時(shí)代在進(jìn)步，作為一名高科技前沿從業(yè)者本身也是需要不斷汲取新的知識(shí)營(yíng)養(yǎng)才能不被輕易的淘汰。

2023-02-01 15:57:50

1365

一文讀懂圖像分割

圖像分割（Image Segmentation）是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)重要基礎(chǔ)技術(shù)，是圖像理解中的重要一環(huán)。

2023-02-28 09:55:53

1229

ImgX-DiffSeg：基于DDPMs的3D醫(yī)學(xué)圖像分割

DDPM 是一種生成模型，可用于圖像去噪和分割。工作原理是模擬干凈圖像的概率分布，然后在圖像中添加噪點(diǎn)以生成噪聲版本。相反的，模型嘗試通過(guò)移除添加的噪點(diǎn)來(lái)對(duì)圖像進(jìn)行降噪。

2023-05-15 09:19:58

633

AI算法說(shuō)-圖像分割

語(yǔ)義分割是區(qū)分同類(lèi)物體的分割任務(wù)，實(shí)例分割是區(qū)分不同實(shí)例的分割任務(wù)，而全景分割則同時(shí)達(dá)到這兩個(gè)目標(biāo)。全景分割既可以區(qū)分彼此相關(guān)的物體，也可以區(qū)分它們?cè)?b class="flag-6" style="color: red">圖像中的位置，這使其非常適合對(duì)圖像中所有類(lèi)別的目標(biāo)進(jìn)行分割。

2023-05-17 14:44:24

810

SAM分割模型是什么？

SAM是一類(lèi)處理圖像分割任務(wù)的通用模型。與以往只能處理某種特定類(lèi)型圖片的圖像分割模型不同，SAM可以處理所有類(lèi)型的圖像。

2023-05-20 09:30:45

1376

近期分割大模型發(fā)展情況

SAM（Segment Anything Model）Meta 的 FAIR 實(shí)驗(yàn)室發(fā)布的一種最先進(jìn)的圖像分割模型，該模型將自然語(yǔ)言處理領(lǐng)域的prompt范式引入計(jì)算機(jī)視覺(jué)領(lǐng)域，可以通過(guò)點(diǎn)擊、框選和自動(dòng)識(shí)別三種交互方式，實(shí)現(xiàn)精準(zhǔn)的圖像分割，突破性地提升了圖像分割的效率。

2023-05-22 16:26:22

480

在AI愛(ài)克斯開(kāi)發(fā)板上用OpenVINO?加速YOLOv8-seg實(shí)例分割模型

《在 AI 愛(ài)克斯開(kāi)發(fā)板上用 OpenVINO 加速 YOLOv8 目標(biāo)檢測(cè)模型》介紹了在 AI 愛(ài)克斯開(kāi)發(fā)板上使用 OpenVINO 開(kāi)發(fā)套件部署并測(cè)評(píng) YOLOv8 的目標(biāo)檢測(cè)模型，本文將介紹在 AI 愛(ài)克斯開(kāi)發(fā)板上使用 OpenVINO 加速 YOLOv8-seg 實(shí)例分割模型。

2023-06-05 11:52:15

561

人體分割識(shí)別圖像技術(shù)的原理及應(yīng)用

人體分割識(shí)別圖像技術(shù)是一種將人體從圖像中分割出來(lái)，并對(duì)人體進(jìn)行識(shí)別和特征提取的技術(shù)。該技術(shù)主要利用計(jì)算機(jī)視覺(jué)和圖像處理算法對(duì)人體圖像進(jìn)行預(yù)處理、分割、特征提取和識(shí)別等操作，以實(shí)現(xiàn)自動(dòng)化的身份認(rèn)證

2023-06-15 17:44:49

635

沒(méi)你想的那么難 | 一文讀懂圖像分割

來(lái)源：圖靈Topia（ID：turingtopia）圖像分割（ImageSegmentation）是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)重要基礎(chǔ)技術(shù)，是圖像理解中的重要一環(huán)。近日，數(shù)據(jù)科學(xué)家

2023-05-16 09:21:44

570

DeepLabV3開(kāi)發(fā)板應(yīng)用

電子發(fā)燒友網(wǎng)站提供《DeepLabV3開(kāi)發(fā)板應(yīng)用.zip》資料免費(fèi)下載

2023-06-20 15:05:14

用OpenVINO? C++ API編寫(xiě)YOLOv8-Seg實(shí)例分割模型推理程序

本文章將介紹使用 OpenVINO 2023.0 C++ API 開(kāi)發(fā)YOLOv8-Seg 實(shí)例分割（Instance Segmentation）模型的 AI 推理程序。本文 C++ 范例程序的開(kāi)發(fā)環(huán)境是 Windows + Visual Studio Community 2022。

2023-06-25 16:09:44

650

在AI愛(ài)克斯開(kāi)發(fā)板上用OpenVINO?加速YOLOv8-seg實(shí)例分割模型

2023-06-30 10:43:54

420

什么是圖像分割？圖像分割的體系結(jié)構(gòu)和方法

圖像分割（Image Segmentation）是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)重要基礎(chǔ)技術(shù)，是圖像理解中的重要一環(huán)。前端時(shí)間，數(shù)據(jù)科學(xué)家Derrick Mwiti在一篇文章中，就什么是圖像分割、圖像分割架構(gòu)、圖像分割損失函數(shù)以及圖像分割工具和框架等問(wèn)題進(jìn)行了討論，讓我們一探究竟吧。

2023-08-18 10:34:04

2072

使用PyTorch加速圖像分割

2023-08-31 14:27:10

440

深度學(xué)習(xí)圖像語(yǔ)義分割指標(biāo)介紹

深度學(xué)習(xí)在圖像語(yǔ)義分割上已經(jīng)取得了重大進(jìn)展與明顯的效果，產(chǎn)生了很多專(zhuān)注于圖像語(yǔ)義分割的模型與基準(zhǔn)數(shù)據(jù)集，這些基準(zhǔn)數(shù)據(jù)集提供了一套統(tǒng)一的批判模型的標(biāo)準(zhǔn)，多數(shù)時(shí)候我們?cè)u(píng)價(jià)一個(gè)模型的性能會(huì)從執(zhí)行時(shí)間、內(nèi)存使用率、算法精度等方面進(jìn)行考慮。

2023-10-09 15:26:12

120

機(jī)器視覺(jué)（六）：圖像分割

基于閾值的分割方法是一種應(yīng)用十分廣泛的圖像分割技術(shù)，其實(shí)質(zhì)是利用圖像的灰度直方圖信息獲取用于分割的閾值，一個(gè)或幾個(gè)閾值將圖像的灰度級(jí)分為幾個(gè)部分，認(rèn)為屬于同一部分的像素是同一個(gè)物體。

2023-10-22 11:34:28

413

如何基于PaddlePaddle平臺(tái)訓(xùn)練并測(cè)試一個(gè)視盤(pán)圖像分割的基本模型

講講如何基于 PaddlePaddle 平臺(tái)，訓(xùn)練并測(cè)試一個(gè)視盤(pán)圖像分割的基本模型。 1.準(zhǔn)備為了實(shí)現(xiàn)這個(gè)實(shí)驗(yàn)，Python 是必不可少的，如果你還沒(méi)有安裝 Python，建議閱讀我們的這篇文章：超詳細(xì)Python安裝指南。在安裝前，確認(rèn)自己需要的 Paddl

2023-11-01 09:20:00

299