在過去的幾年中,計算機視覺工具已經(jīng)出現(xiàn)了巨大的增長在過去的十年中,計算機視覺的采用一直在加速發(fā)展,由于其在物聯(lián)網(wǎng)、制造業(yè)、醫(yī)療保健服務、安全性等領(lǐng)域的應用,近來出現(xiàn)了各種計算機視覺工具的使用激增的趨勢。
計算機視覺已經(jīng)發(fā)展到一定程度,在生產(chǎn)和生活中應用廣泛。此外,GPU等硬件以及機器學習設備和結(jié)構(gòu)的進步,使計算機視覺在當今時代更加引人關(guān)注。一些重要的云服務提供商,例如Google,Microsoft和AWS,都加入了成為開發(fā)者行列。但是,選擇哪個工具,小編今天大概羅列了一些供大家參考!
OpenCV
OpenCV是一個基于BSD許可(開源)發(fā)行的跨平臺計算機視覺和機器學習軟件庫,可以運行在Linux、Windows、Android和Mac OS操作系統(tǒng)上。[1] 它輕量級而且高效——由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時提供了Python、Ruby、MATLAB等語言的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法。
OpenCV用C++語言編寫,它具有C ++,Python,Java和MATLAB接口,并支持Windows,Linux,Android和Mac OS,OpenCV主要傾向于實時視覺應用,并在可用時利用MMX和SSE指令, 如今也提供對于C#、Ch、Ruby,GO的支持
TensorFlow是一個基于數(shù)據(jù)流編程(dataflow programming)的符號數(shù)學系統(tǒng),被廣泛應用于各類機器學習(machine learning)算法的編程實現(xiàn),其前身是谷歌的神經(jīng)網(wǎng)絡算法庫DistBelief [1] 。Tensorflow擁有多層級結(jié)構(gòu),可部署于各類服務器、PC終端和網(wǎng)頁并支持GPU和TPU高性能數(shù)值計算,被廣泛應用于谷歌內(nèi)部的產(chǎn)品開發(fā)和各領(lǐng)域的科學研究
TensorFlow 2.0鼓勵執(zhí)行針對圖片和語音識別,對象檢測,推薦,強化學習等進行了調(diào)整的預先準備的模型。此類參考模型使您可以利用獨特的最佳實踐,并在開始時就建立自己的精英解決方案。
Matlab
MATLAB是美國MathWorks公司出品的商業(yè)數(shù)學軟件,用于數(shù)據(jù)分析、無線通信、深度學習、圖像處理與計算機視覺、信號處理、量化金融與風險管理、機器人,控制系統(tǒng)等領(lǐng)域。
MATLAB是matrix&laboratory兩個詞的組合,意為矩陣工廠(矩陣實驗室),軟件主要面對科學計算、可視化以及交互式程序設計的高科技計算環(huán)境。它將數(shù)值分析、矩陣計算、科學數(shù)據(jù)可視化以及非線性動態(tài)系統(tǒng)的建模和仿真等諸多強大功能集成在一個易于使用的視窗環(huán)境中,為科學研究、工程設計以及必須進行有效數(shù)值計算的眾多科學領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設計語言(如C、Fortran)的編輯模式。
MATLAB和Mathematica、Maple并稱為三大數(shù)學軟件。它在數(shù)學類科技應用軟件中在數(shù)值計算方面首屈一指。MATLAB可以進行矩陣運算、繪制函數(shù)和數(shù)據(jù)、實現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語言的程序等。MATLAB的基本數(shù)據(jù)單位是矩陣,它的指令表達式與數(shù)學、工程中常用的形式十分相似,故用MATLAB來解算問題要比用C,F(xiàn)ORTRAN等語言完成相同的事情簡捷得多,并且MATLAB也吸收了像Maple等軟件的優(yōu)點,使MATLAB成為一個強大的數(shù)學軟件。在新的版本中也加入了對C,F(xiàn)ORTRAN,C++,JAVA的支持。
CUDA
CUDA(Compute Unified Device Architecture),是顯卡廠商NVIDIA推出的運算平臺。CUDA是一種由NVIDIA推出的通用并行計算架構(gòu),該架構(gòu)使GPU能夠解決復雜的計算問題。它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計算引擎。開發(fā)人員可以使用C語言來為CUDA架構(gòu)編寫程序,C語言是應用最廣泛的一種高級編程語言。所編寫出的程序可以在支持CUDA的處理器上以超高性能運行。CUDA3.0已經(jīng)開始支持C++和FORTRAN。
Theano
Theano是可以在CPU或GPU上運行的快速Python數(shù)字庫。它是由加拿大蒙特利爾大學的LISA組(現(xiàn)為MILA)創(chuàng)建的。Theano是用于控制和評估數(shù)學表達式(尤其是矩陣值表達式)的增強編譯器。
SimpleCV
SimpleCV是用于構(gòu)建計算機視覺應用程序的系統(tǒng)。它使您可以使用各種類似OpenCV,pygame等的大量計算機視覺工具。如果您不希望深入了解圖像處理,而只需要完成工作,則可以使用此工具。如果您需要快速進行原型制作,SimpleCV將為您提供最佳服務。
Keras
Keras是一個深度學習的Python庫,它結(jié)合了不同庫的元素,例如Tensorflow,Theano和CNTK。Keras在Tensorflow之上運行,在諸如Scikit-learn和PyTorch等競爭者中處于有利位置。
Keras可以在TensorFlow,Microsoft Cognitive Toolkit,Theano或PlaidML上運行。旨在用于深度神經(jīng)網(wǎng)絡的快速實驗,它圍繞便利性,測得的質(zhì)量和可擴展性展開。Keras遵循降低認知負擔的最佳實踐:它提供穩(wěn)定且基本的API,并限制了常規(guī)用例所需的用戶操作數(shù)。
GPUImage
它是基于OpenGL ES 2.0的框架,該框架允許將GPU加速的效果和通道應用于實時運動視頻、圖片和電影。在GPU上運行自定義通道需要大量代碼來進行設置和保持。
YOLO
YOLO是一個專門為實時處理而設計的對象檢測系統(tǒng)。YOLO是一個先進的實時目標檢測系統(tǒng),由來自華盛頓大學的josephredmon和alifarhadi創(chuàng)建。他們的算法將一個神經(jīng)網(wǎng)絡應用于整個圖片,神經(jīng)網(wǎng)絡將圖片分割成一個網(wǎng)格,并用檢測到的項目標記區(qū)域。
BoofCV
BoofCv是用于實時機器人技術(shù)和計算機視覺應用程序的開源Java庫,該庫已獲得Apache 2.0許可,可用于學術(shù)用途和商業(yè)用途。
涵蓋了從低層次的圖像處理,包括低層次的圖像識別和圖像處理。
審核編輯 :李倩
-
計算機視覺
+關(guān)注
關(guān)注
9文章
1708瀏覽量
46676 -
機器學習
+關(guān)注
關(guān)注
66文章
8499瀏覽量
134333 -
OpenCV
+關(guān)注
關(guān)注
32文章
642瀏覽量
42650
原文標題:?十大計算機視覺工具
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
【小白入門必看】一文讀懂深度學習計算機視覺技術(shù)及學習路線

評論