通過計算機(jī)視覺中的機(jī)器學(xué)習(xí)進(jìn)行對象檢測和分類,可以幫助照相機(jī)像人類一樣“看到”,識別出各種物理形狀,例如汽車,狗或人。
如何使用計算機(jī)視覺檢測人
數(shù)據(jù)科學(xué)家以及從智慧城市到零售再到監(jiān)視的廣泛行業(yè)中,對人類進(jìn)行實時檢測已成為一種重要趨勢??紤]似乎不再是科幻小說:
1、計數(shù)沿著小路或人行橫道的行人。
2、分析購物者的行為或停留時間。
3、家用安全攝像機(jī)可檢測訪客或入侵者。
實際上,這可能比您想象的要容易。
成功檢測圖像或視頻中的人物意味著您正在構(gòu)建將物體檢測和圖像分類結(jié)合起來的應(yīng)用程序??勺屇鷻z測圖像數(shù)據(jù)中對象的技術(shù)與當(dāng)前在許多行業(yè)中使用的流行視覺分類工具略有不同。
一方面,現(xiàn)在有了一個框架,可以以不同的準(zhǔn)確度檢測視頻中的特定對象。將識別出的對象在圖像中的位置與對對象類別的理解配對在一起,意味著您的應(yīng)用程序可以區(qū)分圖像一個區(qū)域中的人與可能被誤認(rèn)為人的對象(例如零售環(huán)境中的人體模型) 。
探索物體檢測意味著理解:
1、通過檢測圖像和視頻中的人物可以完成的工作
2、檢測人與人臉識別等其他技術(shù)有何不同
3、車輛檢測等一般物體檢測與人物檢測之間的關(guān)系
4、定義這些工具的概率問題
5、該技術(shù)的當(dāng)前和未來的現(xiàn)實世界工業(yè)4.0應(yīng)用
人體檢測的方式和方式
將對象檢測工具應(yīng)用于圖像和視頻可以完成什么工作?計算機(jī)視覺人員檢測可以完成三項不同的任務(wù):
1、從背景圖像中拾取對象
2、使用概率分?jǐn)?shù)將對象提議屬于某個類別(在這種情況下為人類)
3、使用xy起源以及身高和身長值定義擬議人員的邊界
示例:通過安全攝像機(jī)進(jìn)行物體檢測和人體形狀分類。
在較高的層次上,使用計算機(jī)視覺應(yīng)用程序?qū)D像進(jìn)行人體檢測時要考慮兩個因素。首先,存在技術(shù)方面的問題-如何識別圖像或視頻中的人物。第二部分是您可以如何處理結(jié)果,并且與從應(yīng)用程序中獲得的回報質(zhì)量有關(guān)。
對象檢測的工作原理
一般而言,解決如何檢測照片或視頻數(shù)據(jù)中的對象的問題始于圖像的系統(tǒng)劃分。首先,該工具將算法應(yīng)用于輸入以識別感興趣的區(qū)域。然后,機(jī)器將根據(jù)您的設(shè)置提出一系列對象建議。檢測的后步驟是根據(jù)模型對對象進(jìn)行分類,應(yīng)用概率閾值并返回接受的建議框架中的類別和位置。
在這種情況下,您要尋找的班級是人類。應(yīng)用程序通過使用深度學(xué)習(xí)人工智能系統(tǒng)對大量圖像進(jìn)行預(yù)訓(xùn)練的處理塊,在視野中檢測這些人為對象。這些處理模塊被稱為模型,可以對其進(jìn)行訓(xùn)練以識別人類可以看到的幾乎所有物體。
在計算機(jī)視覺應(yīng)用程序中實現(xiàn)人工檢測時,您可以使用預(yù)先訓(xùn)練的模型或自己提供模型。您給模型提供的數(shù)據(jù)越多,設(shè)備在識別所需對象以及學(xué)習(xí)如何為將來進(jìn)行改進(jìn)方面就會越好。
如何使用物體檢測
獲得輸出后,將取決于您如何使用它。您的用例將確定各種細(xì)節(jié),例如檢測閾值。一種情況下較好的物體檢測工具可能不適用于其他情況。
由于模型訓(xùn)練和多層深度處理的進(jìn)步,機(jī)器在過去的幾年中已經(jīng)有效地執(zhí)行了這些任務(wù)。例如,特征提取和比較技術(shù)的兩個早期先鋒Deepeep和DeepID已經(jīng)變得如此高效,以至于現(xiàn)在存在許多面向消費(fèi)者的示例:例如,人們現(xiàn)在使用該技術(shù)來解鎖其平板電腦和手機(jī)。
云處理代表了CV的一項重要突破,將強(qiáng)大的資源交付給各地的開發(fā)人員。但是,新的CV平臺可輕松訪問開放的API平臺,從而為開發(fā)人員提供了更大的靈活性?,F(xiàn)在,可以在邊緣的設(shè)備上構(gòu)建深度學(xué)習(xí)應(yīng)用程序。您無需成為計算機(jī)視覺專家,也無需依賴云連接來利用核心計算機(jī)視覺服務(wù)(例如對象檢測)來處理和分析圖像。現(xiàn)在,各種規(guī)模的企業(yè)都可以在資源受限的低功耗設(shè)備上構(gòu)建和部署計算機(jī)視覺應(yīng)用程序。
在比您想象的更少的時間內(nèi)開始構(gòu)建對象檢測器。
人體檢測與物體檢測的應(yīng)用
檢測人和其他物體之間有區(qū)別。例如,制造中的對象檢測與大多數(shù)情況下的人員檢測有很大不同。
在工作場所,Rvsto Vision可以幫助工人安全或優(yōu)化人機(jī)交互。
制造對象檢測應(yīng)用程序可能涉及管道跟蹤或機(jī)器人行為分析,或使用計算機(jī)視覺分析微觀缺陷。同一行業(yè)中的人類檢測目標(biāo)可能更適合于操作的其他方面。例如,AI分析可能能夠利用現(xiàn)有的安全攝像機(jī)饋送來提高工廠工人的安全性,補(bǔ)充現(xiàn)有的做法和保障措施。AI CV工具能夠檢測對象類型(而不僅僅是對象的存在或移動)的能力實現(xiàn)了這種多功能性。
如何設(shè)定成功的機(jī)率
分類是物體檢測的核心概念之一。該模型接受圖像輸入,并根據(jù)其訓(xùn)練方式返回建議的對象類。例如,您可能構(gòu)建一個簡單的人體檢測應(yīng)用程序以瀏覽一系列圖像并尋找人。它將圖像與模型對人類是(不是)人類的理解進(jìn)行比較,然后為您輸入的每一個輸入返回概率值。這通常是一個從零到一百的百分比值,表示該程序?qū)φ掌腥祟惔嬖诘男判摹?/p>
幾乎每個對象檢測應(yīng)用程序都非常關(guān)注被檢測對象是提議類成員的可能性。通常,對象檢測算法定義的每個區(qū)域都會分配一個概率分?jǐn)?shù)。通過各種方法確保的這些分?jǐn)?shù)的平均值將返回建議對象為人的總概率。這些數(shù)字可能會由于多種因素而有所不同:
1、模型中的數(shù)據(jù)量和訓(xùn)練水平
2、對圖像執(zhí)行的分析類型
3、數(shù)據(jù)輸入的質(zhì)量
4、物體相對于總圖像的尺寸
例如,高精度,低速分析可能從大量的框開始,并應(yīng)用對它們進(jìn)行排序的規(guī)則,以尋找可能的結(jié)果。較低精度的快速分析可能會采用網(wǎng)格并分析模型中每個類的存在的每個部分。不管您打算采用哪種流程,您的應(yīng)用程序目標(biāo)都將決定您在輸出時所需的概率。
較重要的是要了解嵌入式設(shè)備的硬件或類型,以及用例目標(biāo)對于建立成功的開發(fā)周期很重要。了解您的選擇是找到理想實現(xiàn)的第一步。
了解面部檢測與面部識別
面部識別和面部檢測有一些相似之處,特別是在技術(shù)方面,但是在實用性方面有所不同。在查看對象檢測平臺或模型時,請確保您知道其中的區(qū)別:
1、面部識別可以根據(jù)人的特征來識別他們,
2、面部檢測可發(fā)現(xiàn)個人面孔,無需個人識別
面部識別通過將其面部特征與已知圖像或一組圖像(例如護(hù)照控制站或用于安全訪問的身份檢查點(diǎn))相匹配來識別一個人。
面部檢測用于對物理空間中的人進(jìn)行計數(shù),還可以用于區(qū)分空間的進(jìn)入與退出,或看廣告或物體所花費(fèi)的時間/凝視時間。
面部識別和面部檢測都使用對象檢測框架來對視野中的對象進(jìn)行分類和定位。人臉檢測將獲取某種類型的圖像輸入,檢查對象的人物或面部類別并將其放置在框架中。此外,面部識別還將挑選出眼睛,嘴巴和其他各種特征,以與已知數(shù)據(jù)集進(jìn)行比較。
該過程的通用技術(shù)方面或多或少在相似之處結(jié)束。目標(biāo)通常大不相同。盡管人臉識別可以找到人臉并分析其特征,但是大多數(shù)人臉檢測工具需要確認(rèn)人的存在并確定其位置。
這給您選擇。例如,在一家商店中,具有面部檢測功能的解決方案可以計算出顧客的數(shù)量以及在商店各個部分所花費(fèi)的時間,而面部識別可以用于識別顧客數(shù)據(jù)集并將其排除在顧客數(shù)據(jù)集中。
如何選擇較佳的物體檢測方法
與每項新興技術(shù)一樣,在計算機(jī)視覺方面,有很多技術(shù)術(shù)語可能會引起混淆或被視為同義詞。有分類,檢測,跟蹤,計數(shù)等等。但是,較大的困惑點(diǎn)之一是物體檢測和圖像分類。在較基本的層次上,分類和檢測之間的區(qū)別很簡單:
1、分類基于對內(nèi)容的分析將預(yù)測應(yīng)用于圖像。
2、檢測可定位圖像中的對象。
聯(lián)系我們,并使用我們的平臺輕松構(gòu)建對象檢測器應(yīng)用并將其部署到您的電路板上。
當(dāng)對象分類起作用時
分類是計算機(jī)視覺中的主要挑戰(zhàn),并且通常是對象檢測的先決條件。在這里,通常會利用大數(shù)據(jù)-需要大量信息來訓(xùn)練能夠識別各種對象的通用模型。定制模型通常還需要許多正面和負(fù)面的例子。還有其他因素也會起作用,例如圖像中的對象大小,圖片質(zhì)量等。
當(dāng)然,將對象放在特定類別中是檢測的有用元素。實際上,一旦您超過了識別對象存在的門檻,對它們進(jìn)行分類就成為許多應(yīng)用程序中的下一個主要步驟。
該過程本身也很有用。例如,它可以幫助自動注釋數(shù)據(jù)庫項目。但是,由于嚴(yán)格分類只能提供描述存在一類物體的可能性的概率表或一組表,因此僅憑它就不能促進(jìn)檢測,跟蹤,定位或其他類似任務(wù)。
較重要的是,對對象進(jìn)行分類是檢測圖像和視頻中人物的必要先決條件。畢竟,對于CV工具而言,人類是一類視覺對象。諸如YOLO之類的快速掃描工具可能是個例外,它們會針對對象的存在進(jìn)行預(yù)測,而與對象的類無關(guān)。在這種類型的系統(tǒng)中的單類模型中,分類和檢測實際上將同時發(fā)生。在任何情況下,即使檢測對象的過程幾乎總是依賴于分類,但并非所有分類任務(wù)都須是對象檢測任務(wù)。
將檢測擴(kuò)展到對象跟蹤
跟蹤對象是對象檢測的有用的應(yīng)用程序。在檢測到某個人之后,您可能希望通過零售設(shè)置中的購物管道來跟蹤主題,或者例如跟蹤并整理多個不同檢測輸入流上的行為。
零售熱圖通過使用計算機(jī)視覺對象檢測和跟蹤從安全攝像機(jī)收集的數(shù)據(jù)來確定客戶的流量模式和在銷售地點(diǎn)花費(fèi)的時間。
假設(shè)您是一家零售商,并為特定產(chǎn)品設(shè)定了銷售目標(biāo)。您可以通過跟蹤互動后的客戶行為來分析員工傳達(dá)促銷信息的有效性。如果在到達(dá)客戶時收到有關(guān)促銷的消息,那么該客戶會立即還是在以后的購物經(jīng)歷中購買商品?跨一系列商店攝像機(jī)的對象跟蹤可以幫助您了解溝通策略的有效性。
將檢測與對象計數(shù)一起使用
您可以優(yōu)化應(yīng)用程序以進(jìn)一步處理檢測到的對象的另一種方法是對它們進(jìn)行計數(shù)。如果您具有某些類型的變量,這將成為一個復(fù)雜的問題。例如,在決定如何分配安全資源時,大批人群通過多個訪問點(diǎn)進(jìn)入和離開節(jié)日場地可能構(gòu)成挑戰(zhàn)。通過使用具有嵌入式計數(shù)功能的固定式CV攝像機(jī)或無人機(jī),安全公司可以獲得準(zhǔn)確,更新的人口計數(shù)和密度數(shù)據(jù),以告知人員決策。
對象計數(shù)通常要求您對對象進(jìn)行分類。但是,除了交叉檢查所有位置值都不相同之外,您不必返回其位置。因此,對象計數(shù)更多地是檢測的子集。
構(gòu)建一個應(yīng)用來計數(shù)或跟蹤對象?開始輕松地部署到嵌入式設(shè)備。?
何時使用工具組合
當(dāng)然,將人工智能和智能視覺帶入嵌入式設(shè)備的實際用例不僅需要一種核心計算機(jī)視覺服務(wù),還需要更多的服務(wù)。您可能希望以各種功能一起使用的方式使用它們,并使您的應(yīng)用程序或設(shè)備更智能。但是,將各種計算機(jī)視覺功能組合到邊緣設(shè)備上的應(yīng)用程序時,需要考慮許多因素。
從理論上講,這聽起來不錯,并且在實踐中也可以起作用。這是一個使用所有這三種計算機(jī)視覺技術(shù)的假設(shè)示例。
問題:您要在有人進(jìn)入商店時檢測他們,并確定他們在特定地點(diǎn)移動時與特定燈具交互的可能性。
對象檢測:您將編寫并訓(xùn)練一個人機(jī)交互模型來檢測您的設(shè)備和人,并使客戶與同事區(qū)分開。
對象跟蹤:您將實現(xiàn)跟蹤功能,以在檢測到商店中的客戶后跟蹤他們,并記錄他們與顯示器交互的詳細(xì)信息。
對象計數(shù):對象檢測可對指定類別中的單個對象進(jìn)行計數(shù),例如對人員進(jìn)行計數(shù)或?qū)μ囟óa(chǎn)品進(jìn)行計數(shù)。
結(jié)合計算機(jī)視覺原語,零售商可以通過計算在顯示器前停下的顧客數(shù)量,花費(fèi)在看產(chǎn)品或通訊上的時間以及看該產(chǎn)品是否是放入購物車并購買。
如何在嵌入式設(shè)備上實現(xiàn)計算機(jī)視覺
從無人駕駛汽車,交通監(jiān)控到智能城市和交通中心,物聯(lián)網(wǎng)嵌入式設(shè)備已被用作主要或輔助工具。對象檢測對于各個行業(yè)的應(yīng)用程序很有用:
1、零售
2、安全
3、農(nóng)業(yè)
4、衛(wèi)生保健
5、制造業(yè)
現(xiàn)在,對象檢測在準(zhǔn)確性和速度方面正在趕上人類,現(xiàn)在是將深度學(xué)習(xí)計算機(jī)視覺AI交付日常開發(fā)人員的時候了。工具在那里,處理負(fù)擔(dān)得起,其價值正等待添加到現(xiàn)有架構(gòu)中。
現(xiàn)有的家庭安全攝像機(jī)或日常網(wǎng)絡(luò)攝像機(jī)可以通過alwaysAI技術(shù)進(jìn)行升級,以更準(zhǔn)確地通知所有者攝像機(jī)檢測到的運(yùn)動源,從而消除了落葉引起的虛假信號,同時區(qū)分了動物和人。
您可能會對當(dāng)前的某些相機(jī)和設(shè)備可以在何種程度上集成人工智能感到驚訝,即使它們處于資源受限,低功耗的環(huán)境中,也沒有網(wǎng)絡(luò)連接或無法訪問云計算。
為您的企業(yè)部署計算機(jī)視覺應(yīng)用程序
想象一下具有CV功能的邊緣設(shè)備可以為您的企業(yè)做些什么。然后,獲取實現(xiàn)它所需的反饋和基礎(chǔ)。有了正確的開發(fā)環(huán)境和支持,您會發(fā)現(xiàn)這些應(yīng)用程序很容易實現(xiàn)。