對于人類而言,不僅可以通過眼睛“看清”周圍環(huán)境中的東西,還能“識別并理解”這些東西,對這些東西形成“認(rèn)知和決策”。
現(xiàn)在,盈泰德科技科技的技術(shù)人員正努力讓AI同樣做到這一點。從人類的三維視覺出發(fā),三維視覺智能已成為人工智能研究和應(yīng)用的熱門領(lǐng)域。
說到機器視覺,大家都不陌生,人工智能的很多技術(shù)是基于人的各種感觀的,其中視覺感觀就是非常重要的一環(huán),在機器視覺方面的很多技術(shù)已經(jīng)在工業(yè)界得到非常好的應(yīng)用。
隨著應(yīng)用的深入,越來越多的機器視覺技術(shù)進(jìn)入“三維視覺智能”階段,我們的眼睛不僅要看清某個東西,認(rèn)識某個東西,還要走到這個場景里面去,在三維世界里真實地感受場景,如同身臨其境。這就需要具有三維空間感知與認(rèn)知能力的智能,即三維視覺智能。三維視覺智能集合計算機圖形學(xué)、計算機視覺等領(lǐng)域的技術(shù)與傳統(tǒng)的人工智能、學(xué)習(xí)、大數(shù)據(jù)等很好地交叉融合。
機器人安裝LMI(一種利用結(jié)構(gòu)光獲取三維模型信息的主動式傳感器)掃描螺絲,能獲取目標(biāo)物體全方位的三維數(shù)據(jù)。機器人自己規(guī)劃掃描路徑,直到最后獲得一個完整的三維模型。
不僅要獲得場景的完整三維數(shù)據(jù),而且還要認(rèn)識每個物體到底是什么,要去理解場景里的每個物體,獲取物體的語義信息。同樣的道理,認(rèn)知的過程必須形成一個閉環(huán),機器人的實時決策能不能根據(jù)現(xiàn)有的三維數(shù)據(jù)對這個物體進(jìn)行識別。如果不可以,就要走到新的角度去獲取數(shù)據(jù)。
通過三維視覺與人工智能技術(shù)的結(jié)合,我們讓機器人更加智能化與功能化,讓機器人做更多人在現(xiàn)實生活中能夠做的事。機器人具備現(xiàn)場自主決策和執(zhí)行的能力,比如在工業(yè)流水線上可以幫助組裝配件,物流場景中搬箱子等。這樣的應(yīng)用,涉及到非常精細(xì)化的技術(shù),比如準(zhǔn)確高效的運動規(guī)劃,還有各種各樣的控制,智能的執(zhí)行等。