• 用卓越的智能(néng)視覺算(suàn)法賦能(néng)商業(yè)
    用卓越的智能(néng)視覺算(suàn)法賦能(néng)商業(yè) 基于正覺智能(néng)自(zì)主研發的AI視頻圖像分析算(suàn)法,提供軟硬一(yī)體交付形态,為(wèi)園區、樓宇、學校、社區、工(gōng)廠等場景提供基于AI識别模型的智能(néng)服務
    查看(kàn)詳情

行業(yè)前瞻

資訊分類

計算(suàn)機(jī)如何看(kàn)世界?如何看(kàn)懂(dǒng)世界?計算(suàn)機(jī)視覺基礎原理 

  • 分類:行業(yè)前瞻
  • 作者:
  • 來源:
  • 發布時間:2022-09-21
  • 訪問量:0

【概要描述】計算(suàn)機(jī)視覺是一(yī)門(mén)研究如何讓機(jī)器(qì)“看(kàn)見(jiàn)”的科學。進一(yī)步說,是指用攝像機(jī)和計算(suàn)機(jī)代替人眼對物(wù)體進行識别、跟蹤和測量,并進一(yī)步做圖形處理,然後用計算(suàn)機(jī)處理出更适合人眼觀察的圖像或傳輸到(dào)儀器(qì)上(shàng)進行檢測。

計算(suàn)機(jī)如何看(kàn)世界?如何看(kàn)懂(dǒng)世界?計算(suàn)機(jī)視覺基礎原理 

【概要描述】計算(suàn)機(jī)視覺是一(yī)門(mén)研究如何讓機(jī)器(qì)“看(kàn)見(jiàn)”的科學。進一(yī)步說,是指用攝像機(jī)和計算(suàn)機(jī)代替人眼對物(wù)體進行識别、跟蹤和測量,并進一(yī)步做圖形處理,然後用計算(suàn)機(jī)處理出更适合人眼觀察的圖像或傳輸到(dào)儀器(qì)上(shàng)進行檢測。

  • 分類:行業(yè)前瞻
  • 作者:
  • 來源:
  • 發布時間:2022-09-21
  • 訪問量:0
詳情

計算(suàn)機(jī)如何看(kàn)世界?如何看(kàn)懂(dǒng)世界?  

 

 

 

  • 人工(gōng)智能(néng)是來模拟人類認知能(néng)力的技(jì)術(shù)。人工(gōng)智能(néng)最核心的能(néng)力就(jiù)是根據給定的輸入,做出判斷和預測。例如:在人臉識别應用中,它是根據輸入的照(zhào)片判斷照(zhào)片中的人是誰。

 

  • 計算(suàn)機(jī)視覺是一(yī)門(mén)研究如何讓機(jī)器(qì)“看(kàn)見(jiàn)”的科學。進一(yī)步說,是指用攝像機(jī)和計算(suàn)機(jī)代替人眼對物(wù)體進行識别、跟蹤和測量,并進一(yī)步做圖形處理,然後用計算(suàn)機(jī)處理出更适合人眼觀察的圖像或傳輸到(dào)儀器(qì)上(shàng)進行檢測。

 

  • 計算(suàn)機(jī)視覺作為(wèi)一(yī)門(mén)科學學科,研究相(xiàng)關的理論和技(jì)術(shù),試圖建立一(yī)個(gè)能(néng)夠從(cóng)圖像或多(duō)維數據中獲取‘信息’的人工(gōng)智能(néng)系統,這裡(lǐ)的信息指的是香農定義的信息,可以用來幫助做“決策”。因為(wèi)感知可以看(kàn)作是從(cóng)感官信号中提取信息,所以計算(suàn)機(jī)視覺也可以看(kàn)作是研究如何讓人工(gōng)系統從(cóng)圖像或多(duō)維數據中“感知”的科學。

 

 

 

 

 

 


在技(jì)術(shù)分類上(shàng),依據應用場景一(yī)般分類為(wèi)工(gōng)業(yè)視覺和計算(suàn)機(jī)視覺

 

 

 

 

 

 

在應用分類上(shàng),分為(wèi)工(gōng)業(yè)檢測類以及肉眼可見(jiàn)類型檢測

 

 
工(gōng)業(yè)檢測類:瑕疵檢測、高(gāo)精度尺寸檢測、産品外觀檢測、工(gōng)器(qì)具外觀檢測、工(gōng)藝檢測(印花、噴塗等),替代人眼檢查
 
肉眼可見(jiàn)類檢測:動作檢測、物(wù)品檢測、顔色檢測、流程檢測、車輛檢測、人臉檢測,基本為(wèi)人眼可見(jiàn)的形态,主要為(wèi)減輕人員(yuán)大量檢查的攝像頭的時間
 
 
 
 
人的視覺,我們是怎麽看(kàn)懂(dǒng)事(shì)物(wù)的?
 
 
 
視網膜是含有光(guāng)感受器(qì)官和神經阻滞網絡的薄膜,光(guāng)刺激在視網膜上(shàng)經神經處理産生(shēng)的神經沖動沿視神經纖維傳出眼睛,通(tōng)過視覺神經傳出大腦(nǎo)皮層進行處理并最終引起知覺,或者說在大腦(nǎo)中刺激對光(guāng)刺激産生(shēng)影響,形成關于場景的表象,大腦(nǎo)皮層要完成一(yī)系列處理工(gōng)作,從(cóng)圖像存儲直到(dào)根據圖像做出響應。
 
 
 
 

STEP1 看(kàn)見(jiàn)事(shì)物(wù)

光(guāng)刺激視網膜接收,并通(tōng)過視網膜傳導。

 

 

STEP2 大腦(nǎo)處理

1. 參考存儲的圖像(素材)

2. 特征提取:例如形狀、顔色、位置、物(wù)理法則、聯想

3. 判斷确認

 

 

STEP3 進行描述

根據目标的特征、物(wù)理邏輯、聯想等手段确認唯一(yī)的答案後,進行描述。

 

 

 

 
 
 
 
計算(suàn)機(jī)的視覺,計算(suàn)機(jī)是怎麽看(kàn)懂(dǒng)事(shì)物(wù)的?
 
 
在計算(suàn)機(jī)視覺種主要研究的三維場景中的對象,包括人、物(wù)、環境三大塊,針對三維場景中的三維信息(幾何、表現、行為(wèi))處理。
 
 

STEP1  看(kàn)見(jiàn)事(shì)物(wù)

通(tōng)過數字攝像頭拍攝物(wù)體獲得物(wù)品得圖像數據。

 

 

STEP2 模型處理
 

1. 多(duō)層次特征提取:例如形狀、顔色、位置等

2. 分類

3. 壓縮

4. 關聯

 

 

STEP4 給出結果

根據目标的特征、物(wù)理邏輯等技(jì)術(shù)方式确認出多(duō)個(gè)答案,選取其中置信度較高(gāo)的進行描述。

 

 

  

 

 

 肉眼能(néng)分清的不代表計算(suàn)機(jī)可以識别

 

 

 

 

人類在判斷一(yī)件(jiàn)物(wù)品或者行為(wèi)時的時候是基于多(duō)年(nián)積累的經驗,并且帶有橫向的聯想,例如判斷是不是足球,你會(huì)聯想到(dào)國(guó)足踢過。計算(suàn)機(jī)做出的判斷隻能(néng)根據特征,還(hái)是人為(wèi)規定好的特征,當超出規定範圍的特征出現時,就(jiù)無法識别了。 通(tōng)過以上(shàng)說明,我們會(huì)了解人的感知過程和計算(suàn)機(jī)的識别有一(yī)定邏輯雷同,但也存在事(shì)實上(shàng)的差異,人眼中看(kàn)到(dào)的簡單事(shì)物(wù)也許對于計算(suàn)機(jī)來說是漫長(cháng)複雜(zá)的判斷過程與計算(suàn)公式,這是因為(wèi)計算(suàn)機(jī)描述畫(huà)面的過程與人類有差異。在采集素材的過程中,真實的環境對識别結果也會(huì)産生(shēng)較大影響,特别是光(guāng)線環境的變化,體現在戶外、室内的應用都會(huì)導緻準确率上(shàng)的差異。

 

關鍵詞:

掃二維碼用手機(jī)看(kàn)

地址:上(shàng)海市(shì)徐彙區浦北(běi)路(lù)7号中星城(chéng)1910号

電(diàn)話:4000-594188

版權所有 © 2021 上海立洋信息科技有限公司