視覺是人類強大的感知方式。它為人們提供了大量關于周圍環境的信息,使人們能夠有效地與周圍環境互動。據統計,80%以上的人類從外部世界接收的信息是通過視覺獲得的,50%的大腦皮層參與視覺功能的運行。
芯片采購網專注于整合國內外授權IC代理商現貨資源,芯片庫存實時查詢,行業價格合理,采購方便IC芯片,國內專業芯片采購平臺。
有許多有趣的視覺發現,比如螳螂蝦的眼睛可以檢測到偏振光。人眼和普通相機只能感知光的強度信息,而不能檢測光的偏振信息。昆士蘭大學的研究人員發現,螳螂蝦的復眼(見圖1-2)可以檢測到偏振光。根據生物醫學和光學的理論知識,生物組織的特征與偏振信息有關,因此螳螂蝦的眼睛可以診斷生物組織的病變。此外,蜻蜓和其他昆蟲有復眼結構(見圖1-3)。蜘蛛有很多眼睛。青蛙的眼睛只能看到動態場景,狗對顏色信息的分辨率很低。
圖1-2螳螂蝦的眼睛
圖1-3蜻蜓的眼睛
那么,介紹生物視覺功能后,機器視覺是什么?
機器視覺是自動處理和報告圖像是什么的過程,即用于識別圖像中的內容,如自動目標識別。
機器視覺一般以計算機為中心,主要由視覺傳感器、高速圖像采集系統、特殊圖像處理系統等模塊組成。
根據David A.Forsyth和Jean Ponce計算機視覺的定義是利用幾何、物理和學習理論來建立模型,從而使用統計方法來處理數據。它是指在徹底了解相機性能和物理成像過程的基礎上,通過簡單個像素值的簡單推理,將多個圖像中可能獲得的信息整合成相互關聯的整體,確定像素之間的連接,以便相互分離或推斷一些形狀信息,然后使用幾何信息或概率統計來識別對象。
考慮到系統的輸入和輸出模式,機器視覺系統的輸入是圖像或圖像序列,輸出是描述。此外,機器視覺由特征測量和基于這些特征的模式識別兩部分組成。
機器視覺不同于圖像處理。圖像處理的目的是使圖像處理后更好。圖像處理系統的輸出仍然是圖像,機器視覺系統的輸出是與圖像內容相關的信息。圖像處理可分為低級圖像處理、中級圖像處理和高級圖像處理。處理內容包括圖像增強、圖像編碼、圖像壓縮、圖像恢復和重構。
發展01機器視覺
圖1-4顯示了20世紀70年代以來機器視覺發展過程中的一些主題,包括數字圖像處理和積木世界,20世紀80年代的卡爾曼濾波器正則化,90年代的圖像分割,基于統計的圖像處理,以及21世紀計算攝像和機器視覺的深度學習。
圖1-4機器視覺發展過程中的一些主題
1.20世紀70年代
機器視覺始于20世紀70年代早期,被視為模擬人類智能并賦予機器人智能行為的感知組成部分。當時,麻省理工大學、斯坦福大學、卡內基等人工智能和機器人的一些早期研究人員·梅隆大學的研究人員認為,解決視覺輸入問題應該是解決高水平推理和規劃等更困難問題的簡單步驟。例如,1966年,麻省理工大學Marvin Minsky讓他的本科生Gerald Jay Sussman將相機連接到計算機上,讓計算機描述它所看到的。現在,這些看似簡單的問題并不容易解決。
20世紀60年代出現了數字圖像處理。與現有的數字圖像處理領域不同,機器視覺希望從圖像中恢復實物的三維結構,從而獲得完整的場景理解。場景理解的早期嘗試包括提取物體(即積木世界)的邊緣,然后從二維線的拓撲結構推斷其三維結構。此外,邊緣檢測也是一個活躍的研究領域。
20世紀70年代,人們還研究了物體的三維建模。Barrow、Tenenbaum與Marr通過表面朝向和陰影恢復三維結構,提出了理解亮度和陰影變化的方法。當時,有一些更定量的機器視覺方法,包括基于特征的三維視覺對應(stereo correspondence)基于亮度的算法和光流(optica lflow)與此同時,關于恢復三維結構和相機運動的研究也開始出現。
另外,David Marr關于(視覺)信息處理系統達的三個層次:
1)計算理論:計算(任務)的目的是什么?已知或可以對這個問題施加的約束是什么?
2)表達和算法:如何表達輸入、輸出和中間信息?計算預期結果的算法是什么?
3)硬件實現:表達和算法如何反映在實際硬件上,即生物視覺系統或特殊硅片上?相反,硬件約束如何用于指導表達和算法的選擇?隨著機器視覺對芯片計算能力需求的不斷增加,這個問題再次出現JRC代理次變得很重要。
2.20世紀80年代
20世紀80年代,圖像金字塔和規模空間開始廣泛應用于從粗到精的對應點搜索。20世紀80年代末,圖像金字塔開始被一些應用中小波變換所取代。
從X到形狀的方法出現在三維視覺重建中,包括從陰影到形狀,從光度三維視覺到形狀,從紋理到形狀,從聚焦到形狀。在此期間,探索更準確的邊緣和輪廓檢測方法是一個活躍的研究領域,包括引入動態進化輪廓跟蹤器,如Snake模型。如果將三維視覺、光流、X到形狀和邊緣檢測算法作為變分優化問題進行處理,則可以使用相同的數學框架進行統一描述,并可以使用正則方法來增加魯棒。此外,20世紀90年代卡爾曼濾波器和三維距離數據(range data)在過去的十年里,處理仍然是一個非常活躍的研究領域。
3.20世紀90年代
視覺發展如下:
1)在識別中使用投影不變量的研究呈爆炸性增長,可以有效地用于從運動到結構的問題。許多最初的研究都是針對投影重建的,它不需要相機校準的結果。與此同時,一些人提出了有效解決近似正交投影問題的因素分解方法,后來擴展到透視投影。該領域開始采用全局優化方法,后來被認為與攝影測量中常用的光束平差法有關。
2)使用顏色和亮度進行精細測量,并將其與精確的輻射傳輸和形成彩色圖像的物理模型相結合。這項工作始于20世紀80年代,形成了一個名為基于物理的視覺(physics-based visio)子領域。
3)光流方法不斷改進。
4)在密集三維視覺對應算法方面也取得了很大進展。最大的突破可能是使用圖片切割(graph cut)全局優化算法。
5)能產生完整三維表面的多視角立體視覺算法。
6)跟蹤算法也得到了很多改進,包括使用活動輪廓方法的輪廓跟蹤(如蛇形、粒子濾波和水平集)和基于亮度的跟蹤。
7)統計學習方法開始流行,如人臉識別的主要成分分析。
3.21世紀
在21世紀,計算機視覺和計算機圖形的交叉越來越明顯,特別是在基于圖像的建模和繪制的交叉領域。此外,計算攝像發揮著越來越重要的作用,包括光場獲取和繪制以及通過多曝光實現的高動態范圍成像。目標識別中基于特征的方法(結合學習方法)越來越突出,開發了更高效、更復雜的全球優化問題。
最后一個趨勢是復雜機器學習方法在計算機視覺中的應用,特別是近年來,基于深度學習的機器學習方法在圖像和視頻中的應用。
02機器視覺與其他領域的關系
機器視覺是一門交叉學科,它與許多領域有關,特別是機器視覺和計算機視覺之間的關系,有些學者認為兩者是一樣的,有些人認為兩者是不同的,圖1-5顯示了計算機視覺、圖像處理、人工智能、機器人控制、信號處理、成像等。在相關學科中,人工智能、機器人控制等概念都有明確的定義。成像是表示或重構客觀物體形狀及相關信息的學科。
圖1-5機器視覺與其他領域的關系
圖像處理主要基于現有圖像生成新圖像,可通過噪聲抑制、模糊、邊緣增強等處理實現。模式識別的主要任務是對模式進行分類。機器視覺的核心問題是從一個或多個圖像中生成符號描述。計算機視覺和計算機圖形學是一個相互關聯和相反的過程。計算機圖形學的目的是呈現一些真實或非真實的場景,即通過虛擬建模處理場景,然后使用計算機呈現;計算機視覺是通過收集圖像來獲取真實場景的信息。
- 彭博:蘋果將于9月7日發布iPhone 14,或16日上架
- 通富微電基板類封裝
- 什么是光學防抖 光學防抖的原理是什么【詳解】
- x86架構當頭一棒!Intel/AMD另一個超級大客戶跑了
- 意大利半導體發布高集成度汽車規則音頻放大器,具有高清音質和G能效
- 航天級IC助推詹姆斯·韋伯太空望遠鏡深入探索宇宙的奧秘
- 2021年,韋爾股份凈利潤達到44.76億元
- 英飛凌深耕傳感技術 助力健康檢測
- 文泰科技旗下安世半導體擬投資 30 東莞封測廠擴建1億元
- 寧德時代董事長曾玉群本周將前往韓國會見現代汽車集團高管
- 穩步前行,IDC中國制造業PLM市場份額報告正式發布
- 新思科技新增CODE V和LightTools提高光學產品開發效率的互操作功能