① 百度圖片搜索引擎原理是如何實現的
圖片搜索的原理有三個步驟
1. 將目標圖片進行特徵提取,描述圖像的演算法很多,用的比較多的是:SIFT描述子,指紋演算法函數,bundling features演算法,hash function(散列函數)等。也可以根據不同的圖像,設計不同的演算法,比如圖像局部N階矩的方法提取圖像特徵。
2. 將圖像特徵信息進行編碼,並將海量圖像編碼做查找表。對於目標圖像,可以對解析度較大的圖像進行降采樣,減少運算量後在進行圖像特徵提取和編碼處理。
3. 相似度匹配運算:利用目標圖像的編碼值,在圖像搜索引擎中的圖像資料庫進行全局或是局部的相似度計算;根據所需要的魯棒性,設定閾值,然後將相似度高的圖片預保留下來;最後應該還有一步篩選最佳匹配圖片,這個應該還是用到特徵檢測演算法。
其中每個步驟都有很多演算法研究,圍繞數學,統計學,圖像編碼,信號處理等理論進行研究。
根據Neal Krawetz博士的解釋,原理非常簡單易懂。我們可以用一個快速演算法,就達到基本的效果。
這里的關鍵技術叫做"感知哈希演算法"(Perceptual hash algorithm),它的作用是對每張圖片生成一個"指紋"(fingerprint)字元串,然後比較不同圖片的指紋。結果越接近,就說明圖片越相似。下面是一個最簡單的實現:
第一步,縮小尺寸。
將圖片縮小到8x8的尺寸,總共64個像素。這一步的作用是去除圖片的細節,只保留結構、明暗等基本信息,摒棄不同尺寸、比例帶來的圖片差異。
第二步,簡化色彩。
將縮小後的圖片,轉為64級灰度。也就是說,所有像素點總共只有64種顏色。
第三步,計算平均值。
計算所有64個像素的灰度平均值。
第四步,比較像素的灰度。
將每個像素的灰度,與平均值進行比較。大於或等於平均值,記為1;小於平均值,記為0。
第五步,計算哈希值。
將上一步的比較結果,組合在一起,就構成了一個64位的整數,這就是這張圖片的指紋。組合的次序並不重要,只要保證所有圖片都採用同樣次序就行了。
得到指紋以後,就可以對比不同的圖片,看看64位中有多少位是不一樣的。在理論上,這等同於計算"漢明距離"(Hammingdistance)。如果不相同的數據位不超過5,就說明兩張圖片很相似;如果大於10,就說明這是兩張不同的圖片。
具體的代碼實現,可以參見Wote用python語言寫的imgHash.py。代碼很短,只有53行。使用的時候,第一個參數是基準圖片,第二個參數是用來比較的其他圖片所在的目錄,返回結果是兩張圖片之間不相同的數據位數量(漢明距離)。
這種演算法的優點是簡單快速,不受圖片大小縮放的影響,缺點是圖片的內容不能變更。如果在圖片上加幾個文字,它就認不出來了。所以,它的最佳用途是根據縮略圖,找出原圖。
實際應用中,往往採用更強大的pHash演算法和SIFT演算法,它們能夠識別圖片的變形。只要變形程度不超過25%,它們就能匹配原圖。這些演算法雖然更復雜,但是原理與上面的簡便演算法是一樣的,就是先將圖片轉化成Hash字元串,然後再進行比較。
② ps處理圖片的原理.
是的。
可以這樣理解。
但又有一點不一樣。
你打開的圖,它所有的灰度,飽合度、色相、透明度,如何排列像素……這些信息是包含在該圖里的。
PS打開該圖的時候,該圖還是該圖,沒有改變。你用PS編輯的時候,該圖的信息就改變了。
但是在「你存儲你改變過後的圖片」之前,該圖的改變只存在緩存里,並沒有改變圖片本身。
除非你存儲過後,該圖才被你改變。
如果你選擇「另存為」,那麼,你改變過後的圖會新生成一個文件,不會改變你的舊文件。
③ 美圖秀秀的工作原理是什麼
美圖秀秀的工作原理如下:
實時攝像頭磨皮和美白了,點擊拍攝按鈕之後放大眼睛,挺鼻,瘦臉,亮眼了。還去了痘痘和黑眼圈。本來相機會把臉拍平而且放大其瑕疵,美顏剛好遮蓋了這些。
美圖秀秀由美圖網研發推出,是一款免費圖片處理軟體,不用學習就會用,比Adobe Photoshop簡單很多。圖片特效、美容、拼圖、場景、邊框、飾品等功能,加上每天更新的精選素材,可以讓你1分鍾做出影樓級照片,還能一鍵分享到新浪微博、人人網、QQ空間。
④ 圖片搜索的工作原理是什麼大神們幫幫忙
元搜索引擎(Meta Search Engine 簡稱MSE),是一種建立在獨立搜索引擎基礎上,調用其它獨立搜索引擎的引擎,亦稱"搜索引擎之母(The mother of search engines)"。在這里,"元"(Meta)為"總的"、"超越"之意,元搜索引擎就是對多個獨立搜索引擎的整合、調用、控制和優化利用。相對於元搜索引擎,可被利用的獨立搜索引擎稱為"源搜索引擎"(Source Search Engine),或"成員搜索引擎"(Component Search Engine)。從功能上來講,元搜索引擎像是一個過濾通道:以多個獨立搜索引擎的輸出結果作為輸入,經過一番提取、剔除、萃取等操作,形成最終結果,然後將最終結果輸出給用戶。 搜索引擎的工作原理基本都是一樣的,利用一個叫網路蜘蛛的程序在網路上爬行,自動地遍歷Web來獲得的網路信息並保存到本地伺服器中.因此,我們通常所說的搜索引擎並不是真正的在搜索互聯網,而是通過用戶提供的關鍵詞,搜索引擎再根據此關鍵詞進行對其伺服器的資料庫進行搜索.為了保證用戶查找信息的精度和及時,搜索引擎需要建立並維護一個龐大的索引資料庫,從而能夠迅速的從中找到相關的信息.搜索引擎的工作過程一般來說可以看作三大步:從互聯網上爬取網頁->預處理->查詢服務
⑤ 遙感圖像分類中,支持向量機分類的原理是什麼
支持向量機方法是建立在統計學習理論的VC維理論和結構風險最小原理基礎上的,根據有限的樣本信息在模型的復雜性(即對特定訓練樣本的學習精度)和學習能力(即無錯誤地識別任意樣本的能力)之間尋求最佳折衷,以求獲得最好的推廣能力 。支持向量機將向量映射到一個更高維的空間里,在這個空間里建立有一個最大間隔超平面。在分開數據的超平面的兩邊建有兩個互相平行的超平面。建立方向合適的分隔超平面使兩個與之平行的超平面間的距離最大化。其假定為,平行超平面間的距離或差距越大,分類器的總誤差越小。
可以看看遙感軟體ENVI,裡面有這個功能,自己做一遍,再看看幫助裡面的說明和公式,估計理解更深刻。
⑥ 照片編輯器的照片編輯原理
照片編輯 軟體是一類對圖像進行分析、修復、美化、合成等處理的軟體。圖像分析,即指通過取樣和量化過程將一個以自然形式存在的圖像變換為適合計算機處理的數字形式,包括圖片直方圖、灰度圖等的顯示,圖像修復,即指通過圖像增強或復原,改進圖像的質量,包括去除噪點,修正數碼照片的廣角畸變,提高圖片對比度,消除紅眼等等,圖片合成,即指將多張圖片進行合並,實現圖片內容改變的過程,圖片合成通常需要通過摳圖實現,圖片合成的主要意義,在於通過摳圖的方式更換背景,或將多張圖片直接合成,譬如正片疊底、濾色、柔光等融合模式,都是圖片合成的方式。
⑦ 圖像識別是怎麼的運行原理
圖像的組成:圖像由什麼組成的,這個問題不是通常意義上的概念,它不是指圖片裡面有什麼我們可以看到的東西,而是圖像的光學組成概念。即圖像是由很多具備色彩種類、亮度等級等信息的基本像素點所組成的。
圖像的識別:計算機初始狀態只能識別像素點上的基本信息,這個和生物的視覺是一樣的,生物之所以可以分辨物體是由於生物神經系統對原始圖像處理後的結果。而計算機的圖像識別也是一個將原始光學信息進行邏輯分類處理的過程。
【圖為大腦神經元】
圖像識別的要點: 圖像識別編程就是對原始圖像點信息的綜合處理,圖像識別通常有輪廓識別、特徵識別、色彩識別、材質識別、物體識別等等。一般根據顏色、亮度等信息得出物體的輪廓,依據輪廓所對應的數據來確定輪廓的內容是什麼物體或是什麼特徵,及特徵及物體的判斷離不開輪廓及對應邏輯數據的處理。而材質識別的特點是根據問題的反光程度來識別,其同樣離不開輪廓的識別及邏輯數據的判斷。因此在圖像識別中,輪廓識別是重中之重。
圖像識別編程的要點:圖像識別編程時務必將通常的圖像概念刻意淡化而側重為視覺數據的邏輯化,並通宵人類識別數據是的依據。即人腦識別圖像的邏輯判斷依據從而得出正確的邏輯編程思路。
圖片編程的注意事項:圖片編程時不要將簡單的處理繁雜化,同時明確要識別圖像的目的及可以忽略細節的程度。盡量避免非邏輯必備信息的參雜,這個對於需要高速識別內容的項目尤為重要。
⑧ 圖像分類處理原理
1. 圖像分類處理的依據
圖像分類處理的依據就是模式識別的過程,即通過對各類地物的遙感影像特徵分析來選擇特徵參數,將特徵空間劃分為互不重疊的子空間並將圖像內各個像元劃分到各個子空間區,從而實現分類。這里特徵參數是指能夠反映地物影像特徵並可用於遙感圖像分類處理的變數,如多波段圖像的各個波段、多波段圖像的算術/邏輯運算結果、圖像變換/增強結果、圖像空間結構特徵等; 特徵空間是指由特徵變數組成的多維空間。
遙感影像中同一類地物在相同的條件下 ( 紋理、地形、光照及植被覆蓋等) ,應具有相同或相似的光譜信息特徵和空間信息特徵,從而表現出同類地物的某種內在的相似性。在多波段遙感的數字圖像中,可以粗略地用它們在各個波段上的像元值的連線來表示其光譜信息 ( 圖 4-22a) 。在實際的多維空間中,地物的像元值向量往往不是一個點,而是呈點群分布 ( 集群) 。同類地物的特徵向量將集群在同一特徵空間域,不同地物的光譜信息或空間信息特徵不同,因而將集群在不同的特徵的空間域 ( 圖 4-22b) 。在實際圖像中,不同地物的集群還存在有交叉過渡,受圖像解析度的限制,一個像元中可能包括有若干個地物類別,即所謂 「混合像元」,因此對不同集群的區分要依據它們的統計特徵來完成。
2. 圖像分類處理的關鍵問題
圖像分類處理的關鍵問題就是按概率統計規律,選擇適當的判別函數、建立合理的判別模型,把這些離散的 「集群」分離開來,並作出判決和歸類。通常的做法是,將多維波譜空間劃分為若干區域 ( 子空間) ,位於同一區域內的點歸於同一類。子空間劃分的標准可以概括為兩類: ①根據點群的統計特徵,確定它所應占據的區域范圍。例如,以每一類的均值向量為中心,規定在幾個標准差的范圍內的點歸為一類。②確定類別之間的邊界,建立邊界函數或判別函數。不論採取哪種標准,關鍵在於確定同一類別在多維波譜空間中的位置 ( 類的均值向量) 、范圍 ( 協方差矩陣) 及類與類邊界 ( 判別函數) 的確切數值。按確定這些數據是否有已知訓練樣本 ( 樣區) 為准,通常把分類技術分為監督和非監督兩類。非監督分類是根據圖像數據本身的統計特徵及點群的分布情況,從純統計學的角度對圖像數據進行類別劃分的分類處理方法。監督分類是根據已知類別或訓練樣本的模式特徵選擇特徵參數並建立判別函數,把圖像中各個像元點劃歸至給定類中的分類處理方法。
圖 4-22 某地數字圖像上主要幾種地物的光譜反射比曲線和集群分布
3. 監督分類與非監督分類的本質區別
監督分類與非監督分類的本質區別在於有無先驗知識。非監督分類為在無分類對象先驗知識的條件下,完全根據數據自身的統計規律所進行的分類; 監督分類指在先驗知識( 訓練樣本的模式特徵等先驗知識) 的 「監督」之下進行分類。非監督分類的結果可作為監督分類訓練樣本選擇的重要參考依據,同時,監督分類中訓練樣本的選擇需要目視解譯工作者、專家的地學知識與經驗作為支撐。
4. 遙感圖像分類的工作流程
①確定分類類別: 根據專題目的和圖像數據特性確定計算機分類處理的類別數與類特徵; ②選擇特徵參數: 選擇能描述各類別的特徵參數變數; ③提取分類數據: 提取各類別的訓練 ( 樣本) 數據; ④測定總體統計特徵: 或測定訓練數據的總體特徵,或用聚類分析方法對特徵相似的像元進行歸類分析並測定其特徵; ⑤分類: 用給定的分類基準對各個像元進行分類歸並處理; ⑥分類結果驗證: 對分類的精度與可靠性進行分析。
⑨ ps處理圖片的原理是什麼
圖像處理軟體有兩種,點陣圖軟體和矢量軟體
photoshop屬於點陣圖軟體,點陣圖亦稱為點陣圖像,也稱作像素
因此點陣圖軟體的原理,是通過改變像素的色相,透明度,飽和度,對比度等屬性,達到想要的圖像效果。
⑩ 百度圖片的以圖搜圖功能工作原理什麽什麽
圖像搜索引擎需要為在Web上瀏覽過的圖像建立索引信息,能夠進行圖像分析和判別,為圖像加註釋,存儲抽取出的索引信息建立索引庫,理想的圖像搜索引擎還應該能支持基於內容的圖像檢索。
圖像識別方法
1、自動查找圖形文:可以通過兩個HTML標簽,即IMG
SRC和HREF來檢測是否存在可顯示的圖像文件,IMG
SRC表示「顯示下面的圖像文件」,而HREF則表示「下面是一個鏈接」,這兩種標簽經常導向一個圖像文件。搜索引擎通過檢查文件擴展名來判斷鏈接的是否是圖像文件。如果文件擴展名是.GIF或.JPG,那它就是一個可顯示的圖像。
2、人工干預找出圖像並進行分類:即人工對網上的圖像及站點進行選擇。這種方法可以產生准確的查詢體系,但勞動強度太大,限制了處理圖像的數量。由於圖像不同於文本,需要人們按照各自的理解來說明其蘊含的意義,因此圖像檢索比起文本的查詢和匹配要困難得多。目前的圖像搜索引擎大多支持關鍵詞檢索和分類瀏覽兩種檢索方式,部分可提供可視屬性檢索,但也很有限。它們主要的檢索途徑有以下幾種:
a.
基於圖像外部信息:即根據圖像的文件名或目錄名、路徑名、鏈路、ALT標簽以及圖像周圍的文本信息等外部信息進行檢索,這是目前圖像搜索引擎採用最多的方法。在找出圖像文件後,圖像搜索引擎通過查看文件名或路徑名確定文件內容,但這取決於文件名或路徑名的描述程度。
b.
基於圖像內容特徵描述:這是一種語義層次的匹配。需要人工對圖像的內容(如物體、背景、構成、顏色特徵等)進行描述並分類,給出描述詞。檢索時,將主要在這些描述詞中搜索你的檢索詞。這種查詢方式是比較准確的,一般來講可以獲得較好的查准率。但需人工參與,勞動強度大,因而限制了可處理的圖像數量,並且需要一定的規范和標准,效果取決於人工描述的精確度。
c.
基於圖像形式特徵的抽取:由圖像分析軟體自動抽取圖像的顏色、形狀、紋理等特徵,建立特徵索引庫,用戶只需將要查找的圖像的大致特徵描述出來,就可以找出與之具有相近特徵的圖像。這是一種基於圖像特徵層次的機械匹配,特別適用於檢索目標明確的查詢要求(例如對商標的檢索)。產生的結果也是最接近用戶要求的。但目前這種較成熟的檢索技術主要應用於圖像資料庫的檢索,在網上圖像搜索引擎中應用這種檢索技術還具有一定的困難