㈠ 南方CASS如何提取高程點
cass中提取高程點的方法如下:
1、單擊菜單「工程應用」,選擇「指定點生成數據文件」,彈出「輸入坐標數據文件名」,選擇提取的數據保存的文件位置和名稱。
2、點擊確定後,點擊要提取高程的位置,命令行中會提示輸入「地物代碼」,點擊回車鍵至命令行提示「指定點是繼續下一個點的提取」即可。
3、提取的高程點數據會自動保存在文件中。
高程點分布表達上具有豐富的上下文特徵,除個體高程屬性上的差異外,一方面與重要地形特徵單元(如山峰、鞍部及山谷等)、河流、道路等自然或人文要素目標間的分布關系,使得個體高程點在地理性質上具有不同的重要性意義。
另一方面區域地形的起伏變化,使得高程點群在空間分布上呈現不同的疏密關系。
定義
群點選取一直是地圖綜合領域的研究熱點,一方面大量的地理現象表達上以群點形式呈現,如高程點、散列式居民地、成群分布的小島嶼群或湖泊群等,選取是主要的綜合措施。
另一方面群點分布上的多尺度表達也是空間分析、數據挖掘等其他領域感興趣的內容。
㈡ CASS軟體參數設置。如題 謝謝了
[原創]南方CASS5.1使用注意事項(續)wusuzhou1976 2006-4-27 17:04[原創]南方CASS5.1使用注意事項(續)[hide][/hide]21、繪制地籍圖 地籍部分的核心是帶有宗地屬性的界址線,生成界址線有兩種方法:可以直接用手工方法繪制,也可以通過生成權屬信息數據文件後再利用此文件來繪制。數字地籍圖(包括權屬圖、宗地圖、地籍表格)的繪制。22將滑鼠移至「繪圖處理」菜單項,按左鍵,選擇「改變當前圖形比例尺」功能,命令區提示,當前比例尺為 1: 500 輸入新比例尺 1:輸入要求轉換的比例尺,例如輸入1000。這時屏幕顯示的STUDY.DWG圖就轉變為1:1000的比例尺,各種地物包括注記、填充符號都已按1:1000的圖示要求進行轉變。23在CASS4.0軟體下側信息欄顯示的坐標和測量坐標是相反的,即CASS4.0系統上前面的數為Y坐標(東方向),後面的數為X坐標(北方向)。24自己定製宗地圖框。首先需要新建一幅圖,按自己的要求繪制一個合適的宗地圖框,並在C:\CASS40\BLOCKS目錄下保存為合適的圖名。然後在「文件」下拉菜單下的「CASS4.0參數配置」的「地籍權屬」組里更改自定義宗地圖框里的內容。將圖框文件名改為所定義的文件名,設置文字大小和圖幅尺寸,輸入宗地號、權利人、圖幅號各種注記相對於圖框左下角的坐標,將地籍權屬的參數配置設置好後,就可以使用「繪圖處理」下拉菜單中的「宗地圖框(可縮放圖)」的「自定義」功能,此菜單下又分為「單塊宗地」和「批量處理」兩種。依此操作即可加入自定義的宗地圖框。25、 使用系統在野外作業所需的器材:1.安裝好CASS軟體的便攜計算機一台;2.全站儀一套﹙主機、三角架、棱鏡和對中桿若干﹚;3.數據傳輸電纜一條;4.對講機若干。人員安排:根據電子平板作業的特點,一個作業小組的人員通常可以這樣配備:測站處觀測員、計算機操作員各一名,跑尺員一至兩名。根據實際情況,為了加快採集速度,跑尺員可以適當增加;遇到人員不足的情況,測站上可只留一個人,同時進行觀測和計算機操作。出發前准備:錄入測區的已知坐標,完成測區的各種等級控制測量,並得到測區的控制點成果後,便可以向系統錄入測區的控制點坐標數據,以便野外進行測圖時調用。26、錄入測區的控制點坐標數據可以按以下步驟操作:1.首先移動滑鼠至屏幕頂部菜單「編輯」處按左鍵,系統便彈出一個下拉菜單。2.再移動滑鼠在下拉菜單中選擇「編輯文本」項按左鍵,這時,命令區顯示:File to edit: 操作:輸入控制點坐標數據文件名;如果沒有此文件,自己根據提示新建一個。注意不要沖掉已有文件。格式如下:總點數N1點點名,1點編碼,1點Y﹙東﹚坐標,1點X﹙北﹚坐標,1點高程 …N點點名,N點編碼,N點Y﹙東﹚坐標,N點X﹙北﹚坐標,N點高程有關說明如下:①文件內除第一行總點數外,每個點佔一行;②編碼可輸可不輸;即使編碼為空,其後的逗號也不能省略。③每個點的Y坐標、X坐標、高程的單位是米;④文件中間不能有空行。27、CASSCAN是南方測繪儀器公司開發的新一代掃描矢量化軟體。此軟體基於AutoCAD的Overlay平台,充分利用Overlay對柵格圖象的處理優勢,結合了CASS成圖軟體方便靈活對地形地物處理的特點,對擁有CASS軟體的用戶,因為已經熟悉了AutoCAD和CASS的操作,故極易上手。而隨著掃描儀的迅速發展,整套配備的價格較低,是對於測繪單位非常實用的老圖數字化軟體。CASS軟體自動地將各種地物地貌歸到各個不同的層,在描圖時只要用定標器點取各種繪圖功能(如房屋、道路、電力線、等高線、陡坎等),CASS軟體會自動地切換至各個相應的層,然後根據圖紙上的地物或地貌逐個輸入。對於直線形的地物地貌如房屋、電線等只需用定標器點取它的端點即可,而對於曲線形的地物地貌如陡坎、等高線等則要用定標器密集地沿著地貌曲線取點采樣,采樣的密度視曲線的曲緩而定,曲折的采點密一些,舒緩的則可以開一些,但要注意對於那些較為明顯的特徵點不要漏掉。通過圖板菜單上的「屏幕菜單」和「返回圖板」功能可以進行屏幕工作方式和圖板工作方式的切換,在屏幕工作方式時可以應用CA
㈢ 遙感信息自動提取技術
遙感的根本目的是為了從圖像上提取信息、獲取知識 ( 明冬萍等,2005) 。從衛星遙感圖像中提取土地利用等信息的方法可以歸納為三種類型: 一是由計算機自動完成,主要以光譜數據提取與土地利用相關的特徵參數,設計相應的分類模型,達到分類的目的 ( PGong,1992,J R Baber at el,1991) ; 二是人工目視解譯方法,運用專家知識實施綜合解譯; 三則是人機相互結合的互動式解譯方法,由此提高解譯的效率和精度 ( 趙庚星、竇益湘,2001) 。由計算機自動完成的遙感信息自動提取是遙感應用領域一個重點的研究和發展方向,目前國內外在該技術的研究和探討僅局限在某一小的區域,雖然也有很多的技術方案和演算法,但離實際的生產需求仍有很大差距。遙感信息的提取精度問題一直是困擾遙感信息自動提取進行應用推廣的技術瓶頸,主要表現在兩個方面: 一是遙感信息本身的同譜異物和同物異譜現象,以及待提取地物單元在數字遙感影像上色調、紋理、形態上的復雜性,這給信息自動提取帶來了很大的困難; 二是當前遙感信息自動提取技術還大多停留在試驗階段,演算法以及參數設置等都不成熟,可操作性太差。所以,要將信息自動提取技術應用於生產實際確實面臨許多技術上的難點。
以上提到的信息自動提取技術應用到實際生產中存在著很多困難,但針對特定的區域,如果能採用比較切合實際的嚴密的提取演算法,仍然可以達到實際生產應用的需求。塔里木河流域地域寬廣,地勢較平坦,地物類型相對單一,所要提取的耕地、林地、天然草地、沙漠等地類影像特徵清晰,且空間分布規律明顯。這在我國其他地區是不多見的,尤其是在我國的東南、西南地區,植被覆蓋多,地類混雜,有很多地類人工目視解譯都很難區分。所以,在塔里木河流域進行信息自動提取具有得天獨厚的優勢。
遙感信息提取的精度決定了整個塔里木河流域生態動態監測與分析的效率,本系統採用了多種技術手段保證了遙感信息自動提取以及修編後的精度,包括圖像自動提取演算法設計、圖像處理一致性、解譯參考完整性、人工修編規范性等方面。從信息自動提取演算法的角度講,演算法要求嚴密、先進,但必須具有通用性。綜合國內外相關信息提取演算法,再結合塔里木河流域地物特徵,採用了分級分類的分類思想。所謂分級分類,就是按照級別來一級一級劃分,對於一個待分類的遙感影像,首先可以區分為兩個大類: 植被類與非植被類,或是水體類與非水體類; 而後在下一級再考慮在植被類裡面劃分林地、灌木、草地、農田等。這樣分類看似簡單,卻合乎我們通常的認知過程,可以避免一些大的類別上的劃分錯誤,同時可以縮小劃分某一地類時的考慮范圍,大大提高了分類的精度。對於最低一級的類型劃分,採用監督分類的思想,依據知識庫中所建立的對應地類的解譯標志、地物樣方、地物光譜等之間的對應關系,選擇對應地類的樣方信息。最後再經過主要/次要分析、集群分析等分類後處理得到某一專題的自動提取結果。針對植被覆蓋度、植被類型、土地沙質荒漠化、土壤鹽漬化和土地利用 5 個生態環境專題各自不同的特徵,建立了 5 個專題的信息自動提取流程。
㈣ excel中如何實現數據自動提取
問題沒太了解。是不是這樣的:
例:
一個Excel工作薄中有兩個表「Sheet1」和「Sheet2」;當在「Sheet2」中的A1單元格中輸入項目名稱後,由表「Sheet1」的B1單元格顯示相同的名稱;其表「Sheet1」中的B1單元格是對「Sheet2」中A1單元格的引用,其公式應為「=Sheet2!A1"。
㈤ excel如何從一個表格中提取想要的數據
excel如何從一個表格中提取想要的數據
excel如何從一個表格中提取想要的數據,Excel是我們在工作中最經常用到的辦公軟體。大家喜歡在Excel表格中儲存很多數據,但有時候只需要提取表格里的一部分數據,那麼excel如何從一個表格中提取想要的數據呢?
首先打開電腦,下載安裝辦公軟體,這里以Excel2013為例,如圖
安裝完成後我們雙擊圖標打開,在其左側點擊「新建」
接著選擇表格的圖標,點擊下方的「創建新建空白表格」
在空白的表格中輸入一些自己想要的數據,如圖
接著選中需要找到的數據,在「開始」選項卡下找到「條件格式」,如圖
然後點開「條件格式」,選擇「突出顯示單元格規則」下的「小於」,如圖
然後在「小於」窗口,填入我們需要篩選的條件,再選擇顏色,點擊確定,如圖
回到表格,我們看到我們需要的數據一目瞭然,如圖
如何在Excel表中提取想要的數據
一、公式提取法
EXCEL中,提取數據的常用函數有3個,Left、Right、Mid函數,函數解析和語法格式等如下:
二、快速填充法
它是EXCEL2013以上版本的中一個新功能。運用快速填充時,首先直接輸入一組到三組數據,讓Excel自動識別你的意圖,再進行快速填充。運用快速填充功能,不僅能單元格內提取不規則的.姓名,還可以提取數字、英文等。快速填充的方式有3種:
1、單擊「數據」選項卡 > 在「數據工具」組中 > 單擊「快速填充」;
2、用快捷鍵Ctrl+E;
3、選中示例單元格,拖動填充柄往下填充,然後在「自動填充」選項中選擇「快速填充」;
案例演示:
三、用自定義函數myget
函數有兩參數,=myget(①從哪提取,②提取什麼)
=myget(字元串,0) 取出數字
=myget(字元串,1) 取出中文字元
=myget(字元串,2) 取出英文字母
=myget(字元串,3) 取出特殊字元
=myget(字元串,4) 取出第一個數字的位置
=myget(字元串,5) 取出最後一個數字的位置
如果只要提取數字,只要將第2個參數設為0即可
方法步驟:
首先導入自定義函數的模板文件,點開發工具→VBA或都按ALT+F11 調出VBA 編輯器 →在工程窗口右鍵選擇【導入文件】→選擇VBA 模塊文件(提取中文、英文和數字自定義函數myget.bas)→關閉VBA 編輯器。然後再輸入公式即可。
如何從excel中提取需要的部分內容
1、A列中都是四字成語,從中提取中間兩位。
2、輸入mid函數引導的公式=mid(A2,2,2)。
3、按下Enter鍵結束公式輸入。
4、往下填充公式,即提取了數據,如下圖所示。
5、快速填充法:
現在第一個單元格中輸入要提取的數據。
6、然後點擊「數據」中的「快速填充」。
7、這樣,就完成了部分數據的提取。
㈥ EXCEL如何自動獲取其他工作表中固定單元格內的信息
看來你對資料庫比較熟悉,其實Excel也提供了類似於Access資料庫軟體的一些功能,利用好這個技巧,就可以輕松處理好你的問題了~ ~ ~ ~ ~
步驟如下:
一 建立一個資料庫
當完成了對一個資料庫的結構設計後,就可以在工作表中建立它了。首先在工作表的首行依次輸入各個欄位:員工姓名、地區、日期、產品名稱、銷售數量、銷售金額、銷售金額,如圖12-1所示。當我們輸入完欄位後,就可以在工作表中按照記錄輸入數據了。
提示:欄位名放在工作表的某一行的各相鄰單元中。也可以為欄位名和尚未建立的資料庫記錄建立一個格式。格式只是使資料庫容易理解,並不影響Excel對資料庫進行操作。
二 輸入數據
要加入數據至所規定的資料庫內,有兩種方法,一種是直接鍵入數據至單元格內, 一種是利用「記錄單」輸入數據。使用「記錄單」是經常使用的方法,其操作步驟如下:
(1)在想加入記錄的數據清單中選中任一個單元格。
(2) 從「數據」菜單中選擇「記錄單」命令。屏幕上會出現一個如圖12-2的對話框,選擇「確定」按鈕。
[ 提示 ] 在各個欄位中輸入新記錄的值。要移動到下一個域中,按〔Tab〕鍵。當你輸完所有的記錄內容後,按[Enter]鍵即可加入一條記錄。如此重復加入更多的記錄,當你加完所有記錄後,選擇「關閉」按鈕。我們就會看到在清單底部加入了新增的記錄。
我們也可以直接插入記錄到資料庫中,首先在現有記錄的中間插入空的單元格,然後鍵入記錄數據;原來所輸入的資料庫內容會自動下移。要插入記錄到現有的資料庫中,可按照下列步驟執行:
1 選定要插入記錄的單元格。在「插入」菜單中選擇「單元格」命令,在屏幕上出現一個對話框。
2 選擇「整行」,按下「確定」按鈕,我們就可以看到插入的單元格。輸入記錄內容到單元格中。
三 編輯記錄
對於資料庫中的記錄,我們可以採用在相應的單元格上進行編輯,也可以對記錄單進行編輯,其操作過程如下:
(1) 選擇數據清單中的任一單元格。
(2) 從「數據」菜單中選擇「記錄單」命令,出現一個記錄單對話框。
(3) 查找並顯示出要修改數據的記錄。編輯該記錄的內容。(4) 選擇「關閉」按鈕退出。
四 刪除一條記錄
對於資料庫中不再需要的記錄,我們可以使用「刪除」命令將其從資料庫中刪除。使用記錄單刪除一條記錄的操作步驟如下:
(1) 選擇數據清單中的任一單元格。從「數據」菜單中選擇「記錄單」命令。出現一個記錄單對話框。
(2) 查找並顯示出要刪除的記錄。選擇「刪除」按鈕,出現一個如圖12-5的確認對話框。
(3) 回答確認信息。按下「確定」按鈕。
注意:當我們使用數據記錄單來刪除數據時,不能通過「恢復」按鈕或「取消」命令來恢復數據。
㈦ 集成系統支持下的信息提取
(一)GIS支持下的遙感圖像處理
GIS常常與遙感圖像處理手段結合起來使用,更有效的增強與提取遙感信息。這主要表現在兩個方面。
一方面是GIS作為重要的輔助手段用於遙感影像的目視解譯,以提高解譯精度。具體做法是將那些有助於圖像解譯的矢量專題圖層(比如地質圖、地形圖、土地利用圖及植被覆蓋、水系發育等等)與待解譯的影像疊加顯示,前提是這些矢量圖層必須先與影像進行過坐標配准,具有統一的坐標。這可以用於人機交互的影像解譯,直接在屏幕上畫出影像解譯結果,還可用於在影像的監督分類前進行選取正確的訓練樣區以便提高分類精度。在這方面的應用中,同時還要注意這些專題圖層與影像的時間差,比如植被覆蓋與時相的相關性很大,另外如果時間相差較長,要充分考慮到一些客觀條件上的變化,如土地利用類型、建築物、道路等的變化。
GIS與遙感圖像處理結合應用的另一方面表現在:在GIS技術支持下,地學及其他知識直接參與遙感圖像的處理中,比如遙感圖像的分類中可以將DEM、NDVI等知識直接作為遙感影像的新增波段,與其他波段一起進行分類,這樣分類結果中就將反映出這些專題信息的分布。還比如專家系統的應用也是GIS與遙感技術結合應用的成果。
(二)GIS支持下的專題信息提取
1.遙感專題信息提取方法研究的發展
遙感專題信息提取(thematic information extraction)是從遙感影像資料中獲取某種特定地物特徵的信息,其目的是區別圖像中所含的專題目標。分類也是一種專題信息提取的方法,但專題信息提取和一般意義上的遙感圖像分類有所不同,先定目標,然後有意識地專門面向對象進行識別,而分類是就圖像中即有的像元給予類別的歸屬與劃分。它的方法隨著遙感技術的改進及遙感應用的深入也在不斷地改進,經歷了目視解譯、自動分類、光譜特性的信息提取及光譜與空間特徵的信息提取等多個階段。
目視解譯是最初的圖像識別方式。現在的圖像識別沿著兩個方向發展,一是由計算機的出現帶來的信息識別自動化,二是沿著遙感信息傳輸的本質而探尋信息識別的高精度。它們沒有嚴格的界限,隨著各自的發展而相互滲透。現有的計算機自動分類方法,都只是利用了圖像數據,沒有自動加入其他方面,如地學的知識,沒有充分利用人腦在分析圖像時所應用的知識,因此不會達到很高的精度。基於知識及專家系統的分類對分類的精度有所改善。同樣,專題信息提取的最初是分析特定目標的光譜特徵,形成規則,對圖像進行操作。計算機領域中人工智慧的出現使基於知識或信息的專題信息提取成為可能。遙感成像是從多到少的映射,是個確定過程,影像解譯是從少到多的映射,是個不確定過程。因此在遙感解譯時,包含一個重要的地學處理過程,它包括兩個方面,一是把遙感未帶回的信息再補上去,即補充地學相關信息,二是根據影像信息進行地學分析,來推斷出影像上未反映的信息,這都需要地學知識強有力的支持。如何把地學專家用於目視解譯的知識定量化表達,讓它來參與計算機處理,從根本上實現知識參與的自動提取,這是目前專題信息自動提取研究的焦點問題。
計算機自動分類前,先對訓練區進行訓練,實際上是一個統計的過程。這個統計過程只是就這幅圖像而言。然後利用統計結果進行回歸,建立一個基本適於該圖像的類別確定模型。專題信息提取時,一般是先有一套遙感信息模型,而後根據具體圖像的實際情況來不斷地修改,實質是對模型參數的調整,最終使模型適用於該影像。遙感信息模型是在現有地面實驗基礎上提煉出來的地物的反演模型,而地物在衛星圖像上的反映並非與地面實測數據一一對應,原因很多,使圖像數據具有很大的隨機性,這就又涉及到光譜輻射校正的問題。因此,需要把遙感信息理論和實際圖幅影像有效地結合在一起來進行專題信息的提取。
2.遙感地質專題信息提取
當今,遙感衛星「群星閃爍」,遙感數據空前豐富,然而,遙感信息被利用的比率卻極低。其原因是我們缺少遙感專題信息提取的方法和模型。相對與土地利用/土地覆蓋遙感信息提取來說,遙感地質信息提取的難度更大些。概括地說,遙感信息提取的方式主要有3種:目視判讀提取、基於分類的信息提取和基於知識發現的遙感信息提取。遙感地質專題信息提取的方式也不外乎這三種。
(1)目視判讀提取
早期從遙感影像中提取信息的主要方法是目視判讀提取。由於目視判讀能綜合利用地物的色調或色彩、形狀、大小、陰影、紋理、圖案、位置和布局等影像特徵知識,以及有關地物的專家知識,並結合其他非遙感數據資料進行綜合分析和邏輯推理,從而能達到較高的專題信息提取的精度,尤其是在提取具有較強紋理結構特徵的地物時更是如此,它是目前業務化生產的一門技術,與非遙感的傳統方法相比,具有明顯的優勢。盡管該方法較費工費時,但由於遙感地質信息計算機自動提取的難度,仍將在遙感地質信息提取中長期存在。
(2)基於分類方法的遙感信息自動提取
在遙感信息自動提取方面,分類方法的研究歷史最長久,其核心是對遙感圖像的分割,其方法有無監督分類和有監督分類。就無監督分類而言,有 K-MEANS 法、動態聚類型法、模糊聚類法以及人工神經網路法;在有監督分類方面,有最小距離法、最大擬然法、模糊分類法以及人工神經網路法。最大擬然法需要各類型的先驗知識及其概率,特別是需要假定各類型的分布屬於正態分布,因而它是一種有參數的分類器,在具有先驗性概率知識以及各類型滿足正態分布的條件下,它具有較好的分類效果,該分類器具有分類速度快的優點。模糊分類是根據模糊數學所構建的一種分類器。它是建立在假設一個像元是由多個類型所組成的基礎上,只是各類型的隸屬度不同。在對分類器訓練時,需要確定訓練樣本像元中各類型的隸屬度,它不需要各類型的先驗概率知識,也不要求各類型服從正態分布,它是一種無參數的分類器。但是對訓練像元中各類型隸屬度的確定比較困難。該方法適用於亞像元信息的提取。人工神經網路分類器是利用人工神經網路技術所構造的分類器,人工神經網路是近幾年得到迅速發展的一門非線性科學,它是模擬生物神經網路的人工智慧技術,已廣泛地用於趨勢分析和模式識別以及遙感圖像的分類等方面。人工神經網路器不需要各類型的先驗性概率知識,也不要求各類型一定要服從正態分布,它是一種無參數的分類器。盡管利用分類器進行分類時所需要的時間很短,但是在對分類器進行訓練時,所需要的時間卻很長。
就無監督分類而言,其所分的結果,需要專家進行判讀和類別的歸並,並最終確定其所屬的類型。就有監督分類而言,需要選取大量的訓練樣區,而訓練樣區的選取不僅費工、費時,訓練樣區選擇的好壞還直接影響分類的效果;同時,分類是對整個圖像進行分割,它所要求的是總體的精度最高,這樣就不可能完全保證我們所需專題信息的精度一定最高。分類是建立在數理統計基礎之上,而沒有建立在對遙感信息機理分析的基礎上,也沒有建立在知識挖掘的基礎上,這樣就使得它難以實現遙感圖像專題信息提取的全自動化。同時,基於光譜特徵的分類難以解決異物同譜的問題。在分類中所獲取到的知識通常既不可傳遞,也難以解釋。這也是我們對所分結果知其然,而不知其所以然的原因。我們對在任何時候,任何地點的圖像,都必須重復選取訓練樣區的工作。這樣,顯然就大大限制了遙感信息提取的自動化。為此,基於知識發現的遙感專題信息提取將成為另一個最有前途的方向。
3.基於知識發現的遙感專題信息提取
基於知識發現的遙感專題信息提取是遙感專題信息提取的發展趨勢之所在。其基本內容包括知識的發現、應用知識建立提取模型,利用遙感數據和模型提取遙感專題信息。在知識發現方麵包括從單期遙感圖像上發現有關地物的光譜特徵知識、空間結構與形態知識、地物之間的空間關系知識。其中,空間結構與形態知識包括地物的空間紋理知識、形狀知識以及地物邊緣形狀特徵知識;從多期遙感圖像中,除了可以發現以上知識外,還可以進一步發現地物的動態變化過程知識;從GIS資料庫中可以發現各種相關知識。在利用知識建立模型方面,主要是利用所發現的某種知識、某些知識或所有知識建立相應的遙感專題信息提取模型,如圖3-8所示。在利用遙感數據和模型提取遙感專題信息時,應從簡單到復雜,從單知識、單模型的應用到多知識、多模型的集成應用。從單數據的使用到多數據的綜合使用。
4.基於光譜知識的遙感專題信息提取
地物的光譜知識是遙感專題信息提取中最重要的知識。對地物光譜特徵的研究,長期以來都得到各國的高度重視。我國對地物光譜開展了深入的研究,並出版了《中國典型地物波譜及其特徵分析》《遙感反射光譜測試與應用研究》等書。周成虎、杜雲艷根據對水體光譜特徵的分析,建立了有效的NOAA AVHRR水體提取模型。陳銘臻根據對水稻和背景的光譜特徵分析,建立了水稻種植面積的提取模型(TM4/TM1,TM4/TM3,TM4/TM2)。Helmut Mayer Carsten Steger通過對道路光譜知識的分析,探討了從遙感圖像上提取道路的方法,Jinfei Wang,Paul M.Treitz和Philip J.Howarth探討了利用梯度方向剖面分析法從SPOT PAN圖像中提取新修道路,並將其用於更新城區GIS資料庫中的道路網。V.Lacroix,M.Acheroy利用了約束梯度法提取了房屋拐角。
R.M.Haralick,S.Wang,G.Shapiro,J.B.Campbell,探討了利用一致性標記技術提取河網及其流向。Moller-Jenson提出利用NOAA AVHRR的 CH4<45,CH5<35 建立水體提取模型。Jupp等曾提出利用 TM7波段,通過閾值法可以將水體提取出來。
圖3-10 KDD過程示意圖
數據准備包括數據選取(data selection)、數據預處理(data preprocessing)和數據變換(data transformation)。數據選取的目的是確定發現任務的操作對象,即目標數據(target data),它是根據用戶的需要從原始資料庫中抽取的一組數據。數據預處理的目的是去除雜訊等。當數據挖掘的對象是數據倉庫時,一般來說,數據選取和數據預處理已在生成數據倉庫時完成。數據變換的主要目的是消減數據維數或降維(dimension rection),即從初始特徵中找出真正有用的特徵以減少數據挖掘時要考慮的特徵或變數個數。
數據挖掘階段首先要確定挖掘的任務或目的是什麼,考慮決定使用什麼樣的挖掘演算法。同樣的任務可以用不同的演算法來實現,選擇實現演算法有兩個考慮因素:一是不同的數據有不同的特點,因此需要用與之相關的演算法來挖掘;二是用戶或實際運行系統的要求,如准確性與可理解性之間的偏好等。
2.數據挖掘與知識發現的主要類型和方法
一般統計資料庫的數據挖掘出現得最早,也最為成熟。一般而言,數據挖掘和知識發現可分為如下幾種類型(Fayyad,1997):
(1)分類:將數據項映射到一個或若干已定義的類的學習函數。
(2)回歸:將數據項映射到實值預報變數的學習函數。
(3)聚類:尋找有限的類別來描述數據集的方法。
(4)概括(或稱泛化):尋找描述各數據子集共性的方法。
(5)依賴模式:尋找描述變數間顯著依賴關系的模式。
(6)變化和偏離檢測:從與以前數據對比中發現顯著變化。
目前在數據挖掘和知識發現的研究中出現了大量的新方法及各種方法的結合,其中比較著名的方法有如下幾種:
(1)基於決策樹(decision tree)分類的ID3和C4.5方法。
(2)用於概括的AQ15和CN2方法。
(3)解決不精確、不確定知識的粗糙集(Rough Set)方法。
(4)大量人工神經網路方法,如經典的反向傳播[BP]演算法,自組織映射(SOM)和自適應諧振理論(ART)等。
(5)貝葉斯概率網路學習方法。
(6)用於產生關聯規則的Apriori的方法。
作為目前國外的熱門研究課題之一,數據開采和知識發現既是人工智慧學者的研究熱點,也是資料庫專家的探索對象,其工作涵蓋了醫學、機器學習、人工智慧、數學、市場營銷等諸多領域。獲得了許多有用的知識。迄今為止,國內從事這方面研究的單位還不多,把KDD和DM技術應用於衛星遙感的信息處理,更是一項嶄新的課題。
3.遙感影像中的數據挖掘與知識發現
衛星遙感資料庫作為資料庫的一種,對於賦存其中的信息的處理與識別,自然可以借鑒一般意義上的DM和KDD技術;而作為一類特殊的資料庫——圖像資料庫,有著區別於一般關系資料庫和事務資料庫的信息內容,隱含著豐富的時間、光譜和空間信息。因而,就這類庫中的知識發現而言,數據開采也應具有特殊的過程和方法。
根據上述DM和 KDD 的技術流程示意圖(圖 3-11)並考慮到衛星遙感數據特殊性,中科院的何國金等人提出了針對地質應用的衛星遙感數據開采和知識發現的理論與技術框架。在此框架中,數據開采佔了極為重要的地位。它包括遙感數據的時相選擇、應用預處理、特徵分析、信息識別與知識解釋。現實生活中,許多遙感應用者忽略了該過程的特殊作用,直接把原始遙感圖像的解釋結果作為應用的基礎(雖然在解譯過程中也加入了人的知識),因而獲得的知識往往是膚淺的、表面化的、不精確的。遙感數據開采過程只有充分考慮原始數據的波譜、空間和時間特徵,才能更好地實現針對遙感應用的有價值的、較精確的、較高水平的知識發現。
圖3-11 衛星數據遙感挖掘和知識發現
㈧ 如何應用Engauge Digitizer軟體提取文獻中的數據
最近在寫關於meta-分析的文章,思路有了,全文有了,以為水到渠成了。但是,雖然全文中卻缺少有效的數據。遂在DXY中向戰友請教如何提取有效數據。有戰友提到應用EngaugeDigitizer軟體對KM生存曲線進行提取原始數據。為此,本人對該軟體進行試用(4.1綠色免費版) ,總結如下,僅供參考:
1、將KM中survival曲線以圖片的形式進行拷貝,並粘貼至EngaugeDigitizer軟體中;
2、然後點擊Axis point按鈕,該按鈕的作用是設定坐標及標尺。將「+」定在原點,標記x=0,y=0。將「+」定在x軸最大點標記為x=14,y=0。將「+」定在y軸最大點標記為x=0,y=100。
3、選擇curve point 或 segment fill 選擇曲線。curve point 是逐點選擇,而 segment fill 片斷自動選擇。
4、最後點擊view菜單下的curve geometry.如果想要某段時間內的數據,選取就OK了。轉載