【專家視點】空間數(shù)據(jù)庫的設(shè)計淺析
空間數(shù)據(jù)庫的設(shè)計是指在現(xiàn)在數(shù)據(jù)庫管理系統(tǒng)的基礎(chǔ)上建立空間數(shù)據(jù)庫的整個過程。主要包括需求分析、結(jié)構(gòu)設(shè)計、和數(shù)據(jù)層設(shè)計三部分。
1、需求分析
需求分析是整個空間數(shù)據(jù)庫設(shè)計與建立的基礎(chǔ),主要進行以下工作:
1)調(diào)查用戶需求:
了解用戶特點和要求,取得設(shè)計者與用戶對需求的一致看法。
2)需求數(shù)據(jù)的收集和分析:
包括信息需求(信息內(nèi)容、特征、需要存儲的數(shù)據(jù))、信息加工處理要求(如響應(yīng)時間)、完整性與安全性要求等。
3)編制用戶需求說明書:
包括需求分析的目標(biāo)、任務(wù)、具體需求說明、系統(tǒng)功能與性能、運行環(huán)境等,是需求分析的最終成果。
需求分析是一項技術(shù)性很強的工作,應(yīng)該由有經(jīng)驗的專業(yè)技術(shù)人員完成,同時用戶的積極參與也是十分重要的。
在需求分析階段完成數(shù)據(jù)源的選擇和對各種數(shù)據(jù)集的評價
2、結(jié)構(gòu)設(shè)計
指空間數(shù)據(jù)結(jié)構(gòu)設(shè)計,結(jié)果是得到一個合理的空間數(shù)據(jù)模型,是空間數(shù)據(jù)庫設(shè)計的關(guān)鍵。空間數(shù)據(jù)模型越能反映現(xiàn)實世界,在此基礎(chǔ)上生成的應(yīng)用系統(tǒng)就越能較好地滿足用戶對數(shù)據(jù)處理的要求。
空間數(shù)據(jù)庫設(shè)計的實質(zhì)是將地理空間實體以一定的組織形式在數(shù)據(jù)庫系統(tǒng)中加以表達的過程,也就是地理信息系統(tǒng)中空間實體的模型化問題。主要過程是見圖2-7-1。
1)概念設(shè)計
概念設(shè)計是通過對錯綜復(fù)雜的現(xiàn)實世界的認識與抽象,最終形成空間數(shù)據(jù)庫系統(tǒng)及其應(yīng)用系統(tǒng)所需的模型。
具體是對需求分析階段所收集的信息和數(shù)據(jù)進行分析、整理,確定地理實體、屬性及它們之間的聯(lián)系,將各用戶的局部視圖合并成一個總的全局視圖,形成獨立于計算機的反映用戶觀點的概念模式。概念模式與具體的DBMS無關(guān),結(jié)構(gòu)穩(wěn)定,能較好地反映用戶的信息需求。
表示概念模型最有力的工具是E-R模型,即實體-聯(lián)系模型,包括實體、聯(lián)系和屬性三個基本成分。用它來描述現(xiàn)實地理世界,不必考慮信息的存儲結(jié)構(gòu)、存取路徑及存取效率等與計算機有關(guān)的問題,比一般的數(shù)據(jù)模型更接近于現(xiàn)實地理世界,具有直觀、自然、語義較豐富等特點,在地理數(shù)據(jù)庫設(shè)計中得到了廣泛應(yīng)用。(圖2-7-2)
2)邏輯設(shè)計
在概念設(shè)計的基礎(chǔ)上,按照不同的轉(zhuǎn)換規(guī)則將概念模型轉(zhuǎn)換為具體DBMS支持的數(shù)據(jù)模型的過程,即導(dǎo)出具體DBMS可處理的地理數(shù)據(jù)庫的邏輯結(jié)構(gòu)(或外模式),包括確定數(shù)據(jù)項、記錄及記錄間的聯(lián)系、安全性、完整性和一致性約束等。導(dǎo)出的邏輯結(jié)構(gòu)是否與概念模式一致,能否滿足用戶要求,還要對其功能和性能進行評價,并予以優(yōu)化。
從E—R模型向關(guān)系模型轉(zhuǎn)換的主要過程為:
①確定各實體的主關(guān)鍵字;
②確定并寫出實體內(nèi)部屬性之間的數(shù)據(jù)關(guān)系表達式,即某一數(shù)據(jù)項決定另外的數(shù)據(jù)項;
③把經(jīng)過消冗處理的數(shù)據(jù)關(guān)系表達式中的實體作為相應(yīng)的主關(guān)鍵字
④根據(jù)②、③形成新的關(guān)系。
⑤完成轉(zhuǎn)換后,進行分析、評價和優(yōu)化。
3)物理設(shè)計
物理設(shè)計是指有效地將空間數(shù)據(jù)庫的邏輯結(jié)構(gòu)在物理存儲器上實現(xiàn),確定數(shù)據(jù)在介質(zhì)上的物理存儲結(jié)構(gòu),其結(jié)果是導(dǎo)出地理數(shù)據(jù)庫的存儲模式(內(nèi)模式)。主要內(nèi)容包括確定記錄存儲格式,選擇文件存儲結(jié)構(gòu),決定存取路徑,分配存儲空間。
物理設(shè)計的好壞將對地理數(shù)據(jù)庫的性能影響很大,一個好的物理存儲結(jié)構(gòu)必須滿足兩個條件:一是地理數(shù)據(jù)占有較小的存儲空間;二是對數(shù)據(jù)庫的操作具有盡可能高的處理速度。在完成物理設(shè)計后,要進行性能分析和測試。
數(shù)據(jù)的物理表示分兩類:數(shù)值數(shù)據(jù)和字符數(shù)據(jù)。數(shù)值數(shù)據(jù)可用十進制或二進制形式表示。通常二進制形式所占用的存貯空間較少。字符數(shù)據(jù)可以用字符串的方式表示,有時也可利用代碼值的存貯代替字符串的存儲。為了節(jié)約存貯空間,常常采用數(shù)據(jù)壓縮技術(shù)。
物理設(shè)計在很大程度上與選用的數(shù)據(jù)庫管理系統(tǒng)有關(guān)。設(shè)計中應(yīng)根據(jù)需要,選用系統(tǒng)所提供的功能。
4)數(shù)據(jù)層設(shè)計
大多數(shù)GIS都將數(shù)據(jù)按邏輯類型分成不同的數(shù)據(jù)層進行組織。數(shù)據(jù)層是GIS中的一個重要概念。GIS的數(shù)據(jù)可以按照空間數(shù)據(jù)的邏輯關(guān)系或?qū)I(yè)屬性分為各種邏輯數(shù)據(jù)層或?qū)I(yè)數(shù)據(jù)層,原理上類似于圖片的疊置。例如,地形圖數(shù)據(jù)可分為地貌、水系、道路、植被、控制點、居民地等諸層分別存貯。將各層疊加起來就合成了地形圖的數(shù)據(jù)。在進行空間分析、數(shù)據(jù)處理、圖形顯示時,往往只需要若干相應(yīng)圖層的數(shù)據(jù)。
數(shù)據(jù)層的設(shè)計一般是按照數(shù)據(jù)的專業(yè)內(nèi)容和類型進行的。數(shù)據(jù)的專業(yè)內(nèi)容的類型通常是數(shù)據(jù)分層的主要依據(jù),同時也要考慮數(shù)據(jù)之間的關(guān)系。如需考慮兩類物體共享邊界(道路與行政邊界重合、河流與地塊邊界的重合)等,這些數(shù)據(jù)間的關(guān)系在數(shù)據(jù)分層設(shè)計時應(yīng)體現(xiàn)出來。
不同類型的數(shù)據(jù)由于其應(yīng)用功能相同,在分析和應(yīng)用時往往會同時用到,因此在設(shè)計時應(yīng)反映出這樣的需求,即可將這些數(shù)據(jù)作為一層。例如,多邊形的湖泊、水庫,線狀的河流、溝渠,點狀的井、泉等,在GIS的運用中往往同時用到,因此,可作為一個數(shù)據(jù)層。
5)數(shù)據(jù)字典設(shè)計
數(shù)據(jù)字典用于描述數(shù)據(jù)庫的整體結(jié)構(gòu)、數(shù)據(jù)內(nèi)容和定義等。
數(shù)據(jù)字典的內(nèi)容包括:
1)數(shù)據(jù)庫的總體組織結(jié)構(gòu)、數(shù)據(jù)庫總體設(shè)計的框架。
2)各數(shù)據(jù)層詳細內(nèi)容的定義及結(jié)構(gòu)、數(shù)據(jù)命名的定義。
3)元數(shù)據(jù)(有關(guān)數(shù)據(jù)的數(shù)據(jù),是對一個數(shù)據(jù)集的內(nèi)容、質(zhì)量條件及操作過程等的描述)。
以上就是有關(guān)于空間數(shù)據(jù)庫設(shè)計的全部內(nèi)容,希望能給大家?guī)韼椭?/p>