洪澇災害研究中的應用
付凌暉1 , 王惠文1 , Y v es Lechevallier2
(11 北京航空航天大學經濟管理學院, 北京100083 ; 21 法國國家自動化信息研究所, CEDEX 78153)
摘要: 自組織特征映射是一種人工神經網絡方法,可以同時實現模式識別和數據分類。它可以將高維數據間復雜、非線性的統計關系轉換為低維形式中簡單的幾何關系。該文利用自組織特征映射方法對鄱陽湖地區月降水強度和月高水位變化模式進行分析,對鄱陽湖地區洪水災害形成原因進行歸納。
文章編號: 100822204 (2002) 0420043206
中圖分類號: C931. 6 文獻標識碼: A
鄱陽湖位于江西省北部,長江中下游南岸,是目前中國最大的淡水湖泊。它承納贛江、撫河、信江、饒河、修河五大河及博陽河、漳田河、潼津河之來水,經調蓄后由湖口注入長江,是一個過水性、吞吐型、季節性的湖泊。鄱陽湖地區涉及范圍共11 個縣、市,區域土地面積19 762 平方公里,占江西省土地總面積的11 . 5 % 。據統計資料顯示,鄱陽湖區幾乎每年都發生洪澇災害。其中,暴雨洪水是該地區
洪水災害的最主要來源。由于大陸季風氣候影響,鄱陽湖區降雨時間集中,強度大,全年降雨量50 %以上集中在5 月~9 月。高強度、大范圍、長時間的暴雨常常形成峰高量大的洪水。其次,由于鄱陽湖地區地勢低平,不僅存在因洪水造成濱湖地區圩堤決口而產生的災害,而且很多情況下是因降水過多導致地面大面積積水或土地過濕使生長不良而減產所產生的災害,又稱之為漬澇災害。鄱陽湖洪水致災因素中,除高強度集中降水外,最關鍵因素是水位高或高水位持續時間長,使得圩堤內外形成一定的水位落差,圩堤因滲漏而潰決, 或因湖水位超過堤頂高程而漫決。外湖水位越高、高水位持續時間越長,圩內洪澇災
對鄱陽湖地區的降水與水位年內變化形式進行劃分,進而分析在不同洪澇災害危險程度下降水與水位的變化模式。
一、自組織特征映射方法基本原理
3
自組織特征映射方法Sel f2Organizing Map , 簡稱S OM) ,是一種人工神經網絡方法,是由芬蘭赫爾辛基技術大學的T euvo K ohonen 教授于1981 年提出來的。它的基本思想是: 人腦由數以億計的神經元細胞組成,處于空間不同區域的神經元分工有所不同。神經網絡在接受外界輸入模式時,將會分為不同響應區域,各區域對輸入模式具有不同的響應特性,并且這一過程是自動完成的。S OM 神經網
絡利用這種思想可以實現高維數據分布向規則形狀低維網格的有序映射。因此,它可以將高維數據間復雜、非線性的統計關系轉換為低維形式中簡單的幾何關系。SOM 神經網絡通常由多個神經元構成一個二維規則網格,每個神經元和某些相似觀測數據形成的一種數據模式相聯系。S OM 神經網絡算法對這些數據模式進行識別以使它們最優地描述觀測數據的變化域(離散或連續分布) 。這些模式自動有序地組織在二維平面網格上,相似的模式在平面網格中相互接近,相異的模式在平面網格中相互遠離。從
(
高低密切相關,并常以外洪內澇的形式出現1 2。
為了區分鄱陽湖地區不同的月集中降水和月
最高水位年內變化形式與鄱陽湖地區洪澇災害的
嚴重程度的關系,下文通過使用自組織映射方法
收稿日期: 2001 - 11 - 29
作者簡介: 付凌暉(1975 - ) ,男,湖北大悟人,博士研究生,研究方向為系統工程.
過程。
S OM 神經網絡基本結構如圖1 所示,輸出神
經元排列在平面網格,所有輸入連接到網格中的
每個神經元。各個神經元的連接權之值具有一定
的分布,鄰近的神經元相互激勵,而較遠的神經元
則相互抑制。
圖2 隨時間逐漸縮小的鄰域( t 1< t 2< t 3)
一年中各個月的最大連續五天降水量( 以下簡稱
月最大五降水) 作為短期降水強度性能的指標,采
用各個月的最高水位作為水情變化狀況的指標。
由于一年有12 個月份,則相應的降水和水位數據
為12 維的數據。由于自組織特征映射方法可以
很好地在對高維數據進行分類的同時,將高維數
據在高維空間中的關系通過非線性轉換表示在低
維空間中,進而可以可視化地檢查樣本點間的近
似關系。因而,使用S OM 方法可以有效地區分不
同的降水和水位變化模式。
圖1 SO M 神經網絡基本結構
p
設在p 維空間有n 個觀測向量{ X j ∈R , j =
1 ,
2 , ??, n} ,要將它們分為k 類。在S OM 中每
一類可用一個神經元表示,它在p 維空間表示為
p
{ M i ∈R , j = 1 ,2 , ??, k} , 稱為神經元權向量,
則神經網絡的訓練過程為:
二、鄱陽湖地區降水、
水情模式分析
分析樣本選擇: 選擇鄱陽湖地區1983 ~
1998 年15 年的數據,以及建國以來幾次大的洪澇
1954 年、1962 年、1973 年和1977 年作為樣本點。
(一) 鄱陽湖地區降水強度變化分析
采用自組織特征映射方法對鄱陽湖地區每年
各月最大五天降水量數據進行分析。為了分析觀
測樣本間的相似關系,采用 4 ×5 神經元網格對觀
測樣本數據進行模式識別。初始時首先對觀測樣
本數據向量進行標準化[ 4 ] ,各初始參數設置如下:
鄰域寬度δ( t ) 為1 ,在網絡訓練過程中線性遞減;
學習速率α( t) 為0. 1 ,在網絡訓練過程中線性遞
減;神經元權向量按照樣本點在主平面的分布關
系選擇,使之在一定程度上數據的分布一致。所
有的觀測樣本重復代入網絡中訓練,直到達到滿M i ( t + 1) = M i ( t) + h c( x) , i ( X ( t)- M i ( t) ) (1)
其中: t 為觀測向量輸入的迭代次數; M i ( t)為第
t 次迭代時的神經元權向量; X ( t )為第t 次迭代
時的觀測向量X ; h c( x) , i 為鄰域函數(常量乘子) 。
c ( x) 由下列條件定義:
‖X ( t) - M c ( t) ‖ ≤ ‖X ( t)- M i ( t) ‖(2)
M c ( t)被稱為“贏單元”,它是和輸入觀測向
量X ( t) 最優匹配的神經元。匹配的比較尺度通
常采用歐氏距離。如果有多個最小值發生,可隨
機選擇一個作為“贏單元”。
鄰域函數為:
2 2
= α( t) ex p ( -‖r i - r c ‖/ 2δ( t) )(3)
h c( x) , i
其中:0 < α( t )< 1 是學習速率,一般設定隨迭代
2 2
次數增加而單調遞減; r i ∈R , r c ∈R 是平面網
格中的位置向量,分別對應于M i , M c ;δ( t) 對應
于領域函數的寬度N c ( t) ,隨迭代次數的增加而
單調遞減,如圖2 所示。
在鄱陽湖降水與水位變化模式分析中,為分
第15 卷第4 期付凌暉,王惠文, Y ves Lechevallier :自組織特征映射在鄱陽湖地區洪澇災害研究中的應用·45 ·表1 各神經元包含的最大五降水觀測樣本年主平面上的投影位置。圖4 中每一個單元格代表
一類樣本點,表示各個神經元代表觀測樣本的情
況,單元格上端黑色圓圈面積大小與該神經元代
表的觀測樣本個數呈正比,單元格下端曲線由上
至下分別是該神經元所代表觀測樣本最大值、均
值、最小值曲線(由于某些神經元沒有或僅代表了
,所以相應的單元格為空或僅有一
條曲線) 。
分類代表年份分類代表年份
C LASS 1X1
C LASS 1X2
C LASS 1X3
C LASS 1X4
C LASS 2X1
1996
1992
1983
1993 ,1997
1987
C LASS 3X1
C LASS 3X3
C LASS 4X2
C LASS 4X3
C LASS 4X4
1984 ,1991
1962 ,1988
1977 ,1990
1989
1994 ,1995
3 和圖
4 所示。
圖4 月最大五降水分類模式圖圖3 月最大五降水主平面拓撲圖根據神經元及觀測樣本在主平面上的拓撲近
似關系,將一些關系近似的神經元合并,由此將觀
測樣本點分為6 類,結果如表2 所示。
圖3 中網格的節點代表神經元的權向量在主
平面上的投影位置,圖中的散點代表觀測樣本在
表2最大五降水觀測樣本分類
類別 1 2 3 4 5 6
1954
1998
1983
1992 ,1996
1993
1997
1962
1988
1973
1994 ,1995
1977 ,1984 ,1985 ,1986
1987 ,1989 ,1990 ,1991
年份
圖5~圖10 分別表示出了1~6 類各類的最
大值、均值、最小值曲線。
圖7 類別3 月最大五降水
圖5 類別1 月最大五降水
圖8 類別4 月最大五降水
圖6 類別2 月最大五降水
為163 mm , 屬于中等強度降水, 其它各個月份最
大五降水均不超過90 mm ,7 月后最大五降水呈現
平緩下降的態勢。從降水強度上來講,形成嚴重
災害的危險程度不高。
51 類別5 包括1973 年、1994 年和1995 年。
該模式月最大五降水高峰值出現在6 月份,平均
為263 mm ,其它除4 月和5 月外最大五降水平均
值均很小, 從整個特點來看, 其變化與模式3 相圖9 類別5 月最大五降水
近,主要不同在于高強度降水出現的月份不同。
由于鄱陽湖泄流與長江洪水關系密切,因而高強
度降水出現時間的差異會導致災害危險程度上的
不同。比較而言,類別3 高強度降水出現的時間
與長江汛期更為接近,因而災害危險程度較高。
61 類別6 包括1977 年、1984 年、1985 年、
1986 年、1987 年、1989 年、1990 年和1991 年。該
模式月最大五降水變化雖然有不同的特征,但總
量水平都較低,變化形式較平緩。相應地其災害
危險程度很低。
從月最大五降水主平面圖中看到,由左至右,
雨季強降水水平表現出增大的趨勢,觀測樣本分
布也由密變疏,表明圖中觀測樣本出現在右方概
率要小。
(二) 鄱陽湖地區最高水位變化分析
采用自組織特征映射方法對鄱陽湖地區每年
月最高水位數據進行分析。根據每年各月最高水
位數據(鄱陽湖都昌水文站) ,也采用4 ×5 神經元圖10 類別6 月最大五降水
11 類別1 包括1954 年和1998 年。該種模
式在雨季特別是在6 月和7 月份,月最大五降水
平均達到238 mm ,說明夏季暴雨發生強度很高,
因而形成嚴重災害性影響的風險程度也很高。雨
季過后,降水強度明顯急劇下降,8~12 月月最大
五降水量平均小于80 mm 。
21 類別2 包括1983 年、1992 年和1996 年。
該種模式月最大五降水呈現雙峰狀態,分別出現
在3 月和7 月,分別平均為173 mm 和137 mm 。從
月最大五降水絕對量來看,該模式在3 月份降水
強度水平較高,但由于入湖五河和長江汛期未到,
因而不會形成災害性影響。在7 月份,降水強度
較高,因而可能會造成一定程度的災害風險。同
時也應看到的是,該類模式雖然在變化趨勢上呈
現出相似性,但在絕對量值上仍然存在一定的差
異。如1983 年、1992 年和1996 年呈現依次遞減
的狀態,因而在災害形成上有所不同。
月最大五降水的初始時的處理和網絡設置相同。
經過網絡計算,各神經元代表的觀測樣本如表3
所示,表中未列出的為未分配觀測樣本的神經元。
表3 各神經元包含的月最高水位觀測樣本年
分類代表年份分類代表年份
C LASS 1X2 1995 C LASS 3X1 1954 ,1998
C LASS 1X3 1977 C LASS 3X3 1962 ,1989
C LASS 1X4 1992 C LASS 3X4 1984
C LASS 2X1 1983 C LASS 3X5 1985
C LASS 2X2 1973 C LASS 4X2 1993
C LASS 2X3 1994 C LASS 4X3 1988
C LASS 2X4 1990 ,1991 C LASS 4X4 1996
C LASS 2X5 1986 C LASS 4X5 1987 ,1997
分析后得到的主平面的拓撲結構圖和分類模
式圖分別如圖11 和圖12 所示。
第 15 卷 第 4 期 付凌暉 ,王惠文 , Y ves Lechevallier :自組織特征映射在鄱陽湖地區洪澇災害研究中的應用 ·47 ·
圖 11 月最高水位主平面拓撲圖
圖 12 月最高水位分類模式圖
根據神經元及觀測樣本在主平面上的拓撲近 似關系 ,將一些關系近似的神經元合并 ,由于月高 水位變化方式比較相近 ,進而將關系相近的觀測
樣本 近 似 分 為 6 類 , 結 果 如 表 4 所 示 。 ( 由 于
1983 年 、1992 年 、1993 年和 1996 年與其他樣本年
分類均存在一定差異 ,所以單獨劃歸一類 。
) 表 4 月最高水位觀測樣本分類
類別 1 2 3 4 5
6
1954 1973 ,1977 1983 ,1992 1962 1984 ,1985 ,1986 年份
1988 1998
1994 ,1995
1993 ,1996
1989
1987 ,1990 ,1991 ,1997
圖 1 3 ~ 圖 1 8 分 別 表 示 出 了 1 ~ 6 類 各 類 的 最大值 、均值 ,最小值曲線 。
圖 13 類別 1 的月最高水位
圖 16 類別 4 的月最高水位
圖 14 類別 2 的月最高水位
圖 17 類別 5 的月最高水位
圖 15 類別 3 的月最高水位
圖 18 類別 6 的月最高水位