我院海外學子葉翔談可變面元問題的影響與敏感性
2019年1月20日下午,應學院邀請,我院2012屆地理信息系統專業畢業生,現紐約州立大學布法羅分校(UB)地理系葉翔博士在320會議室為師生做了主題為“試論可變面元問題的影響與敏感性”的空間統計方向的學術報告。報告由地信系主任任福教授主持。
葉博士的報告内容分為五個部分。首先以美國選舉為例,闡述了可變面元問題的本質。在地理學領域中,在對社會、經濟、健康等類型的數據進行空間分析時,常常需要根據實際情況将數據聚合為特定的面積單元,當将基于點測量的空間現象的點數據聚合(擴散)為區域數據時,就會出現MAUP問題(Modifiable Areal Unit Problem),即統計值的結果受空間分區的影響。分區的面積單元是可變的或可修改的,這種因聚合的空間單元的變化所導緻的統計結果的差異即MAUP。由MAUP造成的統計結果和空間分析結果的偏差常以尺度效應(Scale effect)和分區效應(Zoning effect)來描述。
其次,葉博士深入淺出的解釋了引起MAUP問題的具體原因,即從小單元到大尺度的空間聚合過程中,數據屬性值的聚合以及空間劃分的不同共同導緻了信息缺失現象,從而引起MAUP問題。葉博士表示,分區效應描述了同一尺度下由于數據組合不同所造成的相關統計結果的差異性,即區劃方案所導緻的結果偏差。因此,MAUP是造成假設檢驗結果出現統計偏差的原因之一,但究竟其對模型中各統計特征值有何影響,一直是一個尚待定量化描述的問題。
第三,葉博士以多類線性回歸模型為例,說明了聚合值的敏感性變化效應。具體來說,在一元線性回歸中,顯著性檢驗及方差非常穩定,聚合值基本不受MAUP效應的影響。二元線性回歸中,随機變量與雙自變量的相關系數、皮爾遜系數及方差等統計量明顯受到數據聚合程度的影響而呈波動态勢。在多元線性回歸中,用廣義最小二乘法估計模型參數,模型參數的統計檢驗結果表明聚合值表現出顯著的敏感性和不穩定性。
對于如何解決MAUP問題,葉博士提出了三種可行途徑:第一,如果在個體水平的點數據包含所有屬性信息的情況下,我們可以避免MAUP問題。其次,通過優化,即調整分區方案來解決MAUP問題,第三,以建模的方式來解決該問題是有效且科學的途徑。如從本體論的角度,從邊界、拓撲關系等入手,用數學規則來表達不同的分區方案;或者從認識論的角度,根據某一尺度上的信息(要素、結構、特征等),按照一定的規律或方法,從尺度轉換的視角以推繹的方式進行尺度擴展或尺度收縮,從而實現系統要素和結果尺度變化的重新組合或顯現;抑或從方法論的角度,進行一對分區方案的比較。
最後,對地理現象在MAUP問題中的敏感性這一内容,葉博士從概念框架(Conceptual framework)、定義(definition)、拓展(Extensions)及顯著性(Significance)等四個方面進行了梳理。認為MAUP的敏感性的定義涉及了研究區(Study area)、空間劃分(Area zoning)、興趣變量(Interest variable)及總結函數(Summary function)四個組成部分,尤為重要的是,為了表達聚合數據的全部信息損失,葉博士創造性的将敏感性以一種概率分布的形式進行表征,并且提出了合并敏感性、Lebesgue測度敏感性、層次敏感性以及噪聲敏感性等四類總結函數,并且實證研究表明其均可在地理空間分析中進行拓展。同時,葉博士認為,MAUP問題研究的意義,不僅為地理現象的表達提供了信息來源和描述工具,更重要的是,為不确定性地理問題的分析提供了一套完整的診斷和比較工具。
整個講座過程中,現場氛圍融洽,共鳴熱烈,與會師生與葉博士以問題的形式進行了交流,大家紛紛表示受益匪淺。葉博士幽默風趣的談吐和清晰的思路,給師生留下了深刻的印象。
