文字
縮放
增大字体
减小字体
美国加州大学河滨分校 马舒洁教授:Determining the number of communities in degree-corrected stochastic block models

([西财新闻] 发布于 :2019-07-24 )

光華講壇——社會名流與企業家論壇第5509期

 

主題:Determining the number of communities in degree-corrected stochastic block models

主講人:美国加州大学河滨分校 马舒洁教

主持人:统计学院统计研究中心 周岭副教授

時間:2019年8月1日上午10:30-11:30

地點:人人棋牌柳林校区弘远楼408会议室

主辦單位:统计研究中心 统计学院 科研处

 

主講人簡介:

马舒洁教授于2011年在美国密西根州立大学获得统计学博士学位。现为美国加州大学河滨分校终身教授、副教授。担任Journal of Business & Economic Statistics 和Statistica Sinica 等多个统计类国际学术期刊的副主编(Associate Editor)。她目前的主要研究方向包括大规模数据分析,精准医疗,高维数据分析,纵向数据分析及在环境风险估测,营养学,医药学和金融学的统计方法应用。先后在统计学和经济学国际期刊上发表三十余篇学术论文。

主要內容:

We propose to estimate the number of communities in degree-corrected stochastic block models based on a pseudo likelihood ratio. For estimation, we consider a spectral clustering together with binary segmentation method. This approach guarantees an upper bound for the pseudo likelihood ratio statistic when the model is over-fitted. We also derive its limiting distribution when the model is under-fitted. Based on these properties, we establish the consistency of our estimator for the true number of communities. Developing these theoretical properties require a mild condition on the average degree -- growing at a rate of log(n), where n is the number of nodes. Our proposed method is further illustrated by simulation studies and analysis of real-world networks. The numerical results show that our approach has satisfactory performance when the network is sparse and/or has unbalanced communities.

我們提出了一種基于僞似然比來估計度校正隨機塊模型中群體數量的方法。我們考慮將譜聚類和二值分割方法相結合來對該方法進行估計。該估計方式保證了模型過擬合時僞似然比統計量存在上界。我們進一步推導了模型擬合不足時的極限分布。基于這些性質,我們得到了真實群體數量估計量的一致性。這些理論性質需要一個相對寬松的條件——以log(n)的速度增長,其中n是節點的數量。我們通過對實際網絡的仿真研究和分析,進一步說明了該方法的有效性。數值結果表明,該方法在網絡稀疏或群體分布不平衡的情況下具有較好的性能。

☆該新聞已被浏覽: 次★

【打印本文】 【關閉窗口