|
- 2018
基于随机森林的流动摊贩分布模型
|
Abstract:
流动摊贩聚集是我国城市管理的难题。相关研究多针对流动摊贩形成与管理的机制,对特定街道进行实证分析,而缺少针对区域流动摊贩分布的定量建模。流动摊贩形成与许多因子有关,各因子关系复杂,所选建-模算法随机森林建立适用于特征值关系复杂的分类器,不需要依赖贡献度大的单个因子,并且能够一定程度回避其他分类算法常有的噪声、异常值和过拟合造成的问题,得到高精度的预测模型,同时能够在此基础上得到各因子的贡献度,为进一步研究流动摊贩问题提供依据。根据文献和实地调查分析,选择房价、街道段长度、路口岔口数量、段内外公交线路数量等因子作为建模的特征值。以广州海珠区为例,将流动摊贩数量分为4个等级,等级1对应0个流动摊贩,等级2对应1~10个流动摊贩,等级3对应11~20个流动摊贩,等级4对应20个以上流动摊贩。通过模型训练和参数调整,使用卡帕系数和整体精度作为标准,选择性能最优的预测模型。基于随机森林的流动摊贩分布模型预测流动摊贩的空间位置,一定程度揭示流动摊贩形成和分布的规律,可用于城市规划和管理,同时辅助流动摊贩的相关研究