|
现代图书情报技术 2015
科研项目布局差异对比方法研究——以nsf和eufp项目为例Keywords: 科研项目,科研布局,k-means++聚类,轮廓系数 Abstract: ?【目的】弥补目前科研项目布局分析往往局限在单一资助机构简单数量统计上的不足,从内容上提高资助机构布局差异的揭示能力。【方法】针对多源项目数据,提出一种基于文本k-means++聚类算法的分析方法,尝试从科研项目内容揭示不同资助机构的资助方向和布局重点,分析比较各资助机构在研究方向上的资助差异。【结果】使用美国nsf与欧盟fp资助的项目信息进行方法验证与案例分析,发现相对于多个关键词,基于单个关键词构建的文本特征空间有更好的聚类效果。进一步去除项目申请书中项目背景、未来影响等干扰信息,只保留研究内容、研究方法等实质性研究描述文本,k-means++算法的聚类效果有进一步提升。【局限】数据清洗尚不能完全自动实现,聚类参数的预设与调整也需人工参与。【结论】实验与案例证明该方法是可行的,分析结果能够比较直观地反映资助机构的布局差异,对科研管理与决策者审视宏观科研布局、前瞻科技发展方向起到一定的辅助作用。
|