|
图书情报工作 2015
长期保存视角下的中文微博信息采集关键问题探讨Keywords: 微博信息,长期保存,采集范围,采集权利,采集方法 Abstract: ?[目的/意义]对中文微博信息采集的关键问题进行分析,以期为中文微博信息的采集与长期保存研究和实践提供参考。[方法/过程]选取采集范围、采集权利、采集方法3个微博信息采集过程中的关键问题,与网络信息采集进行对比分析,并提出相应的对策。[结果/结论]分析发现,对于微博信息,由于其具有自身特点,无法套用网络信息采集实践的经验,需要确定具有针对性的采集策略与方法;针对选取的3个关键问题,分别建议采取完整性采集、cc协议结合剔除策略、通过api采集的对策。
|