全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

一种基于hadoop平台的并行朴素贝叶斯网络舆情快速分类算法

Keywords: 网络舆情,hadoop,mapreduce,朴素贝叶斯,分类,利用《知网》和领域关键词集扩展方法的短文本分类研究

Full-Text   Cite this paper   Add to My Lib

Abstract:

?[目的]研究hadoop平台下一种改进的并行朴素贝叶斯算法并实现网络舆情信息分类。[应用背景]网络舆情信息存在数据量大,分散度高,数据非结构化等特点,现有技术难以实现网络舆情的准确、快速分类。[方法]利用hadoop平台分布式数据存储与并行处理的优良特性,实现朴素贝叶斯分类算法的并行化运行;将采集的舆情文档依照hdfs架构进行本地化存储,并通过mapreduce进程完成并行分类处理。[结果]对mapreduce封装后的并行朴素贝叶斯分类算法进行性能测试,结果表明本算法分类效率比集中式舆情分类算法提升82%,分类准确率达到85%以上。[结论]本算法能够有效提升网络舆情分类能力与分类效率。

Full-Text

comments powered by Disqus

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133