大河舆情监测中心系统功能特点
大河舆情监测中心系统功能特点
2016-07-12 16:14:04
随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。因此,在这个互联网信息火速传播的信息时代,通过对互联网信息的采集和分析来发现社会公共事件、社会热点问题和民意问题,来改善社会民生、经济发展有着至关重要的作用。
大河舆情监测中心系统有以下特点:
自定义URL来源及采集频率。大河舆情监测系统用户可以设定采集的栏目、URL、更新时间、扫描间隔等,系统的扫描间隔最小可以设置成1分钟,即每隔一分钟,系统将自动扫描目标信息源,以便及时发现目标信息源的最新变化,并以最快的速度采集到本地。
支持多种网页格式。大河舆情监测系统可以采集常见的静态网页(HTML/HTM/SHTML)和动态网页(ASP/PHP/JSP),还可以采集网页中包含的图片信息。
支持多种字符集编码。大河舆情监测系统采集子系统能够自动识别多种字符集编码,包括中文、英文、中文简体、中文繁体等,并可以统一转换为GBK编码格式。
支持整个互联网采集。大河舆情监测系统元搜索模式是以国内知名互联网搜索引擎的结果为基础,用户可直接面向互联网定制自己想要采集的互联网连接,输入搜索关键词就可以了。
支持内容抽取识别。大河舆情监测系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标内容主体。
基于内容相似性去重。大河舆情监测系统通过内容相关识别技术自动判别分类中文章的关系,如果发现描述相同事件的文章会自动归类到一个文章主题下,并显示此主题下有都多少篇相同的文章以及链接。