舆情监控系统介绍
目录
舆情监控系统介绍 ........................................................................................................................... 1 1. 系统简介 ................................................................................................................................... 3 2. 功能架构 ................................................................................................................................... 3 3. 功能介绍 ................................................................................................................................... 4
3.1 信息采集 ....................................................................................................................... 4
3.1.1 采集特性 ........................................................................................................... 4 3.1.2 采集任务 ........................................................................................................... 4 3.1.3 采集源管理 ....................................................................................................... 5 3.1.4 采集模板 ........................................................................................................... 7 3.1.5 参数设置 ........................................................................................................... 8 3.2 监控设置 ....................................................................................................................... 8
3.2.1. 分类管理 ........................................................................................................... 8 3.2.2. 监控设置 ........................................................................................................... 9 3.3 信息管理 ..................................................................................................................... 11
3.3.1. 简报管理 ......................................................................................................... 11 3.3.2. 信息管理 ......................................................................................................... 11 3.4 统计分析 ..................................................................................................................... 12
3.4.1. 统计 ................................................................................................................. 12 3.4.2. 分析 ................................................................................................................. 15 3.5 门户管理 ..................................................................................................................... 15
3.5.1. 用户管理 ......................................................................................................... 15 3.5.2. 门户管理 ......................................................................................................... 16 3.5.3. 访问统计 ......................................................................................................... 17 3.6 系统设置 ..................................................................................................................... 18
3.6.1. 管理员管理 ..................................................................................................... 18 3.6.2. 数据管理 ......................................................................................................... 18 3.6.3. 数据设置 ......................................................................................................... 19 3.6.4. 系统设置 ......................................................................................................... 19 3.7 前台展示 ..................................................................................................................... 20
3.7.1. 首页 ................................................................................................................. 21 3.7.2. 舆情汇总 ......................................................................................................... 21 3.7.3. 专题浏览 ......................................................................................................... 23 3.7.4. 热点舆情 ......................................................................................................... 23 3.7.5. 趋势分析 ......................................................................................................... 23 3.7.6. 舆情简报 ......................................................................................................... 23 3.7.7. 统计分析 ......................................................................................................... 23 3.7.8. 我的关注 ......................................................................................................... 23
1 / 23
3.7.9.
用户设置 ......................................................................................................... 23
2 / 23
1. 系统简介
舆情监控系统集成了舆情采集、舆情监测、舆情智能分析、舆情处理、舆情预警、舆情搜索、舆情报告辅助生成、动态图表统计分析等核心功能。实现把互联网“读薄”,把“热点”读懂,大浪淘沙般萃取舆情,深度透析热点难点,掌握潜在的变化规律。实现“帮领导干部读网”,该系统在加强互联息监管,应对网络突发的公共事件,掌握社情方面,可向领导提供准确、有效的信息分析结果以供决策参考。
2. 功能架构
3 / 23
3. 功能介绍
3.1 信息采集
3.1.1 采集特性
可以多台服务器,多线程分布同时采集。 提供全网采集和定点采集。
对于有些论坛博客必须登陆才能采集时,系统在规则编写时可填写登陆账号
密码登陆采集。
对同一链接数据发生变化时,系统可进行更新采集。
通过灵活方便的采集调度系统,支持全天24小时对数百上千个网站进行采
集监控、分过滤。
支持图片、文档等多种媒体格式文件下载,并实现可自定义媒体格式。 界面化的规则定制工具,帮助系统更准确地配置采集抽取规则。 实时地采集监控与数据统计功能,帮助全面了解系统运行状态。
3.1.2 采集任务
3.1.2.1 启动/停止采集
启动/停止采集的主要功能是对采集状态进行实时监控,点击
按钮,系统爬虫会抓取系统当前配置的站点,并实时显示抓取状态信息。
4 / 23
3.1.2.2 地址库管理
地址库主要是存储爬虫从各个站点获取的所有的地址,管理员可以通过地址库查看某个站点的采集情况,已获取的地址的状态有三种:正常采集,未采集,出错。
3.1.3 采集源管理
3.1.3.1 站点分类
站点分类主要作用是有效的管理站点,用户可以根据业务需要添加有意义的分类即可。
5 / 23
3.1.3.2 更新策略
更新策略的主要作用是设置站点的采集地址扩展方式和站点采集数据更新时间方式,每个站点都必须对应一个更新策略,系统会根据更新策略来调度爬虫对各个站点的采集先后顺序。
扩展方式:站点对应上一个设置了扩展方式的更新策略后,以站点URL 为入口的地址获取需要以此扩展方式过滤地址,只有符合此扩展方式的地址才能存进地址库,爬虫才会解析其内容。
更新方式:站点对应上此更新策略后则按照此更新方式中设置的时间去更新已经采集过的站点。
3.1.3.3 站点管理
舆情监控系统数据采集功能的核心配置在于站点管理的配置,一般可以整个网站首页作为站点入口,也可以某网站的栏目入口作为站点入口。此时不同的站点可以对应相同的数据采集模板。站点也可以添加只用于解析本站点的采集规则。新建站点后,可以对站点进行增加,修改,删除,查找及禁用和启用的操作。 3.1.3.4 抓取测试
抓取测试主要是在进行站点配置过程中先用具体的地址进行测试规则配置的正确性,可以使用户更快速准确的找到配置的问题。
6 / 23
选择一个要测试的站点,输入一个地址,如地址匹配正确,点击测试后页面会直接显示数据采集结果,结果会显示页面中抽取的作者,日期,浏览数,评论数,正文等内容。如匹配错误,页面会有相应的提示。 3.1.3.5 截图设置
截图设置的主要功能点是定时对自己配置的网站地址进行截图: 刷新纪录:刷新当前页面 新增设置:新增一个截图站点 删除选中的设置:删除截图站点 名称:新增的站点名称 url:需要截图的url地址
执行时间一:指定周期截图的每天截图时间 执行时间二:指定周期截图的每天截图时间 执行时间三:指定周期截图的每天截图时间 保留时间: 图片在服务器上保存的天数 保存:保存当前设置
3.1.4 采集模板
3.1.4.1. 采集分类管理
模板分类管理主要是管理模板资源库中的采集模板,添加一级分类,点击
添加二级分类,同理添加三级分类,最多可以添加3级。选中一级
或二级分类,点击【查看子类】可以查看当前选择的分类的子类。 3.1.4.2. 采集模板管理
模板管理的主要功能是设置采集站点的模版,系统可以根据模板配置解析获取地址中指定的内容。
管理员可以对采集模板进行修改,删除,检索,导入,导出的操作。
7 / 23
3.1.5 参数设置 3.1.5.1. 采集设置
采集设置的主要是设置爬虫采集最大线程数,系统默认设置为40,用户可根据网络情况及服务器配置修改采集线程数;单站点爬虫数为同时采集一个站点的最大爬虫数<=采集线程数。
3.1.5.2. 网络设置
网络设置的主要功能是设置网络采集连接参数和代理服务器,用户可新增,修改,删除并测试采集代理服务器,并设置网络连接的各个参数。
3.1.5.3. 图片设置
系统采集数据时会把相关图片保存在本地,如新闻中的插图,系统默认的存放路径为本系统安装路径下。用户可以修改图片存放路径。
3.2 监控设置
3.2.1. 分类管理
主要是设置本地采集数据的监控分类及监控词。系统会依据此分类下的规则去搜索本地已采集的数据,从而达到监控采集数据的效果。已添加的分类会在“信息管理” 中看到监控效果。
舆情监控为分类的根目录,是本系统的默认配置。用户可添加舆情监控的子
8 / 23
分类,可添加多级,建议监控分类设置为三级。具体添加方法说明如下:
点击舆情监控,在右侧主页面中点击新建子目录,输入分类名称;分类规则分普通规则和高级规则:
普通规则:标题:输入一个字符串,表示搜索标题中包含该字符串的数据。 内容:输入一个字符串,表示搜索内容中包含该字符串的数据。
3.2.2. 监控设置
3.2.2.1. 过滤词设置
过滤词设置主要功能是对采集数据的存储时做过滤,只有解析出的数据符合过滤字符要求,才会被存储。具体字符设置方法请参考下图:
3.2.2.2. 同义词设置
同义词设置的主要功能是方便用户检索,设置为同义词的词语,当搜索其中一个词时,其同义词也会作为搜索条件,同义词相关结果会被检索出来。同义词组名是为了管理一组同义词,一组同义词之间是用逗号或空格隔开。
9 / 23
3.2.2.3. 负面词设置
设置前台负面情报中的站点搜索负面词。多个词之间用空格分开。
3.2.2.4. 热点监控
专题监控主要功能是用户开启一个定时任务,由系统自动进行对采集数据的聚类,此目录是生成聚类图后系统自动创建的。系统生成的聚类图可以在“热点聚焦”查看各个分类下的效果图。 3.2.2.5. 全网监控
全网监控主要功能是用户开启一个定时任务,在指定时间开始在指定的几个搜索引擎中进行搜索数据。该功能默认是启动的,默认监控间隔时间用户可修改。
10 / 23
3.3 信息管理
3.3.1. 简报管理
3.3.1.1. 模板风格管理
模板文件是系统内置的一个模板文件名叫report.html,即生成的简报的格式可以在模板中由用户自定义,包括段落,字体等样式。提示:文件report.html中的内容,用户只可以修改简报内容的样式。
3.3.1.2. 简报模板管理
简报模板管理的主要是为系统自动生成简报时设置模板。其中要设置生成简报的模板,显示模版的信息列表,包括模板名称,栏目数和创建时间。管理员可对模版进行基本的增、删、改、查功能。
3.3.1.3. 简报管理
在此用户可以对已生成的简报列表进行查看、发布、删除、修改、重新生成等操作。
3.3.2. 信息管理
在“分类管理”中设置完分类及监控词后,在此显示所有的已设置的分类,
11 / 23
在每个分类后面会显示出符合当前监控条件的数据总数;点击分类名在主页面会显示该分类下的已采集的所有的数据。
删除数据:默认主页显示的数据是本地索引文件中该分类下的数据,选择一条或多条数据可以删除已选数据。
据导出:可以将搜索出来的结果导出为excel 文件。选中一条或多条后,点击数据导出导出已选择的数据。
不选择任何数据直接点击数据导出则导出当前搜索结果的前一百条数据,默认按发布时间排序。导出的字段在“数据导出设置”中设置。
页显示:可以设置某些数据作为前台的图片显示新闻。选择一条或多条数据,点击首页显示即可。设置首页显示的数据会列在“首页新闻设置”。 若没有手动设置任何数据首页显示,则默认从所有的索引数据中随机选择10 条数据前台显示。
检索数据:在分类搜索结果页面中选择正文,输入关键词,点击检索,表示在当前分类的结果中再搜索正文中包含关键词的数据。
3.4 统计分析
3.4.1. 统计
3.4.1.1. 按时间统计
此功能主要是统计各个监控分类数据在一定时间段内的采集情况,统计结果
12 / 23
用折线图以及表格形式展现。用户首先点击“选择分类”在分类树种选定分类,然后选择按月统计、按季度统计、半年统计或按年统计。具体的统计中又可以选择按周或按日统计。用户可选择统计图的宽度,最后点击“统计”即可看到统计图,如:
13 / 23
3.4.1.2. 按站点统计
此功能主要是统计指定的已添加的站点在一定时间段内的数据采集情况,统计结果用饼图以及表格形式展现。首先选定站点,然后选择按月统计、按季度统计、半年统计或按年统计。用户可选择统计图的宽度,最后点击“统计”即可看到统计图。
3.4.1.3. 按数据量统计
此功能主要是统计每天的数据采集情况,统计结果用柱状图形式展现。首先选定站点,然后选择按月统计点击“统计”即可看到统计图。
14 / 23
3.4.2. 分析
3.4.2.1. 热点聚焦
热点聚焦即专题监控的效果图,当用户开启“热点监控”功能后,系统在指定时刻对分类监控数据进行聚类,点击某个分类,选择聚类图片生成日期及聚类图片类型,点击“查看”,如下为一张聚类图:
3.5 门户管理
3.5.1. 用户管理
3.5.1.1. 用户组管理
用户组的主要为实现对前台用户的分组管理。
15 / 23
3.5.1.2. 用户管理
用户管理的主要是实现对前台用户的增加,删除,修改。新建的用户默认是启用的,选中某用户后设置为禁用,则该用户不可用。页面中标有(*)的为必填项。其中过期日期表示管理员在添加用户时可以设置某用户的自动过期时间,到设置的时间后该用户则不可用。如不填写表示永久不过期。
3.5.1.3. 权限管理
权限管理主要为实现针对不同的用户组开放不同的监控数据。页面中显示所有的前台用户组,如点击某用户组名可直接为该用户组选择要监控的分类。
3.5.2. 门户管理
3.5.2.1. 热门关键词设置
热门关键词管理主要是设置当前用户关注的热门词语,在前台会显示出用户设置的词,用户可以通过点击热门词语进行搜索与热门词相关的信息。 3.5.2.2. 首页新闻设置
该功能设置某些数据可以在前台显示,首页显示的数据会列在“图片新闻设置”的列表中,用户可以删除列表中的数据,即不让某条数据在前台显示,而不是真正的从本地存储索引数据中删除。
16 / 23
3.5.2.3. 预警信息设置
要监控的预警词,当采集数据中出现此关键词时,系统会自动给用户提示。在文本框中输入预警词,点击提交即可,多个词之间用空格分开。 3.5.2.4. 意见征集
是系统为前台用户和后台管理者提供一个互动机制, 前台用户可通过这个向后台用户反馈信息。
管理员管理前台用户所提交的意见,包括新增,查看,删除等。当删除某条意见时,该条意见只会被放到回收站,放到回收站的数据可以恢复为正常状态。删除回收站中的记录会彻底删除该条数据。
3.5.3. 访问统计
3.5.3.1. 总量访问统计
总访问量的功能是分别按小时,按天或按月统计前台用户的访问情况,选择统计方式,点击开始统计即可。
17 / 23
3.6 系统设置
3.6.1. 管理员管理
共有三大功能模块,修改密码,管理员管理,管理权限。具体使用参考门户管理-用户管理,在此不在复述。
3.6.2. 数据管理
3.6.2.1. 存放位置
本菜单功能主要是设置系统采集数据到本地的存放位置,管理员可以修改此路径。
3.6.2.2. 端口设置
设置、修改索引模块端口配置信息。 3.6.2.3. 数据清理
按时间范围优化、删除数据。
3.6.2.4. 索引重建
对采集的数据重新建立索引。
18 / 23
3.6.3. 数据设置
3.6.3.1. 数据导出设置
数据导出设置的主要功能是设置“信息管理”数据导出功能的导出字段。
3.6.4. 系统设置
3.6.4.1. 系统信息
系统信息主要显示用户系统当前的基本配置状态,刷新页面可以看到系统运行中各个参数。
19 / 23
3.6.4.2. 系统开关设置
特色功能设置。
3.7 前台展示
前台展示的内容是后台管理程序对采集的信息经过分析、处理后结果展现给最终用户。包括的功能有:首页、舆情汇总、专题浏览、热点舆情、趋势分析、舆情简报、统计分析、我的关注、用户设置等九大功能模块。
20 / 23
3.7.1. 首页
首页的展示的信息有信息采集的汇总情况,系统根据后台的信息分类自动提取的热点人名、词汇、热点舆情、图片新闻舆情及热点舆情聚类分析结果图等等。
3.7.2. 舆情汇总
用户可根据站点分布、区域分布,主动地检索相关舆情信息。
21 / 23
22 / 23
3.7.3. 专题浏览 3.7.4. 热点舆情 3.7.5. 趋势分析 3.7.6. 舆情简报 3.7.7. 统计分析 3.7.8. 我的关注 3.7.9. 用户设置
23 / 23
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igbc.cn 版权所有 湘ICP备2023023988号-5
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务