QQ在线咨询
软件综述:


舆情是“舆论情况”的简称,原意是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者及其政治取向产生和持有的社会政治态度。随着社会信息化水平的不断提高,舆情已超出社会政治领域,企业甚至个人都暴露在社会舆论之下,公众的态度、意见直接影响到他们的经营、声誉、价值,舆情成为一种具有广泛需求的信息服务。


舆情监测,是指整合互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。通过相关的专业舆情软件按照一定的规则和算法将互联网上繁杂的数据信息当中用户所关注的信息抓取出来,并通过分析过滤等方式,最终呈现出与需求相匹配的舆情信息,并以舆情报告形式呈现。针对在一定的社会空间内,围绕一定社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度于网络上表达出来意愿集合而进行的计算机监测的系统统称。

创想舆情监测系统的开发是为监测互联网舆情,并针对舆论分析处置。在单位内部上报,审批,提议,处理等整套办公流程。

创想舆情监测系统通过功能强大的软硬件设施,针对性地对新闻门户网站、论坛、博客、微博等分类设置采集源,自动对两万多家网站(监测对象可以动态扩充、并可以通过VPN私密隧道技术监测海外网站)的海量信息进行24小时不间断地浏览对关注的网络舆情信息进行快速识别和定向追踪,实现象预报天气一样预告各地区、各行业的网络舆情热点。




软件特点:


一.自定义URL来源及采集频率
用户可以设定采集的栏目、URL、更新时间、扫描间隔等,系统的扫描间隔最小可以设置成1分钟,即每隔一分钟,系统将自动扫描目标信息源,以便及时发现目标信息源的最新变化,并以最快的速度采集到本地。

二.支持多种网页格式
可以采集常见的静态网页(HTML/HTM/SHTML)和动态网页(ASP/PHP/JSP),还可以采集网页中包含的图片信息。

三.支持多种字符集编码
采集子系统能够自动识别多种字符集编码,包括中文、英文、中文简体、中文繁体等,并可以统一转换为GBK编码格式。

四.支持整个互联网采集
互联网舆情信息监测系统使用自主研发的网络搜集器直接面向互联网定制内容进行直接采集,用户只需要输入搜索关键词就可以了。

五.支持内容抽取识别
系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标内容主体。

六.基于内容相似性去重
通过内容相关识别技术自动判别分类中文章的关系,如果发现描述相同事件的文章自动去除重复部分。

七.个性化批注
用户查看情报后可以填写备注及说明,并可上传相关的附件,使后来访问者更容易理解情报的内容。

八.信息分析优势
1. 信息分类准确:自动将采集到的信息分类到客户指定需求点下。
2. 支持客户提出的多级分类方法。
3. 操作界面提供自动标签:进行信息的多维度分类标记,如正负面、型号、发布意图等。
4. 为操作人员提供方便易用的信息处理工具进行信息情感标识(正负面)。

九.技术接口支持
1. 能够根据客户提供的接口发送数据。
2. 根据数据具体情况与客户技术人员协商新接口,改进客户系统接收数据效率。
3. 通过接口每日定时发送近10天客户所关心信息的访问量、点击量的变化。

十.文章快照
1. 提供快照保存和访问功能。
2. 为快照提供客户关键字高亮功能,准确标识关键词。

十一.统计报表
1. 根据客户提供的需求和模板定期生成信息统计报告
① 按照网站的多维度统计;
② 按照一次及二次分类统计;
③ 按照多维度的标签分类统计;
④ 上述分类的交叉统计。

十二.智能索引技术
以业界公认领先的分词为基础的中文智能计算技术。提供了互联网信息处理做需的模式、语义、行为分析引擎,支持多种维度数据自动智能标引。 利用海量多年中文智能计算服务积累知识库体系。提供了丰富的通用知识支持,和灵活开放的知识交互接口,保证了用户的业务知识可以有效利用与对数据的标引。




功能架构:


一.网络舆情采集
实时监测万余家网站最新信息,包括国内主要新闻网站、活跃的论坛、博客、微博客、视频网站、以及境外主流媒体和敌对网站信息。用户可结合需要自动添加监测站点。
采集引擎按照各信息源表现出的网页形式采集信息,网页中包含大量的广告、图片、链接,这些不是舆情关注的价值信息,还给系统的高效运行、检索增加负担,因此需要对网页信息进行预处理。系统分别去识别文章的标题、来源、作者、发布时间、正文等,并形成结构化数据供后续的决策分析。预处理包含以下环节:
    ① 超链分析
    ② 编码识别
    ③ URL去重
    ④ 锚文本处理
    ⑤ 垃圾信息过滤
    ⑥ 关键字抽取
    ⑦ 关键信息提取
    ⑧ 正文抽取
    ⑨ 自动摘要

二. 网络舆情分析
1. 自动识别热点网络舆情;
2. 智能判断网民评论/回帖内容的倾向性:观点分析,反对/赞同,及比例统计;
3. 评论跟踪:按照指定时间(如:10分钟)抓取评论数,并分析跟踪到新增评论的原始报道文章及其他相似文章;
4. 数理统计、趋势分析及报表报告生成:
    ① 多维度交叉统计
    ② 生成统计报表
    ③ 近期热点
    ④ 舆情趋势
    ⑤ 突发事件分析
    ⑥ 舆情统计报告

三. 网络舆情专题跟踪
专题分析是对一个舆情事件开展的发展全过程的监测和跟踪,主要分析以下要素:
1.追踪传播媒体
    ① 新闻传播情况:新增报道数量、评论内容、及主要评论倾向的统计;
    ② 论坛传播情况:新增回帖量、回帖内容、及主要回复倾向的统计;
    ③ 微博传播情况:新增粉丝量、传播的观点、及主要评论倾向的统计;
    ④ 视频网站传播情况;
    ⑤ 境外网站的传播情况:报道观点,分析是否与境内官方报道一致;
2.追踪传播数量
    ① 相关专题信息数量的增减情况;
3.追踪传播内容
    ① 分析网民、媒体、主体方各方的言论内容;
    ② 分析内容发展演变过程及趋势;
    ③ 各方内容统计分析;
4.溯源和趋势分析
    ① 专题事件溯源,找到信息的源头;
    ② 专题事件发生、发展趋势分析。

四. 信息探针
用于追踪舆情事件影响力、并自动检查舆情处置结果。主要功效如下:

五. 网络炒手网上活动监测
1. 网络炒手的识别:通过对敏感信息的分析,以发布人的特征、发布时间特征等条件,识别是否存在人为炒作。并对通敏感的网民记者、媒体人和意见领袖实行7*24小时的监测;
2. 提取发布人网络关系特征:网络身份、所属媒体或组织、博客、微博、微博好友、话题讨论关系;
3. 提取发布人相关的网络舆情传播特征数据:发布的敏感信息次数及内容、发起的话题、参与讨论和回复的次数及内容;
4. 发布人影响力的评估:社区发现、传播核心识别、网络舆情传播线索挖掘;
5. 网络炒手自动导入系统功能;
6. 对同一ID的网络行为进行综合分析。

六. 微博监测
起源于2010的微博,经过两年的发展,已经成为舆情事件、社会焦点话题滋生的主战场。微博监控是客户选购软件的最主要的指标,也是各大舆情监测软件公司技术攻关的难点。目前公司的微博监控技术居行业首位,能及时、全面有效地采集到国内外主要的微博信息,如新浪微博、网易微博、腾讯微博、人民网微博、天涯微博、推特、Facebook等。
1.多站点统一发布管理子平台:集成各大微博网站的官方账户,使用时不需逐一登陆、并可统一查看、发布、评论和转发信息;
2.重点人物微博监测:对制定的重点人物的微博进行监控,抓取到该人物所发的所有微博,形成历史性趋势分析;
3.热门话题监测;
4.热门信息排行榜监测;
5.微博信息检索:提供微博的检索功能,自动的从多个微博中检索出查询的信息。检索的方式包括按作者检索以及按内容检索;
6. 微博人际网络图:根据博主之间的关系,如关注、被关注、评论、被评论等,自动的挖掘出其中的人际网络、并生成重点博主的相应网络图。

七. 重点人员监控
监控重点人员在网上发布的有害言论,及时掌握互联网上突发或苗头性事件。重点人员监控是根据互联网上网民公开信息(如:姓名、账号、论坛昵称、博客、微博、邮箱、电话号码等),全面监控该重点人员在互联网上发布的任何信息,及时发现敏感、突发或苗头性信息,便于用户掌握该重点人员在互联网的活动情况。
1.重点人员信息管理
建立重点人员数据库,包括人员名称、网名、相关博客、活跃网站等。系统自动监控其他个人博客、活跃网站上相关文章、信息,及时掌握其网上活动情况。
2.重点人员信息分析
    ① 信息聚类:通过对重点人员的信息进行聚类,找出重点人员中比较关注的话题,分析当前重点人员的舆情热点,提供舆情研判的辅助功能。
    ② 本地信息筛选:通过预先配置关键字,对重点人员发布的信息进行匹配,提供重点信息的查看页面。
    ③ 统计报表功能:提供按时间段、重点人员发布的信息进行统计,提供趋势图,发布网站统计等报表。

八. 领导动态
及时获取网络上和领导相关的舆情信息,对攻击党和政府,煽动不良情绪的信息,有损国家和政府(领导人)形象的网络舆情信息,进行关联性分析,分析事件的发生、发展变化。

九. 网络舆情预警
支持不同级别以及多种不同的方式在第一时间进行舆情信息预警:

十. 证据存取
直接从系统中调出该网页的存档文件,而不实际连接到网页所在的网站,由于是访问本地,这种方式比直接访问所在站点更加安全,可以避免网页内嵌的木马、病毒的威胁;以图片、网页、快照等多种方式存储情报证据。

十一. 搜索方案
用户可以管理、定制个性的搜索方案,在每次查看同样的信息时,需要输入查询条件进行查询,而是系统根据定义的搜索方案自动将相关文章聚合起来。

十二. 可视统计分析
舆情动态趋势可视化统计分析,包括特定时间内特定情报的信息量变化统计,特定时间内对特定舆情报到媒体量变化统计等。
系统对舆情文章的按地域、类别、事件、站点等多维度分析处理以图形图表形式展示分析数据。用户可以方便的查看各项统计数据,同时这也是简报和专报的图形统计来源。

十三. 舆情简报
能够根据文档内容自动抽取文档摘要信息,这些摘要能够准确代表文章内容主题和中心思想。用户无需查看全部文章内容,通过该智能摘要即可快速了解文章大意与核心内容,提高用户信息利用效率。而且该智能摘要可以根据用户需求调整不同长度,满足不同的需求。

十四. 其他功能
    1. 关键词保持修改记录
    2. 关键词的增删和任务的设置等其他要素具有不同的权限
    3. 对于要在6秒钟内完成用户设定的统计,并在界面展示
    4. 全文搜索:随时系统内搜索;
    5. 全网搜索:包括百度,谷歌,必应,搜搜,搜狗,有道;
    6. 境外信息:客户指定境外网站,关注境外法院网络舆情;
    7. 社会热点:各大网站热点新闻,做到社会热点信息不漏;