
一、系统概述
舆情分析系统集成了舆情釆集、舆情监测、舆情智能分析、舆情处理、舆情预警、舆情搜索、舆情 报告辅助生成、动态图表统计分析等核心功能。实现把互联网“读薄”,把“热点”读懂,萃取 舆情,深度透析热点难点,掌握潜在的变化规律。加强互联网掌握社情,向领导提供准确、 有效的信息分析结果以供决策参考。
二、产品架构
多语言舆敵析&情报分析服务
对比分析 I 跨语言检索
麵库
)
| 纖司提取 | 多语言憧敵析 |
| 文本摘要 | 多语該本分类 |
| Web信息IE^抽取 | |
| 與情振告 | 舆情预警 興情简报 舆情专振 |
| 1 t t | |
| 舆情分析引擎 | 舆情管理 负面信息 自动摘要 敏感话题 自动聚类 |
| 近期热点 热点发现 提取关键词 自动分类 数据分发 | |
| 舆情采集引擎 | 编码识别 | 正文抽取 | 标题抽取 | 发布者抽取 |
| 超链分析 | 内容去重 | 发布时间抽取 | 回帖数量抽取 |
关键词1......关键词
| N | URL1URL2 URL3 URLn |
| 互联网搜索引擎 | 论坛博客新闻......贴吧 |
m
( 主题爬虫
图-
(一)信息釆集
1.主题爬虫:指定信息源,自动、不间断地监测信息源,爬取其中新增的信息。自动、高效 增量式釆集全球主流新闻媒体数据。
(二)信息处理
1.正文抽取:对釆集的原始数据进行预处理,提取需要的正文内容
2.文本分类:对预处理后的资讯进行自动文本分类。
3.关键词提取:提取文本中的关键词,对资讯进行自动标引。
4.情感分析:对文本进行情感分析,对资讯加上情感倾向标签。
5.实体识别:识别文本中的命名实体,包括机构、人物、术语等。
(三)信息分析
1.关系分析:发现信息中包含的实体与实体之间的关系,包括人与机构、机 构与机构等。
2.热点分析:自动发现每天形成的热点事件和专题。
3.舆情分析:监测行业、机构、事件中的舆情指数的变化。
4.态势分析:跟踪和监测行业、机构、事件等发展态势的变化。
(四)结果应用
1.分类浏览:按照行业分类体系,展示釆集和处理过的行业资讯。
2.实时监测:根据定制,监测行业中重要的资讯。
3.资讯捡索:根据用户查询条件,全文捡索行业资讯。
4.热点推荐:系统自动推荐近期热点专题,并展示热点的变化趋势。
5.专题分析:根据用户定制,对与定制专题相关的资讯进行分析,包括舆情分析、态
势分析、关系分析等,并生成专题报告。
6.行业机构:对行业中重要的行业机构进行实时监测,同时分析其变化。
7.行业百科:釆集和行业相关的知识,供用户学习和提高。
8.统计分析:可按时间、业务量等对数据釆集、数据访问等进行统计。
五、产品特点
(一)一体化
实现行业资讯釆集、处理、存储、检索、分类浏览、专题分析、热点分析、发布等一体化资讯服务 流程,为决策提供数据支撑。
(二)智能化
»专题分析:根据用户定制信息,快速生成指定专题的分析结果。
»热点分析:自动发现近期热点专题,推荐给感兴趣的用户,使用户在平台上就能及时了解 国内外热点动态。
(三)个性化
根据用户的特征对其推荐感兴趣的内容,作为用户个人情报夹,避免信息爆炸带来的困扰, 提高情报的利用率。
(四)定制化
根据用户需要定制监测对象、数据源及专题。
(五)跨语言检索
只需中文捡索,返回所有语种信息。
六、我们的案例
(一)多语言舆情分析系统
1.使用单位
»中国工信部下属单位,2014年。
2.系统特点
»全球500-1000家媒体。
»覆盖不同语言:中、英等。
»每天24小时热点跟踪。
»覆盖政治、经济、文化、科技、社会等领域。 »多语言情报机器翻译:提供多语言的理解。
»多语言情报文本分类:政治、经济、科技等。
»多语言情报情感分析:了解全球导向。
»跨语言智能语义捡索:中文捡索、多种语言输出。 »全球热点分析:自动监测和跟踪全球热点。
»全球专题分析:定制全球特定专题的分析。
»全球监测预警:实时跟踪关注信息并预警。
(二)航空情报及舆情分析系统
1.使用单位
»中国商用飞机有限公司,2013年。
2.系统特点
»全球200-300家航空相关媒体。
»覆盖中、英双语。
»每天24小时情报及舆情热点跟踪。
»覆盖航空领域相关以及公司相关舆情。
»公司负面舆情监测及预警。
(三)航空航天科技情报服务系统-AAIS
1.使用单位
»中国航天科工集团三院(航天三院)
2.系统特点
»全球航空航天工业100家媒体。
»覆盖中、英语言。
»每天24小时监测。
»解决内隔离。
3.系统展不
2015年。
辦,_綱! [ 11|獅】
AAIS航空肮天情报全周期服努系统
n
| 页 | 所有3S点 关键词订阅 站点订阅 我的收藏 茼圾检索 个人中心 管理员 | ||
| 1 | |||
■MBDA completes second test launch of MMP combat missile
■Saab orders Gripen E pneumatic missile eject launchers from Exelis
■i?舰獅_身导弹对抗中国g介入勘
■India tests nuclear-capable Prithvi-H missile ■新型反舰导弹将减少对GPS的过度依赖
■印膨oMiaam可能配裔
陆军技术(顚)-新闻 2015-02-18点击量:0 空军技术(讓)•新闻 2015-02-28点击星;0 mm (中国)-5W闻 2015-02-13 点击量:0 陆军技术(讓)-新闻 2015-02-20点击星:0 中国1餓术信息网(中国)2015-02-28点击星;0 国防科技信息网(中国)-国际…2015-02-25点击星:0
丨配罝及更多
USAF evaluates SBIRS Increment 2 ground... Ingenuity Drives Lockheed Martin, s AEH... Lockheed Martin Honors Asian American E...
外电臟-20■相空到l棚 欧洲台腿娜5 n#弹關局开驗无人
(四)全球新兴产业科技与经济资讯服务平台-GEIS
1.使用单位
»中国科技部信息中心,2015年。
2.系统特点
»全球200家媒体。
»覆盖中、英语言。
»涉及领域:新兴金融、节能环保、生物医药、新能源、新能源汽车、新材料、 高端装备、新一代信息技术。
»每天24小时热点跟踪、监测。
»人物及机构监测。
»定制专题舆情分析。
3.系统展示
周三机构强推买入6股极度備 周三机构一致最看好的10金股 Orange Rono智能手机在波兰上市由中兴代工 三星正在研发新款智能手表带有腿圈 事件催化+U:绩超忖期煶发机构畜好四类券商股 周三机构強烈推荐6只牛股 •癉根大通预_称油价下跌或致垃圾债大面枳违约 • 12月2□板块及个股资金迸出大盘点(附股)
热词聚焦
热点推荐
m标致j车
马自达6现金优惪1.4万现车兖足 荣威W5店内现车兖足价格直降1.88万
MG GT店内可试乘试驾最低9.59万起售 比2迪G5可试乘试驾价格稳宗暂无优惠
七、我们的荣誉
(一)多引擎机器翻译系统ZZX_MT
»系统多次参与机器翻译领域相关竞赛,名列前茅。
»获多项基金支持
(1)国家自然科学基金《基于图的机器翻译关键技术研究》
(2)教育部博士点新教师基金《基于维基百科的平行语料库自动抽取》
(3)软国重开放课题《领域自适应的科技机器翻译技术研究》
(4)985高校基础科研业务费《维-汉统计机器翻译关键技术研究》
(二)多语言情感分析&文本分类
»参加2012年计算机学会组织的“情感分析评测”任务(NLP&CC),在38个单位 中综合排名前3。
» 2013年COAE多语言情感倾向分析,综合排名前3。
(三)多语言文本挖掘
»获863项目《面向管理的大数据内容理解与智能服务》支持
八、我们的优势
»覆盖全球不同语言、不同国家、不同行业的500-1000家主流媒体信息釆集、统一存储 及捡索。
»机器翻译、多语言信息处理、复杂数据分析领域的深入研究。
»积累了十余年的工作基础。
»多语言情报分析&舆情分析领域的项目实践。
九、我们的核心技术
(一)多引擎机器翻译系统ZZX_MT
1.特点
»多语言:英、日、韩、越、俄、德、藏、蒙、维。
»多引擎:基于统计、基于规则、基于实例、基于Pivot。
»多领域:新闻、科技、生物、金融、专利。
2.结构图
(二)多语言情感分析&文本分类
1.特点
»多语言:中、英、日、韩、越、俄等 »多粒度:篇章级、句子级、词级 »多引擎:基于统计、基于规则、基于迁移学习
2.结构图
(三)关系抽取&人际关系抽取
1.特点
»覆盖200多种人际关系:父子、夫妻、兄弟、师长、同事等
2.举例
从自然文本自动抽取关系 与事件相结合,分析事件中涉及的人物 挖掘人与人之间的关系路径
、机构及其关系
(四)多语言文本挖掘
1.多语言热点发现与跟踪
»自动发现当前的热点,对热点进行有效描述,包括概述、关键人物、关键资源等信息
»对热点的发展态势进行跟踪;
2.多语言专题分析
»对选定的专题进行自动摘要、关键词提取、发展态势分析、舆情态势分析。
(五)跨语言智能语义信息检索 1■特点
»研究以汉语为提问语种,其他语种(包括英语、日语、韩语等)为信息语种的跨语言 捡索。
»面向多语言的查询扩展
(1)提问式和文献翻译式方法相结合
(2)文献翻译扩展和查询翻译扩展相结合
2.结构图
十、试用产品
http://geis.gytec.net/specialNews_init
