新書推薦:
《
长高食谱 让孩子长高个的饮食方案 0-15周岁儿童调理脾胃食谱书籍宝宝辅食书 让孩子爱吃饭 6-9-12岁儿童营养健康食谱书大全 助力孩子身体棒胃口好长得高
》
售價:HK$
47.0
《
身体自愈力:解决内在病因的身体智慧指南
》
售價:HK$
98.6
《
非言语沟通经典入门:影响人际交往的重要力量(第7版)
》
售價:HK$
123.1
《
山西寺观艺术壁画精编卷
》
售價:HK$
1680.0
《
中国摄影 中式摄影的独特魅力
》
售價:HK$
1097.6
《
山西寺观艺术彩塑精编卷
》
售價:HK$
1680.0
《
积极心理学
》
售價:HK$
55.8
《
自由,不是放纵
》
售價:HK$
54.9
|
內容簡介: |
随着互联网技术的快速发展和广泛应用,网络媒体已经成为重要的信息传播和交流平台,同时也是网络舆情形成和传播的主要载体。网络舆情通常由突发社会公共事件触发,反映了人们对某一公共事件所表达的认知、态度、情感和倾向性,具有虚拟化、快捷化、多元化、开放性、匿名性及互动性等特点。随着网络舆论影响力的增强,网络舆情已经成为各级政府了解社情民意的重要窗口。随着网络舆论对社会和公众影响的不断增大,出现了网络炒作、造谣传谣等不良的现象,损害了网络媒体公信力,扰乱了网络正常传播秩序,产生了错误的舆论导向,极易引发社会群体性事件。因此,加强互联网管理和舆论治理非常重要和必要。国家大力推进网络舆情监控体系建设,加强对网络舆情监测和引导。网络舆情监测系统在互联网舆情监测中发挥了重要的作用,其系统核心技术就是网络舆情分析技术。网络舆情分析技术主要涉及网络信息采集技术、网络舆情传播机制、话题检测与跟踪技术、文本分割技术、文本情感分析技术等。本书主要介绍了网络舆情分析所涉及的主要方法和关键技术,全书共有7章,分别介绍了网络舆情概论、网络信息采集技术、微博网络信息传播机制、网络论坛舆情传播机制、话题检测与跟踪技术、文本分割技术和文本情感分析技术。在介绍主要模型和算法时,还给出了模型和算法的实验验证,以便读者加深对模型和算法的理解。本书可作为网络空间安全学科相关专业的研究生和本科生教材,也可作为从事相关工作的科技人员及管理人员的参考书。
|
關於作者: |
蔡皖东,西北工业大学计算机学院教授,博士生导师,西北工业大学信息安全学科带头人,从事网络信息空间安全、网络舆情管理等方面的科研和教学工作。
|
目錄:
|
目录
第1章网络舆情概论1
1.1网络舆情概述1
1.1.1舆情与舆论1
1.1.2网络舆情2
1.1.3网络舆情演化3
1.1.4网络舆情实例5
1.2网络舆论空间治理8
1.2.1网络炒作问题8
1.2.2网络大V问题9
1.2.3政务微博作用10
1.3网络舆情传播平台13
1.3.1微博网络13
1.3.2网络论坛15
1.4网络舆情分析技术16
1.4.1网络舆情监测系统16
1.4.2网络信息采集技术17
1.4.3话题检测与跟踪技术20
1.4.4文本情感分析技术22
第2章网络信息采集技术25
2.1引言25
2.2搜索引擎概念25
2.2.1通用搜索引擎25
2.2.2主题搜索引擎27
2.3网络蜘蛛概念29
2.3.1基本概念29
2.3.2通用蜘蛛29
2.3.3主题蜘蛛32
2.4网页搜索算法34
2.4.1网页特征选取34
2.4.2网页搜索算法36
2.4.3链接分级搜索41
2.5网页相似度计算43
2.5.1向量空间模型44
2.5.2相似度计算45
2.6主题蜘蛛组成48
2.6.1系统结构48
2.6.2主题确立模块49
2.6.3爬行模块49
2.6.4相似度计算模块53
2.6.5搜索策略模块53
2.6.6系统界面54
第3章微博网络信息传播机制56
3.1引言56
3.2微博用户转发特性57
3.2.1转发行为特性57
3.2.2转发特性分析61
3.3微博转发行为预测66
3.3.1预测算法66
3.3.2算法验证72
3.4微博转发峰值分析76
3.4.1时间序列概念76
3.4.2峰值特性分析77
3.5微博意见领袖识别87
3.5.1识别方法87
3.5.2算法验证89
第4章网络论坛舆情传播机制94
4.1引言94
4.2网络论坛舆情形成模型95
4.2.1网络论坛结构95
4.2.2舆情形成模型96
4.2.3模型验证98
4.3网络论坛意见领袖识别100
4.3.1论坛有向网络图模型101
4.3.2论坛意见领袖识别算法102
4.3.3算法验证103
4.4网络水军热帖检测106
4.4.1热点话题特征提取107
4.4.2水军热帖检测算法110
4.4.3算法验证110
4.5网络水军账号检测112
4.5.1检测算法113
4.5.2算法验证116
第5章话题检测与跟踪技术119
5.1引言119
5.2基本概念120
5.2.1TDT目标和任务120
5.2.2TDT语料122
5.2.3TDT评价指标122
5.3相关技术124
5.3.1表示模型124
5.3.2相似度计算125
5.3.3特征项选取126
5.3.4文本聚类127
5.3.5文本分类130
5.4话题检测算法133
5.4.1K-MEANS算法133
5.4.2模糊聚类方法135
5.4.3蚁群聚类算法138
5.4.4算法验证139
5.5话题跟踪算法145
5.5.1KNN算法及改进145
5.5.2算法验证146
5.6热点话题检测148
5.6.1检测方法148
5.6.2算法验证151
第6章文本分割技术155
6.1引言155
6.2基本概念156
6.2.1文本分割点156
6.2.2文本分割方法157
6.2.3文本分割算法评价159
6.3基于LDA模型的文本分割161
6.3.1LDA模型161
6.3.2LDA模型改进165
6.3.3相似度计算167
6.3.4边界识别策略168
6.3.5算法验证169
6.4基于VSM模型的文本分割174
6.4.1特征项选取174
6.4.2语义段分割方法176
6.4.3算法验证179
第7章文本情感分析技术181
7.1引言181
7.2基本概念182
7.2.1文本情感分析层次182
7.2.2文本情感分析方法184
7.2.3语言建模方法184
7.3句子情感分析方法185
7.3.1主题句识别方法185
7.3.2主观句识别方法189
7.3.3主观关系识别方法192
7.3.4算法验证195
7.4段落情感分析方法198
7.4.1语义段句子情感标注199
7.4.2语义段句子权重计算199
7.4.3语义段情感计算方法200
7.4.4算法验证202
7.5文本情感分析模型205
7.5.1文本情感模型205
7.5.2模型参数估计208
7.5.3语言模型评价209
7.5.4算法验证211
参考文献214
|
內容試閱:
|
前 言
随着互联网技术的快速发展和广泛应用,网络媒体已经成为重要的信息传播和交流平台,网络媒体被称为继报纸、杂志、广播、电视四大传统媒体之后的第五媒体,人们通过网络媒体提供的新闻、微博、论坛、博客等网络服务可以快捷地交流和共享信息资源,实现广泛的沟通交流,受众不仅仅是信息的接收者,同时也是信息的传播者。因此,网络媒体成为民众表达民意、交流情感的主要窗口,同时也是网络舆情形成和传播的载体。
网络舆情通常由突发社会公共事件触发,反映了人们对某一公共事件所表达的认知、态度、情感和倾向性,具有虚拟化、快捷化、多元化、开放性、匿名性及互动性等特点,主要通过网络新闻、微博、论坛帖子、博客博文等网络媒体进行传播,其中微博网站和网络论坛是主要的信息传播平台。随着网络舆论影响力的增强,网络舆情已经成为各级政府了解社情民意、改进工作作风、提高执政能力的重要窗口。
随着网络舆论对社会和公众影响的不断增大,出现了以网络炒作为营生的网络公关公司、网络推手、网络水军等。网络公关公司以营利为目的,为了炒作某个话题、人物或产品,雇佣了大量的网络水军,在网络推手的组织下,短时期内在互联网的各大网络论坛上大量地发布煽动性帖子,并通过跟帖、转帖及编发评论等方式炮制网络热点事件,营造虚假民意,从而形成虚假的网络舆情。网络公关公司、网络推手、网络水军等形成了灰色利益链,他们在实现客户利益的同时也获得自身利益。随着微博的兴起,网络水军把造谣和传谣的主要阵地从网络论坛转至微博,形成了网络推手、网络水军造势和网络大V的转发影响力相结合的网络谣言制造和传播的灰色利益链,个别网络大V在突发重大公共事件中发表不当言论,或者以求辟谣、求证等方式故意扩散谣言,导致不明真相的网民盲目跟风,损害了网络媒体公信力,扰乱了网络正常传播秩序,产生了错误的舆论导向,危及政府的公信力,极易引发社会群体性事件。
中央高度重视互联网管理和舆论治理,在《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》中指出,牢牢把握正确舆论导向,健全社会舆情引导机制,传播正能量。加强网上思想文化阵地建设,实施网络内容建设工程,发展积极向上的网络文化,净化网络环境。国家通过开展打击网络谣言等专项行动,依法惩戒了利用互联网进行造谣惑众的秦火火、立二拆四等网络大V,使不法网络大V和网络谣言遭到压制性打击,一些被称为推墙派、凿船派、体制婊的网络负能量群体被有效遏制,网络舆论空间逐步呈现风清气正之势。
由于网络舆情已成为各级政府了解社情民意的重要窗口,因此国家大力推进网络舆情监控体系建设,各级宣传主管部门以及主流新闻媒体等都设立了网络舆情监测机构,加强对网络舆情监测和引导。在网络舆情监测中,面对海量的网络信息,必须借助于信息技术来实现网络舆情监测的自动化和智能化。于是,各种网络舆情监测系统便应运而生,其系统核心技术就是网络舆情分析技术。
网络舆情分析技术是一种大数据应用,首先需要对网络舆情来源的网络信息进行实时监测和采集,然后对采集到的网络信息进行处理和分析,主要涉及网络信息采集技术、网络舆情传播机制、话题检测与跟踪技术、文本分割技术、文本情感分析技术等。网络舆情分析技术属于交叉性技术,涉及自然语言处理、计算语言学、人工智能、机器学习、信息检索、数据挖掘等多个研究领域和学科方向。
本书主要介绍网络舆情分析所涉及的主要方法和关键技术,全书共有7章,第1章为网络舆情概论,主要介绍网络舆情概述、网络舆论空间治理、网络舆情传播平台、网络舆情分析技术等内容;第2章为网络信息采集技术,主要介绍搜索引擎概念、网络蜘蛛概念、网页搜索算法、网页相似度计算、主题蜘蛛组成等内容;第3章为微博网络信息传播机制,主要介绍微博用户转发特性、微博转发行为预测、微博转发峰值分析、微博意见领袖识别等内容;第4章为网络论坛舆情传播机制,主要介绍网络论坛舆情形成模型、网络论坛意见领袖识别、网络水军热帖检测、网络水军账号检测等内容;第5章为话题检测与跟踪技术,主要介绍话题检测与跟踪的基本概念、相关技术、话题检测算法、话题跟踪算法、热点话题检测等内容;第6章为文本分割技术,主要介绍文本分割的基本概念、基于LDA模型的文本分割、基于VSM模型的文本分割等内容;第7章为文本情感分析技术,主要介绍文本情感分析的基本概念、句子情感分析方法、段落情感分析方法、文本情感分析模型等内容。
本书在介绍主要模型和算法时,还给出了模型和算法的实验验证,以便读者加深对相关模型和算法的理解。本书可以作为网络空间安全学科相关专业的研究生和本科生教材,对从事相关工作的科技人员及管理人员也能起到很好的参考和启示作用。
由于网络舆情分析技术比较复杂,本书很难覆盖相关技术的方方面面,难免存在不足和疏漏之处,欢迎广大读者批评指正。
本书的主要内容来自于作者及其研究团队的工作总结,张博、罗知林、徐会杰、石磊、杨惠、樊娜及彭冬等同志参与了相关研究工作,并为本书的撰写做出了贡献,对此表示感谢。
最后,感谢西北工业大学教材专著出版基金对本书的大力资助。
作 者
于西北工业大学
|
|