登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書

『簡體書』文本挖掘技术及其应用

書城自編碼: 2794075
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: 谢邦昌 朱建平 李毅 著
國際書號(ISBN): 9787561559710
出版社: 厦门大学出版社
出版日期: 2016-03-01
版次: 1 印次: 1
頁數/字數: 160/280000
書度/開本: 16开 釘裝: 平装

售價:HK$ 48.0

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
形似神异:什么是中日传统政治文化的结构性差异
《 形似神异:什么是中日传统政治文化的结构性差异 》

售價:HK$ 55.8
养育不好惹的小孩
《 养育不好惹的小孩 》

售價:HK$ 77.3
加加美高浩的手部绘画技法 II
《 加加美高浩的手部绘画技法 II 》

售價:HK$ 89.4
卡特里娜(“同一颗星球”丛书)
《 卡特里娜(“同一颗星球”丛书) 》

售價:HK$ 87.4
伟大民族:从路易十五到拿破仑的法国史(方尖碑)
《 伟大民族:从路易十五到拿破仑的法国史(方尖碑) 》

售價:HK$ 188.2
古今“书画同源”论辨——中国书法与中国绘画的关系问题兼中国画笔墨研究
《 古今“书画同源”论辨——中国书法与中国绘画的关系问题兼中国画笔墨研究 》

售價:HK$ 132.2
《日本文学史序说》讲演录
《 《日本文学史序说》讲演录 》

售價:HK$ 72.8
无尽的海洋:美国海事探险与大众文化(1815—1860)
《 无尽的海洋:美国海事探险与大众文化(1815—1860) 》

售價:HK$ 99.7

 

建議一齊購買:

+

HK$ 148.5
《基于R语言的自动数据收集:网络抓取和文本挖掘实用指南》
+

HK$ 85.8
《Visual FoxPro数据库程序设计实践与题解》
+

HK$ 266.2
《SQL Server 2012宝典(第4版)(SQL Ser》
+

HK$ 182.9
《数据库设计与关系理论(关系数据库设计领域的经典之作,关系数据》
+

HK$ 172.3
《Oracle数据库编程经典300例(含DVD光盘1张)》
內容簡介:
《文本挖掘技术及其应用》包括四个部分。第一部分包括两章,介绍常用文本挖掘技术,总结基本流程。第二部分共五章,在R软件上详细介绍了文本挖掘,包括R 软件的简介与安装,文本挖掘所需的基本R包,Facebook、微博、Twitter、网页等爬虫技术、数据预处理如断词、字词处理、语料库建立等,资料 分析如关联分析、集群分析、主成份分析和聚类分析。第三部分共两章,在MS SQL Sever上介绍如何实现文本挖掘,第一章是数据预处理技术,包括怎么导入文本数据、建立字词与词向量、建立训练集和测试集,第二章在MS SQL Sever上实现常用的文本数据挖掘方法,并进行图表分析。第四部分为顾问公司和新闻网合作的案例。
目錄
第一部分文本挖掘技术
第一章 技术介绍
1.1 整合文本挖掘与数据挖掘 7
1.2 基础技术 10
第二章 资料分析
2.1 挖掘流程 20
2.1.1 数据分析 21
2.1.2 基础挖掘 26

第二部分文本挖掘以软件R为例
第一章 绪论
1.1 什么是Big Data 31
1.2 数据挖掘 32
1.3 文字挖掘 33
1.4 R软件 34
1.4.1 R简介 34
1.4.2 R的特色 34
1.4.3 R的基本安装 35
1.4.4 包安装 35
第二章 基本工具
2.1 基本工具 37
2.1.1 安装rJava包 37
2.1.2 安装Rwordseg包 37
2.1.3 安装tm包 38
2.1.4 安装tmcn包 38
2.1.5 安装wordcloud、ggplot2、graphics包 38
2.1.6 安装Rfacebook、Rweibo、Rtwitter包 38
2.2 社群开放平台权限申请 39
2.2.1 如何获得Facebook权限 39
2.2.2 如何获得Weibo权限 46
第三章 文字挖掘之爬虫
3.1 R Facebook 50
3.1.1 使用者发文 50
3.1.2 粉丝者发文 51
3.1.3所需R包(Rfacebook、fbOAuth、getPage、getPost) 54
3.2 R Weibo 58
3.2.1 主题 58
3.2.2 时间区间 59
3.2.3 所需R包(XML、Rweibo、web.search.content) 61
3.3 R Twitter 64
3.3.1 关键词 64
3.3.2 所需R包(devtools、rjson、bit64、httr、twitteR、sink) 66
3.4 网页爬虫 70
3.4.1 爬一般网页文字 70
3.4.2 爬PTT网页文字 74
3.4.3 所需R包(XML、RCurl) 76
3.5 SpideR 79
3.5.1 所需R包 79
3.5.2 有关爬虫时的注意事项 79
3.5.3 抓取网页数据的标准作业程序 80
3.5.4 R IDE的Encoding 80
3.5.5 读取档案或网页的Encoding 81
3.5.6 R IDE 开发SpideR 面对Encoding 的解决方案 82
第四章 数据预处理
4.1 编码处理 83
4.2 代表性语料库、词库简介 85
4.3 断词方法 90
4.4 字词处理 93
4.5 语料库建立 95
4.6 正则表达式Regular Expressions 98
第五章 资料分析
5.1 频率 99
5.2 DTMTDM matrix 100
5.3 关联分析 103
5.4 集群分析 104
5.5 主成份分析 109
5.6 词云聚类分析 114

第三部分文本挖掘 MS SQL Sever
第一章 数据预处理
1.1 汇入文档 NGArticles 120
1.2 建立NGArticles的辞库 130
1.2.1 建立字词 Dictionary 130
1.2.2 建立词向量 145
1.2.3 建立Train Sample和Test Sample 154
第二章 资料分析
2.1 串联Train Sample、Test Sample和TermVectors 160
2.2 建构datamining模型(判定树、类神经网络、罗吉斯回归) 164
2.3 图表分析 173
2.3.1 各模型之精确度图表分析 173
2.3.2 判定树图表分析 175
2.3.3 类神经网络图表分析 176

第四部分 TextMining在实务上的应用
1.1 创造商机 205
1.2 结语 213

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.