大数据互联网大规模数据挖掘与分布式处理

发布时间:2020-07-28 01:30:41

如上

网友回答

求书的介绍?
众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍了实践中行之有效的数据处理算法,是在校学生和相关从业人员的必备读物。主要内容包括:
分布式文件系统以及MapReduce工具;
相似性搜索;
数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
搜索引擎技术,如谷歌的PageRank;
频繁项集挖掘;
大规模高维数据集的聚类算法;
Web应用中的关键问题--广告管理和推荐系统;
社会网络图挖掘;
降维处理,如SVD分解和CUR分解;
大规模机器学习。
以上问题属网友观点,不代表本站立场,仅供参考!