所有内容 第744页
-
MapReduce连接:复制连接
如图4.5所示,MapReduce复制连接工作原理如下: 使用分布式缓存(Districubted cache)将这个小数据集复制到所有运行map任务的节点。用各个map任务初始化方法将这个小数据集装...
-
大数据可帮助预测未来40日天气情况
EarthRisk是一家利用大数据对未来天气情况作出预报的技术公司。EarthRisk 的旗舰产品是 TempRisk。 它采用的预测模型项源自加州大学斯克利普斯海洋研究所,该模型不同于以往的数值预报...
-
使用Windows Azure搭建Hadoop集群
项目中在私有云中使用CDH (Cloudera Distribution Including Apache Hadoop)搭建Hadoop集群进行大数据计算。作为微软的忠实粉丝,将CDH部署到Wind...
-
企业大数据如何起步:先做好小数据分析
这个问题的答案重点在于大数据应该从小数据开始。因为现在很多企业面临的***问题不是怎么用大数据,而是内部的一些小数据整合出现问题,或者小数据都没用好的情况下怎么用大数据。大数据应该是从小数据逐渐演变上...
-
大数据中非结构化数据的挖掘:文本
搜索词:我们永远无法准确定义用户的搜索词都有哪些;完整URL地址:尤其是含有特定监测Tag的地址;特定监测标签:通常鉴于以URL Tag形式进行监测的情形;页面名称:名称的规范性取决于系统配置信息;用...
-
关于用户行为大数据计算
用户行为类数据的特点在于用户数量庞大,但每个用户的行为数量较小,针对用户行为的计算较为复杂,用户之间的关联计算相对较少。 用户数量庞大。通话记录中的电话号码、访问日志中的用户编号、账户信息中的银行账户...
-
周涛:传统行业更需要大数据
如果你还在等待和顾盼,不妨听听《大数据时代》一书的译者、电子科技大学教授周涛博士的劝告:大数据的道路上没有戈多,我们已经在路上,晃晃悠悠。 举重若轻又行云流水 下班路上,你走进单位附近的川菜馆,在手机...
-
Windows下Redis的安装使用
Redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set...
-
正确使用PostgreSQL的数组类型
在Heap中,我们依靠PostgreSQL支撑大多数后端繁重的任务,我们存储每个事件为一个hstore blob,我们为每个跟踪的用户维护一个已完成事件的PostgreSQL数组,并将这些事件按时间排...
-
大数据精确分析提高能效 物联网助力雾霾治理
雾霾成因复杂 大数据可实现全面监测 虽然雾霾是因为人类的工业活动所导致的污染性灾害天气,但它的形成因素和普通的自然天气一样复杂,在气象预报的分析模型中,影响雾霾形成的因素,涉及到大气物理、化学、生物、...
