-
浅谈数据处理中的分词技术
***章:基础介绍 定义:分词技术就是搜索引擎针对用户提交查询的关键词串进行的查询处理后根据用户的关键词串用各种匹配方法进行的一种技术。 概述 我们要理解分词技术先要理解一个概念。那就是查询处理,当用...
-
手游行业运营数据指标观察分析DNU/DAU
最近有幸和一些团队在做数据分析的交流,一个现象是,基于最基本的数据指标,实际上我们并没有深入的理解,或者说,我们并不了解数据,以及背后的用户,使用场景等等。因此,也就造成了,在夹生的数据理解上,我们不...
-
制造业如何利用大数据
如果你正在进行大数据项目,那么有四个因素需要牢记。 1.数据不能脱离实际环境 首先需要说明的是,脱离实际环境的数据的作用将会大打折扣。在生产制造领域,所谓的实际环境可以用工作任务或者执行步骤来提供。每...
-
关于游戏产业的大数据:从概念到实践
事实上,大数据并非新鲜事物,早在上世纪90年代,伴随全球经济的飞速发展,人们对数据积累和分析的需要就已经开始急剧增长,其应用领域开始逐步从天文、气象、军事、基因生物,逐步拓展到搜索、互联网乃至电子游戏...
-
值得在Twitter上关注的十位大数据专家
然而Twitter确实承载着大量极具价值的大数据专业知识——前提是我们知道要在哪里找到它们。与其它社交平台一样,Twitter有时候同样嘈杂而毫无实际价值。如果再加上“大数据”这个时髦词汇,这里的混乱...
-
如何在 TiDB 上高效运行序列号生成服务
TiDB 从 v4.0 版本开始正式支持序列功能,而除了序列之外还有多种序列号生成方案,这些方案在没有对 TiDB 优化的时候一般会产生写入热点问题。本文将介绍如何应对写入...
-
-
大数据议题:分析与直觉之争
大数据技术的下一轮推进是否会彻底抹去人类直觉在关键性业务决策中的作用,从而让企业的运作完全依赖于由数据驱动的分析机制? 也许不会,但随着大数据趋势的兴起、众多企业将越来越多地仰仗分析机制来处理实时决策...
-
TiDB Operator 源码阅读 (二) Operator 模式
在 上一篇文章 中我们讨论了 TiDB Operator 的应用场景,了解了 TiDB Operator 可以在 Kuber...
-
