大数据的主要特征是什么 什么是大数据时代( 三 )


11.什么是数据分析?数据分析是基于商业需要 , 有目的的对数据进行收集、整理、加工、分析 , 最终提炼有价值的信息的过程 。
数据分析的四个步骤:
需求分析、明确目标;
数据收集、加工处理;
数据挖掘、数据展现;
分析报告、提炼价值 。
12.什么是数据埋点?所谓数据埋点就是从应用的特定流程中收集一些信息 , 跟踪用户使用的状况 , 用来提供运营的数据支撑 , 进一步优化产品 。
常见的信息包括独立访客数(UV)、页面浏览量(PV)、页面停留时长、页面跳出率、交互元素的点击事件等 。
数据埋点通常有两种方式:
第一种是研发团队在产品中注入代码 , 并搭建响应的查询平台;
第二种是借助第三方数据埋点工具 , 如神策数据、百度统计等 。
13.什么是数据仓库?数据仓库 (Data Warehouse) 简称DW , 存储大量数据的集成中心 。数据仓库的目的是构建面向分析的集成化数据环境 , 为企业提供决策支持(Decision-Support) 。它为企业提供一定的BI(商业智能)能力 , 指导业务流程改进、监视时间、成本、质量以及控制 。
数据仓库的输入方是各种各样的数据源 , 最终的输出用于企业的数据分析、数据挖掘、数据报表等方向 。
14百思特网.什么是数据百思特网集市?数据仓库是面向整个企业的 , 而数据集市是面向部门的 , 因此规模更小 , 由业务部门设计、开发、管理、维护 , 可以理解为是数据库的子集 。
数据集市就像宜家楼上的家居展厅 , 正如其名字"集市"一样 , 是一个面向最终顾客的数据市场 。在这里 , 数据(家具)以一种更加容易被顾客接受的方式组合在一起 。顾客的需求是分场景的 , 比如客厅、书房、卧室、厨房等 , 因此我们需要创建多个数据集市(展厅) 。
15.什么是数据湖?数据湖至今仍然没有一个特别标准的概念 , 比较统一的是数据湖存储的是未经加工的原始数据 , 包含结构化和非结构化的各类数据 。数据湖就是一个存储了企业所有原始数据的存储 , 对于这些原始数据的管理则更加复杂 。
以宜家家居为例 , 数据湖的原始数据就相当于拆散的零部件 , 顾客可以根据实际需要挑选零部件后自行组装 。
16.什么是数据挖掘?数据挖掘就是从大量的实际应用数据中 , 提取隐藏在其中的有价值的信息的过程 。
一般而言 , 数据挖掘分为两类:一类是监督学习 , 另一类是无监督学习 。监督学习是对目标需求的概念进行学习 , 通过建立模型来实现从观察变量到目标需求的有效解释 。无监督学习没有明确的标识变量来表达目标需求 , 主要任务是探索数据之间的内在联系和结构 。
数据挖掘融合了多学科领域的知识 , 常用的算法有分类、聚类分析、关联分析、趋势与演化分析、特征分析、异常分析等 。
17.什么是数据可视化?数据可视化就是借助图形化的手段 , 清晰有效地传达与沟通信息 。
利用人类对形状、颜色的敏感 , 有效地传递信息 , 帮助用户从数据中发现关系、规律和趋势 。常用的数据可视化图表有柱状图、条形图、饼图、雷达图、折线图、堆积图、散点图等 。
18.什么是商业智能?商业智能(BI , Business Intelligence)是对商业信息的搜集、管理和分析过程 , 目的是使企业决策者获得洞察力 , 做出对企业更有利的决策 。

推荐阅读