从数据到信息
从信息到洞察

自助式BI,全面提升你的数据分析能力

这篇文章是介绍 Power BI 相关的基础知识的早期文章,是入门必读系列的第一篇,从 BI 说起。

BI 是什么

BI 即商业智能,泛指用于业务分析的技术和工具,通过获取、处理原始数据,将其转化为有价值的信息指导商业行动。Gartner 把 BI 定义为一个概括性的术语(umbrella term),其中包括应用程序、基础设施和工具,通过获取数据、分析信息以改进并优化决策和绩效,形成一套最佳的商业实践

BI 的本质是技术和工具的集合,通过处理原始数据,产出对商业行为有价值的洞察

BI 技术为商业运营提供基于历史、当下和未来的分析视角。BI 对商业决策的支持涵盖了从运营到战略的每个层面。基础运营决策包括产品定位或定价, 战略业务决策包括最广泛层面的优先事项,目标和方向。BI 的有效性在于将多个来源的数据进行整合。例如公司经营领域的市场数据(外部数据)和公司内部财务、运营数据(内部数据)的结合,这种结合可以更完整的反映公司经营的全貌。

从这个意义上来讲,基于单表或单一数据源的分析都不能称作真正的 BI,还有一种常见情形是企业没有完整的 BI 产品线,靠手工操作汇总多个数据源,复制粘贴到一个 Excel 表中再进行分析,虽然满足了多来源,但汇总和分析过程都依赖手动操作,也不是真正的 BI。自助式 BI,全面提升你的数据分析能力

 

传统 BI

在自助式 BI 出现之前,BI 产品面向的是有 IT 技术背景的研发人员和数据科学家,他们多集中在企业的技术部门,通常也称为企业级 BI。
自助式 BI,全面提升你的数据分析能力

 

这类 BI 产品有几个缺点:

  1. 部署周期长
  2. 报表非常刚性
  3. 开发新需求耗时长
  4. IT 部门负担重

这是一个大数据的时代,数据量日益膨胀,业务人员的分析需求不断增加,如果完全依赖于传统 BI,分析所需的时间会越来越长,无法满足需求,用户需要在控制和敏捷之间找到一个新的平衡。可以预见,由于自助式 BI 的出现,未来对传统 BI 的需求增长很可能会放缓或停滞。

但企业 BI 并非完全失去价值,在某些方面仍有不可替代的作用:可以稳定的为企业提供日常报表;具备实现复杂运算的能力。而且对于一个企业来讲,如果全部采取业务人员自助式分析,很可能没有一个部门拥有全部数据控制权,这意味着无法看到数据的全貌,进而错过关键信息、得到错误的分析结果。

 

自助式 BI

自助式 BI(又称作敏捷 BI)面向的是不具备 IT 背景的业务分析人员,与传统 BI 相比,它更灵活且易于使用,而且一定程度上摆脱了对 IT 部门的依赖,自助式 BI 的出现标志着商业智能分析正在从“IT 主导的报表模式”向“业务主导的自助分析模式”转变。自助式 BI,全面提升你的数据分析能力
自助 BI 包含以下特征:

  1. 友好的用户界面
  2. 支持多种数据源,不仅是 IT 提供的数据库,还包括一些非传统的数据源(例如 WEB 数据)
  3. 支持交互分析的可视化展现
  4. 便于在企业内部共享和查看报表

面向业务人员的 BI 工具的一个最显著的优势是,当我们在面对一个个具体的业务问题时,例如:

  • 是什么原因导致这个地区第三季度利润率下降?
  • 产品 A 何时可以盈利?
  • 我们的库存成本是否会影响到去年的毛利?
  • 公司的业务正在发生何种变化?

这类问题是典型的商务智能探索的核心,解决它们需要的不仅仅是提供一个数字,还需要理解背后的商业原因。由于数据库和查询技术的进步,在自助 BI 工具的帮助下,业务人员凭借自己的专业知识,可以对各种可能的情况进行探索,最终得出结论。如果按照传统 BI 的方式,向 IT 部门提出分析需求,由技术人员实现,解决问题的时间可能延长到数周甚至数月,早已错过了最佳窗口期。自助式 BI,全面提升你的数据分析能力

 

自助式 BI 是否会取代传统 BI?

就像在企业 BI 结尾中提到的,自助 BI 不会使传统的数据库管理或数据科学家失效。 这些由专业人士提供的洞察是复杂的,它们对大多数组织仍然具有很高的价值。(Power BI 的建模工具与微软 SSAS 表格模式使用相同的 xVelocity 引擎,使其在这方面具备超过同类 BI 软件的分析能力)

业务人员通常不了解数据准备的复杂性和错误所涉及的风险。 如果没有统一部门管理的数据治理(data governance),他们可能使用错误的数据,得出错误的结论,。事实上,良好的数据治理至关重要。 例如,如果多个业务用户正在创建自己的报告和仪表板,那么数据的民主化(democratization of data )可能带来分析混乱的风险。

 

自助式 BI VS 电子表格

Microsoft Excel 和其他电子表格已经存在了几十年,拥有数量最大的用户群。虽然电子表格易于上手,但把它当做 BI 工具使用,在以下场景会受到限制:

  1. 需要对包含多个工作表或数据库的混合数据源开展分析时
  2. 多人同时对一张电子表格进行维护和协作时
  3. 数据量达到上限或包含非结构化数据让可视化变得困难
  4. 使用复杂的公式降低了查询性能时
  5. 需要交互式分析和数据探索时
  6. 需要定时刷新时

虽然电子表格和自助 BI 工具都使用表格,但它们实际上是在不同的场合中扮演不同的目的。 电子表格首先是一种存储和显示计算的方法。BI 表格中的数据使用各种算法进行压缩,不像 Excel 那样直接使用行和列的编号来定位。虽然电子表格可以创建复杂的数学公式,比如 Excel 的分析工具库,但它们的核心是数学公式而不是模型。

而自助式 BI 虽然功能更加强大,看起来在很多场景下可以代替电子表格,但却很难真正取而代之。价格因素、安装成本、能否像电子表格一样易用都是需要考虑的因素,而电子表格拥有的巨大用户量无疑成了一笔财富。
自助式 BI,全面提升你的数据分析能力如果基于电子表格直接开发一款 BI 工具,两者合二为一,想必是一个完美的解决方案。而且最好是原生形态的嵌入,因为以插件形式嵌入还是需要额外安装,而且兼容性、功能上也会受到限制。微软从 Excel 2010 版本开始尝试,在 2016 上完成了对 PowerPivot 和 PowerQuery(2013 版本以插件形式出现)的嵌入,两个 BI 工具从插件转为了内置功能,虽然目前功能没有完全稳定(PowerPivot 目前仍存在 bug),但可以发挥的能量已经十分惊人,完全颠覆对电子表格功能的传统认识(可以想象成 AK47 装上了榴弹发射器)。而且微软正在以每月一次的频率持续迭代,这对其他自助 BI 工具是个相当大的挑战。

 

自助式 BI VS Python&R

Python 和 R 通常是具有 IT 背景和编程知识的技术人员掌握的技能,这类编程语言可以独立完成数据分析的整个流程,但是相比自助 BI 工具,缺少通过交互式筛选进行可视化探索的能力。相比之下,自助式 BI 界面化的操作更容易掌握,而且也能胜任大部分分析任务。值得注意的是,目前微软和 Tableau 的敏捷 BI 产品都支持编程语言进行二次开发,Power BI 支持 R、Tableau 支持 Python 和 R,两款软件都在尝试将编程语言模块(聚类、决策树等)封装到软件里直接调用,加强分析和可视化的能力,未来的趋势将很可能是工具和语言的融合。

对于业务分析师,在已经掌握了敏捷 BI 产品的基础上,学会一门语言可以拓展数据分析能力,但需要衡量为此付出的时间成本;如果是二选一,首先掌握一个 BI 软件是性价比较高的选择。

 

总结

经济增长模式分为两种,一种是数量型增长,一种是效率型增长。数量型增长依靠增加资本投入拉动,效率型增长依靠技术创新拉动。由于边际收益递减的规律,依靠资源投入的数量型增长会逐渐停滞,而依靠技术创新的效率型增长不会碰到边际收益递减的问题,未来的增长模式是从资本驱动的数量型增长转向技术驱动的效率型增长。

“转型需要专注而执着的笨人,不需要聪明人,不要盲目跟随时髦的概念和流行的口号”,对数据分析师,这个命题同样成立,分析工具和语言有很多,找到一个能解决问题的,踏踏实实的掌握最重要。

效率型增长需要精细化的运营,面对瞬息万变的市场、日益膨胀的数据量和数据维度,业务人员必须参与其中,或抽丝剥茧,或大浪淘沙,从海量数据中快速获取有价值的洞察,自助式 BI 工具契合了这一需求,会逐渐被越来越多的分析人员所接受。


入门必读 系列文章 (更新完结)

说点什么

1000
 
鼓掌微笑开心憧憬爱你色并不觉得吃瓜doge二哈喵喵思考笑哭捂脸悲伤大哭抓狂汗偷笑打脸捂眼黑线问号晕拜拜闭嘴衰咒骂ok作揖
  订阅本文评论  
提醒