The Microsoft Data Warehouse Toolkit 读书笔记(1)
DW
2020-01-15
432
0
本文主要讲解了数据仓库整个生命周期最开始步骤:理解业务并建立需求文档.
数据仓库生命周期遵循的四个原则
- 将精力集中于业务(Focus on the business ) :专注于识别业务需求及其相关的价值。建立与商业方面坚实的关系.增强你的商业意识与协商技巧。
- 建立信息架构(Build an information infrastructure): 设计一个综合的、易于使用的、高性能的信息架构以应付整个企业广泛的业务需求。
- 有意义的增量交付(Deliver in meaningful increments):构建一个数据仓库需要6至12个月的时间周期,明确业务价值并起决定实现顺序.
- 提供完整的解决方案(Deliver the entire solution):为业务用户提供价值,。这意味着一个坚实、精心设计与测试的数据仓库仅仅是开始。你还需要实现查询工具、报表应用和分析、培训,支持、站点及文档。
生命周期线路及任务区域
下图为本书构建数据仓库的整个生命周期图 Figure 1-1:
第一步是确认商业需求,首先我们确认业务价值,包含以下几个方面:
- Recruiting strong business sponsorship
- Defining enterprise-level business requirements
- Prioritizing business requirements
- Planning the project
- Defining project-level business requirements
获得支持Obtaining Sponsorship
有一个坚实后盾是DW / BI项目好的开始。你的商业支持者将起带头作用,来确定DW / BI系统的目的、内容以及有限次序。与他们沟通以获取资源更多资源,比如安排与资深员工的会议,审批新服务器等。你至少需要找到一个以下属性的人物:
- 远景Visionary:找到一个对信息潜在价值十分清楚,有具体应用想法的人。
- 资源Resourceful:找到一个可以提供资源,并且促进组织伴随数据仓库变化的人。
- 通情达理Reasonable:找到一个通情达理的人,他/她需要理解花费时间及资源来建造信息系统.
定义企业业务需求Defining Enterprise-Level Business Requirements
企业需求阶段的核心周期图 Figure 1-2:
这里Business Process指的是企业为完成主要目标而从事的业务活动
企业需求定义处理流程图Figure 1-3:
在我们进行需求会谈的时候你问”告诉我你要什么,我会搞定”. 这样的问题只会让你获得有限的信息. 而”**你是做什么的,告诉我你的角色与职责”**这样的问题可以让你更好的理解业务,并且知道用户如何使用数据.
此外可以注意用户说的一些词汇,如 improve,reduce,increase和enhance 这些都可以变为业务需求
注意一天不要跟太多的人交谈,一般4个即可,最好做一个总结,然后把总结发给交谈人,并且收取反馈.
需求总结Figure 1-5:
此时你需要根据这份需求来查看现有数据,看看个业务数据是否能支持这些需求,同时你要把各需求归类到业务流程,如下表
Table 1-1:
一旦确认业务流程归类,就需要画一张数据仓库的总线矩阵图Figure 1-6
如上图,显示了各个流程涉及到的纬度,该图可以作为整个公司的纬度架构图
排序业务需求优先度Prioritizing the Business Requirements
可以做个BCG矩阵(Growth-Share Matrix) Figure 1-8
Y轴表示业务价值,X轴表示实现可能性, 这样就可以从右上方开始排序,确定实现顺序,至此计划部分就结束了