`

转:bi 简称为商业智能

阅读更多

bi 简称为商业智能,将企业的现有数据转化为知识,帮助企业作出明智的业务经营决策的工具。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。另外,需要强调的是bi能帮助企业的管理层进行快速, 准确的决策, 迅速的发现企业中的问题, 提示管理人员加以解决. 但商业智能软件系统不能代替管理人员进行决策,不能自动处理企业运行过程中遇到的问题.因此商业智能系统并不能为企业带来直接的经济效益, 单必须看到,商业智能为企业带来的是一种经过科学武装的管理思维,给整个企业带来的是决策的快速性和准确性, 发现问题的及时性, 以及发现那些对手未发现的潜在的知识和规律,而这些信息时企业产生经济效益的基础, 不能快速,准确的指定决策方针等于将市场送给对手, 不能及时发现业务种的潜在信息等于浪费自己的资源.比如:通过对销售数据的分析可发现各类客户的特征和喜欢购买商品之间的联系,这样就可进行更有针对性的精确的促销活动或向客户提供更具有个性的服务等, 这都会为企业带来直接的经济效益.

 

注释:olap是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、

能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,

从而获得对数据的更深入了解的一类软件技术

 

 

事实上,能够满足用户需要的BI产品和方案必须建立在稳定、

整合的平台之上,该平台需要提供用户管理、安全性控制、连接数据源以及访问、分析和共享信息的功能。

 

 

数据报表、数据分析、数据挖掘是BI的三个层面。

 

个人理解架构的本质就是能更好地对系统进行管理、维护和扩展数据仓库系统。

 

BI架构:

1.数据源系统(前端执行系统)提供数据

2.工具系统:数据仓库模型和构造工具、访问工具、决策支持工具OLAP 和数据挖掘工具

3.应用系统:包括人力资源管理、分析和报告、财务管理、客户资源管理、分析和报告供应链管理、企业计划管理的分析和报告。这些应用是许多针对不同行业或应用领域经过裁剪的完整的商业智能解决方案软件包。

 

商业智能项目的实施步骤可分为:

 

  (1) 需求分析: 需求分析是商业智能实施的第一步, 在其他活动开展之前必须明确的定义企业对商业智能的期望和需求, 包括需要分析的主题, 各主题可能查看的角度(维度); 需要发现企业那些方面的规律. 用户的需求必须明确.

 

  (2) 数据仓库建模:通过对企业需求的分析, 建立企业数据仓库的逻辑模型和物理模型,并规划好系统的应用架构,将企业各类数据按照分析主题进行组织和归类.

 

  (3) 数据抽取: 数据仓库建立后必须将数据从业务系统中抽取到数据仓库中, 在抽取的过程中还必须将数据进行转换, 清洗, 以适应分析的需要.

 

  (4) 建立商业智能分析报表: 商业智能分析报表需要专业人员按照用户制订的格式进行开发, 用户也可自行开发(开发方式简单,快捷) .

 

  (5) 用户培训和数据模拟测试: 对于开发—使用分离型的商业智能系统, 最终用户的使用是相当简单的, 只需要点---击操作就可针对特定的商业问题进行分析.

 

  (6) 系统改进和完善: 任何系统的实施都必须是不断完善的. 商业智能系统更是如此, 在用户使用一段时间后可能会提出更多的,更具体的要求, 这时需要再按照上述步骤对系统进行重构或完善

 

 

 

 

数据仓库架构:

 

 

 

 

 

 

 

 

 

 

 


主要有三个部分:

      数据层(数据获取)。实现对企业操作数据的抽取、转换、清洗和汇总,形成信息数据,并存储在企业级的中心信息数据库中。

      应用层(数据管理)。通过联机分析处理,甚至是数据挖掘等应用处理,实现对信息数据的分析。

      表现层(数据使用)。通过前台分析工具,将查询报表、统计分析、多维联机分析和数据发掘的结论展现在用户面前

 

 

ods:引入ods,针对确定的需求进行聚合,提供给前端操作型业务人员进行查询。对数据做了预处理。

 

dw 简称为数据仓库,是数据集合,具有面向主题,集成的,相对稳定和反应变化的特点,由w.h.inmon提出的。

dm(datamarts)数据集市 :为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据

数据仓库聚集了所有详细的信息,而数据集市中的数据则是针对用户们的特定需求总结而出的;可以不建立数据仓库就建立数据集市,这样更便宜,更快捷。不过没有建立数据仓库不能够将企业所有的数据统一为一致的格式。

 

设计数据仓库的九个步骤

      1)选择合适的主题(所要解决问题的领域)

      2)明确定义fact

      3)确定和确认维

      4)choosing the facts

      5)计算并存储fact表中的衍生数据段

      6)rounding out the dimensiontables

      7)choosing the duration of the database

      8)the need to track slowly changing dimensions

      9)确定查询优先级和查询模式。

 

建立数据仓库的步骤

1)收集和分析业务需求

2)建立数据模型和数据仓库的物理设计

3)定义数据源

4)选择数据仓库技术和平台

5)从操作型数据库中抽取、净化、和转换数据到数据仓库

6)选择访问和报表工具

7)选择数据库连接软件

8)选择数据分析和数据展示软件

9)更新数据仓库

 

      数据抽取、清理、转换、和移植

 

1)数据转换工具要能从各种不同的数据源中读取数据。

2)支持平面文件、索引文件、和legacyDBMS

3)能以不同类型数据源为输入整合数据。

4)具有规范的数据访问接口

5)最好具有从数据字典中读取数据的能力

6)工具生成的代码必须是在开发环境中可维护的

7)能只抽取满足指定条件的数据,和源数据的指定部分

8)能在抽取中进行数据类型转换和字符集转换

9)能在抽取的过程中计算生成衍生字段

10)能让数据仓库管理系统自动调用以定期进行数据抽取工作,或能将结果生成平面文件

11)必须对软件供应商的生命力和产品支持能力进行仔细评估

 

 

 

混合架构的标准大的结构层次分别有ODS-EDW-CDW-DM四大部分,其中ODS-EDW结构采用了Inmon派的策略,而CDW-DM采用了

Kimball派的策略。EDW是近3范式模型,CDW属于多维数据仓库,有统一维度建模策略

Edw 企业数据仓库

cdw 企业数据仓库层

 

查询物化视图快于查询表:

oracle数据库的快照是个表,他包含有对一个本地或远程数据库上一个或多个表或视图的查询的结果。正因为快照是个主表的查询子集,使用快照能够加快数据的查询速度;在保持不同数据库中的两个表的同步中,利用快照刷新,数据的更新性能也会有很大的改善

 

视图是从一个或者多个表(或视图)中导出的表,其结构和数据是建立在对表的查询基础上的。和真实的表一样,视图也包括几个被定义的数据列和多个数据行,但从本质上讲,这些数据列和数据行来源于其所引用的表。因此,视图不是真实存在的基础表而是一个虚拟表,视图所对应的数据并不实际地以视图结构存储在数据库中,而是存储在视图所引用的表中。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics