正文内容

数据仓库1-文库吧

2024-03-13 13:12 本页面


【正文】 SS 中,吞吐量通常用 每小时处理的查询数 QPH 来表示。这些查询数量庞大,在它完成前,占用绝大部分机器资源。 一个 OLTP 系统即使很大,也不过 300GB左右,而一个大型 DSS 的规模可以轻易达到 1TB 。 ( 1TB=1000GB) 7 ( 2)数据集成问题 事务处理: 目的在于使业务处理自动化,一般只需要与本部门业务相关的当前数据,而对整个企业范围内的集成应用考虑很少。 分析处理: 需要集成的数据,不仅需要整个企业内部各部门的相关数据,还需要企业外部、竞争对手等的相关数据。 8 当前绝大多数企业内部数据的真正状况是分散而非集成的,主要原因: 事务处理应用的分散 “蜘蛛网”问题 数据不一致问题 9 10 11 12 13 14 15 16 ( 3)历史数据问题 事务处理: 一般只需当前数据。数据库中也只存储短期数据,并且不同数据保存期也不相同。即使有历史数据保存,也不利用。 分析处理: 对决策者而言,历史数据相当重要,许多分析方法必须以大量历史数据为依托,没有对历史数据的详细分析,很难把握企业的发展趋势。 17 ( 4)数据的综合问题 事务处理积累了大量的细节数据,一般 DSS不对细节数据分析。一是细节数据量大,严重影响分析效率;二是太多的细节数据不利于分析人员将注意力集中在有用信息上。因此,分析处理前经常要综合,而事务处理系统不具备这种综合能力。 18 数据库到数据仓库 数据仓库的概念和特征 数据仓库中的数据组织 数据仓库体系结构 19 数据仓库系统构造方面的领头设计师 对数据仓库的定义为: 数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用于支持经营管理中的决策制定过程。 20 从定义可看出: DW是明确为决策支持服务,而 DB是为事务处理服务。 数据仓库的主要特征: 数据仓库的数据是面向主题的 数据仓库的数据是集成的 数据仓库的数据是不可更新的 数据仓库的数据是随时间不断变化的 下面讨论数据仓库的关键特征: 21 从逻辑意义上讲,主题是企业中某一宏观分析领域所涉及的分析对象。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利
点击复制文档内容
教学教案相关推荐
文库吧 www.wenkub.com
备案图鄂ICP备17016276号-1