数据仓库解决方案优选

发布时间：2023-08-30 11:54

机会永远是留给有准备的人的，方案是书面计划，最终达到活动的目的或者意义，经过精选励志的句子的编辑认为“数据仓库解决方案”是最值得一看的文章之一，欢迎您来阅读本文祝您愉快！

数据仓库解决方案篇1

案例：一个网站遭遇入侵，破坏相当严重，SQL数据库被挂马，所有的表里面大部分字段都被多次重复插入挂马代码，查看日志，还好没有涉及到服务器的安全，只是数据库那里出现了很多异常警告而已，网站确实存在漏洞

没有办法，我只得修复数据库，因为他们没有数据库备份，根本就没有办法还原数据库啊，何况连事务日志都没有开启，试着恢复了几次都不成功，恢复数据库没有一点希望，我只得乖乖的帮他们清理挂马代码，不可能手工删除挂马代码，毕竟数据太大了，不可能去直接修改，通过四处搜寻得到了一个勉强有效的解决办法，每个表里面去执行一下这个sql语句：

update tablename set @ziduanming =replace(cast(@ziduanming as varchar(8000)),' ',null)

上面的sql语句可以对应修改表，字段名，和替换内容。

其实，sql数据库挂马是一种较新的挂马方法，只要网站存在注入，并且连接数据库是db owner权限就可以进行数据库挂马，估计这次攻击的流程应该是自动化的，通过先进的扫描技术批量收集到几万网站的SQL注入漏洞，针对漏洞攻击，进行自动化的SQL注入挂马。这次应该有很多网站遭殃了，asp+mssql的是主要被攻击对象!

SQL Server数据库挂马的解决办法：

正确清理木马，注意数据库不能随便修改或删除，被挂上马后，更需要谨慎的操作。建议，先备份然后再小心清理。

如果以前没有备份的话，就利用我上面的sql命令进行修复，

2、为网站配置可靠的防注入程序。

3、最好在网站源码中做好过滤，在数据库中限制字符的类型和长度。

4、养成经常备份数据库的习惯。大家可能无法保证天天备份数据库，但也会保证每周备份一次，如果有时间保证天天备份数据库。

5、最好是请专业的网站安全公司，对您的站和服务器做彻底的安全评估。

数据仓库解决方案篇2

1.8 数据挖掘系统与数据库系统或数据仓库系统的集成 1.2节勾画了典型的数据挖掘系统结构的主要成分（见图1-5），一个好的系统结构将有利于数据挖掘系统更好地利用软件环境，有效、及时地完成数据挖掘任务，与其他信息系统协同和交换信息，适应用户的种种

1.2节勾画了典型的数据挖掘系统结构的主要成分（见图1-5）。一个好的系统结构将有利于数据挖掘系统更好地利用软件环境，有效、及时地完成数据挖掘任务，与其他信息系统协同和交换信息，适应用户的种种需求，并随时间进化。

数据挖掘（DM）系统设计的一个关键问题是如何将DM系统与数据库（DB）系统和/或数据仓库（DW）系统集成或耦合。如果DM系统作为一个孤立的系统或嵌入应用程序中，则不存在DB或DW系统与它通信。这种简单的方案称为不耦合，其中DM设计所关注的主要问题停留在开发挖掘可用数据集的有效算法。然而，当DM系统工作在一个需要与其他信息系统成分（如DB和DW系统）通信的环境下，可能的集成方案包括不耦合、松散耦合、半紧密耦合和紧密耦合。我们逐一考察这些方案如下：

. 不耦合（no coupling）：不耦合意味着DM系统不利用DB或DW系统的任何功能。它可能由特定的数据源（如文件系统）提取数据，使用某些数据挖掘算法处理数据，然后再将挖掘结果存放到另一个文件中。

尽管这种系统简单，但有不少缺点。首先，DB系统在存储、组织、访问和处理数据方面提供了很大的灵活性和有效性。不使用DB/DW系统，DM系统可能要花大量的时间查找、收集、清理和变换数据。在DB和/或DW系统中，数据多半被很好地组织、索引、清理、集成或统一，使得找出任务相关的、高质量的数据成为一项容易的任务。其次，有许多经过测试的、可伸缩的算法和数据结构在DB或DW系统中得到实现。使用这种系统开发有效的、可伸缩的实现是可行的。

此外，大部分数据已经或将要存放在DB/DW系统中。要是没有任何这样的系统耦合，DM系统就需要使用其他工具提取数据，使得很难将这种系统集成到信息处理环境中。因此，不耦合是一种很糟糕的设计。

. 松散耦合（loose coupling）：松散耦合意味着DM系统将使用DB或DW系统的某些设施，从这些系统管理的数据库中提取数据，进行数据挖掘，然后将挖掘的结果存放到文件中，或者存放到数据库或数据仓库的指定位置，

松散耦合比不耦合好，因为它可以使用查询处理、索引和其他系统设施提取存放在数据库或数据仓库中数据的任意部分。这带来了这些系统提供的灵活性、有效性等优点。

然而，许多松散耦合的挖掘系统是基于内存的。由于挖掘本身不利用DB或DW提供的数据结构和查询优化方法，因此，对于大型数据集，松散耦合系统很难获得高度可伸缩性和良好的性能。

. 半紧密耦合（semitight coupling）：半紧密耦合意味除了将DM系统连接到一个DB/DW 系统之外，一些基本数据挖掘原语（通过分析频繁遇到的数据挖掘功能确定）的有效实现可以在DB/DW系统中提供。这些原语可能包括排序、索引、聚集、直方图分析、多路连接和一些基本的统计度量（如求和、计数、最大值、最小值、标准差等）的预计算。

此外，一些频繁使用的中间挖掘结果也可以预计算，并存放在DB/DW系统中。由于这些中间挖掘结果或者是预计算，或者可以有效地计算，这种设计将提高DM系统的性能。

. 紧密耦合（tight coupling）：紧密耦合意味DM系统平滑地集成到DB/DW系统中。数据挖掘子系统视为信息系统的一个功能组件。数据挖掘查询和功能根据DB或DW系统的挖掘查询分析、数据结构、索引模式和查询处理方法优化。随着技术进步，DM、DB和DW系统将进化和集成在一起，成为一个具有多种功能的信息系统。这将提供一个一致的信息处理环境。

这种方法是高度期望的，因为它有利于数据挖掘功能、高系统性能和集成的信息处理环境的有效实现。

有了这些分析，可以看出数据挖掘系统应当与一个DB/DW系统耦合。松散耦合尽管不太有效，也比不耦合好，因为它可以使用DB/DW的数据和系统设施。紧密耦合是高度期望的，但其实现并非易事，在此领域还需要更多的研究。半紧密耦合是松散和紧密耦合之间的折衷。

重要的是识别常用的数据挖掘原语，提供这些原语在DB/DW系统中的有效实现。

数据仓库解决方案篇3

根据Informix数据仓库系统实施方法学，我们可以将数据仓库的实施分为以下几个步骤： 1.业务需求分析业务需求分析是数据仓库建设的基础，应该同用户进行充分沟通，了解用户的真实需求，避免理解的误差，同时，应该界定好项目开发范围，在此阶段，主要工作

根据Informix数据仓库系统实施方法学，我们可以将数据仓库的实施分为以下几个步骤：

业务需求分析是数据仓库建设的基础，应该同用户进行充分沟通，了解用户的真实需求，避免理解的误差，同时，应该界定好项目开发范围。

在此阶段，主要工作包括：

从实施的角度来看，设计数据仓库系统体系结构有多种方式：

列出向数据仓库提供数据的数据源清单。源数据的复杂性、规模、完整性对建立数据仓库的影响比其它因素要大。要格外注意哪些数据源的数据类型、粒度和内容是兼容的。

除了体系结构之外，硬件和软件资源对数据仓库也至关重要。作为需求定义的一部分，估计数据仓库将要存储的数据量以及将对数据进行的处理很重要。

在选择软件和硬件平台时，最好听取专家的建议，尤其是对与您相似的环境有经验的专家。InformixDecisionFrontier数据仓库实现套件，为用户提供了快速、集成、完整的数据仓库实现工具。

逻辑模型设计主要是指数据仓库数据的逻辑表现形式。从最终应用的功能和性能的角度来看，数据仓库的数据模型也许是整个项目最重要的方面。为数据仓库和数据集市定义数据模型是一项复杂的工作，需要领域专家的参与。

在进行物理模型设计时，主要是将数据仓库的逻辑模型转换为在数据库中的物理表结构。在物理模型设计时，可以采用ERWin等辅助设计工具。

Informix采用ROLAP方式，数据仓库数据的存储主要采用InformixIDS(InformixDynamicServer)数据库，

InformixIDS数据库是业界领先的数据库引擎，它具有并发性、可伸缩性、多进程/多线索等特性，是Informix数据仓库应用的核心。

数据抽取是数据仓库建立中的一个非常重要的步骤。它负责将分布在用户业务系统中的数据进行抽取、清洗、集成。

Informix提供了一系列工具访问存储在异构数据库中的业务系统数据。Informix还提供了数据复制产品，这样，系统会通过同步或异步方式自动将符合规则的数据定时进行传递，保证数据的完整性、一致性。

用户利用Informix的InfoMover可以轻松定义数据抽取、清洗、集成、装载过程，并可以对该过程进行定期调度，减轻数据增量装载的复杂度。同时，Informix数据装载策略支持第三方厂家丰富的工具，如Prism、Carleton、ETI等。

数据仓库元数据的管理也是极为重要的环节。Informix的MetacubeWarehouseManager提供GUI，用户只须使用鼠标托拽方式即可对元数据进行管理。

用户分析、报表、查询工具是用户进行分析决策使用的工具。因此，其所有操作要非常简单，但提供的功能却要十分强大。Informix相应地提供了一套完善的工具。

此外，数据挖掘技术也是数据仓库系统中一个重要部分。Informix提供RedBrickDataMine以及第三方厂商产品，支持数据挖掘应用。

数据仓库性能的好坏直接影响系统查询、分析响应速度。Informix提供MetaCube等工具支持汇总查询、抽样查询和后台查询，以提高数据仓库查询效率。

总之，Informix为用户数据仓库应用提供了一个快速、完整的解决方案。采用Informix数据仓库解决方案可以使您的数据仓库系统具有高性能、高可扩展性，高开放性，可以自己进行定制等特性，同时，Informix还提供专业数据仓库咨询服务，这将充分保证您的数据仓库系统建设快速、及时，保证它能真正发挥作用。

数据仓库解决方案篇4

目前，数据仓库一词尚没有一个统一的定义，著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述：数据仓库（Data Warehouse）是一个面向主题的（Subject Oriented）、集成的（Integrate）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策，。对于数据仓库的概念我们可以从两个层次予以理解，首先，数据仓库用于支持决策，面向分析型数据处理，它不同于企业现有的操作型数据库；其次，数据仓库是对多个异构的数据源有效集成，集成后按照主题进行了重组，并包含历史数据，而且存放在数据仓库中的数据一般不再修改。

根据数据仓库概念的含义，数据仓库拥有以下四个特点：

1、面向主题。操作型数据库的数据组织面向事务处理任务，各个业务系统之间各自分离，而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念，是指用户使用数据仓库进行决策时所关心的重点方面，一个主题通常与多个操作型信息系统相关。

2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关，数据库之间相互独立，并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的，必须消除源数据中的不一致性，以保证数据仓库内的信息是关于整个企业的一致的全局信息。

3、相对稳定的。操作型数据库中的数据通常实时更新，数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用，所涉及的数据操作主要是数据查询，一旦某个数据进入数据仓库以后，一般情况下将被长期保留，也就是数据仓库中一般有大量的查询操作，但修改和删除操作很少，通常只需要定期的加载、刷新。

4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据，而数据仓库中的数据通常包含历史信息，系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息，通过这些信息，可以对企业的发展历程和未来趋势做出定量分析和预测，

企业数据仓库的建设，是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念，只有把信息及时交给需要这些信息的使用者，供他们做出改善其业务经营的决策，信息才能发挥作用，信息才有意义。而把信息加以整理归纳和重组，并及时提供给相应的管理决策人员，是数据仓库的根本任务。因此，从产业界的角度看，数据仓库建设是一个工程，是一个过程。

整个数据仓库系统是一个包含四个层次的体系结构，具体由下图表示。

·数据源：是数据仓库系统的基础，是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等；

·数据的存储与管理：是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库，同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心，则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据，进行抽取、清理，并有效集成，按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库（通常称为数据集市）。

·OLAP服务器：对分析需要的数据进行有效集成，按多维模型予以组织，以便进行多角度、多层次的分析，并发现趋势。其具体实现可以分为：ROLAP、MOLAP和HOLAP。ROLAP基本数据和聚合数据均存放在RDBMS之中；MOLAP基本数据和聚合数据均存放于多维数据库中；HOLAP基本数据存放于RDBMS之中，聚合数据存放于多维数据库中。

·前端工具：主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器，报表工具、数据挖掘工具主要针对数据仓库。

数据仓库解决方案篇5

下载先决的软件和配置环境

1、由于安装过程太过于冗长，所以就不把它放在实验的这个部分，而是把它放在本文档后面的附件1中，当你下载安装完软件、配置好系统后，请回到下面这个步骤。

2、为了检查您的开发环境，我们首先来完成一个完整的例子。这将让您对的一些特征有个快速的了解。一旦您完成这个阶段，您就可以：

l 解释DataWindow和DataWindowInterop引用是什么

l 运行一个DataWindow销售订单的示例系统。

3、找到目录“C:\TempSI aleOrder”，并双击用于演示的SaleOrder解决方案文件。这将打开Visiual Studio和先前用Visual 创建的SaleOrder解决方案。

4、选择视图\解决方案资源管理器打开项目的解决方案窗口，展开折叠的参考，您就可以看到如下图所示的那样：

5、注意DataWindow和DataWindowInterop引用：这是在您的.Net解决方案需要的“DataWindow”的特定功能时的库，

选择其中任何一个，右键单击查看属性，您可以发现他们是安装在Sybase目录中。

6、右键单击DataWindow引用，选择对象浏览器。您可以看到类似下图的一些东西？这就是DataWindow命名空间中的对象。

7、从生成菜单，选择生成解决方案。您应该能正确编译该解决方案，否则，请您重新看看附件1，并检查您的配置是否正确。

8、运行程序，你可以看到如下所示那样。使用‘Add Items’按扭，尝试添加几条定单信息。为每条定单填写包括数量在内的各个输入域。点击‘Update’按钮创建一个新的定单。

9、假如您已经填写了如上所示所有的域，那么你会看到一个成功的消息提示告诉你新的定单已经创建。假如你在运行的时候出现异常，那么最大的可能就是您没有填写某个域。因为这只是一个最简单的、最基础的例子，并没有添加完整的错误处理代码在里面。

10、现在就会在数据库中有条定单数据，你可以查找它。按‘Query’按扭，窗体将清除以便你可以输入你刚刚创建的定单号。点击‘Retrieve’，就会返回2655#定单的详细信息了。

你可以看到定单的细节信息了。

11、花点时间查看一下本项目中这两个窗体的代码。

12、恭喜！您已经成功测试了您的开发环境。

数据仓库解决方案篇6

目前，零售业市场的竞争越来越激烈，适合于能够快速反映市场变化的系统变得越来越重要，在服务变得至关重要的时代，移动和远程系统扮演着重要的角色。在交易点上捕捉并访问企业数据的能力意味着零售商将总能获取最新的市场信息及客户需求。 Sybase：驱动零

目前，零售业市场的竞争越来越激烈，适合于能够快速反映市场变化的系统变得越来越重要。在服务变得至关重要的时代，移动和远程系统扮演着重要的角色。在交易点上捕捉并访问企业数据的能力意味着零售商将总能获取最新的市场信息及客户需求。

Sybase 在移动和嵌入式计算领域保持着长期的领先地位。事实上，在过去三年中，Sybase已经被公认为移动数据库市场的领导者，拥有400万个用户和400多个OEM合作伙伴。通过业界领先的技术，Sybase可将零售业信息分布到任何地方，从销售点及嵌入设备（如扫描仪和票据打印机）到客户自服务摊点、存货跟踪和基于Web的应用等。

当前，客户在面对比以往更多的产品选择的时候，更看重商家所提供的方便服务。能够提供高级客户服务经验的零售商明显要优于其他竞争者，并可以很好地加强客户关系。Sybase移动和嵌入式数据库技术提供了各种非传统方式以访问企业数据，将数据子集存储在销售点设备（POSD）上并采用双向复制技术来保证信息传送到企业系统并回送到销售点。零售商能在各种增值地点，例如计费停车场、临时商店或自服务商亭等，有效地服务于客户。利用本地存储数据，即使商店通讯系统出现故障，客户服务也不会被中断。

Sybase移动和嵌入式数据库技术增加了销售机会，

Sybase内置高级复制技术允许零售商在任何时候根据需要同步总部和销售点之间的信息，因而在POSDs 和存货控制系统中的数据总是最新的。这些系统提供了至关重要的信息以快速反映不断变化的市场情况。

在当今零售环境中，一旦数据需要更新，商储系统必须与该组织中其它系统之间交换数据。随着零售技术扩展到手持设备这一全新的领域，这个需求是意义深远的。Sybase推出的数据库技术满足了下一代移动设备的要求，并确保雇员无论在柜台、工作台或仓库清点存货时能够继续有效地获取并共享数据。Sybase移动和嵌入数据库技术使得一些关键的销售、库存和客户数据在企业范围内得到共享，并确保快速的更新。

Sybase SQL Anywhere Studio 确保你成功

Sybase 的低开销、易于使用的移动和嵌入式数据库技术，满足了开放式的开发及灵活的解决方案。这些解决方案有效地满足了大型零售商的需求，然而价格却连小型零售商也能够承受。目前，零售商在寻找他们所需要的系统来帮助他们在竞争激烈的行业中处于领先位置；他们会看到Sybase数据库技术提供给他们较为明显的优势，即无论业务发生在哪里，他们都可以立即访问到前端数据，并传递客户服务信息。

Sybase SQL Anywhere Studio是已被证明的适用于零售商的技术

5新型UltraLite提交选项和MobiLink同步技术可把企业数据扩展到手持设备、智能应用和嵌入系统中

(责任编辑：铭铭)

数据仓库解决方案篇7

主题：怎样去宣传数据仓库？

数据仓库是面向主题的、集成的、随时间变化的非易失的数据集合，用于支持管理层的决

策分析，

数据仓库对历史的数据做分析，以得出所分析主题的发展趋势，来支持决策层的决策分析。用于联机分析处理。

数据库普通关系型数据库大多用于联机事务处理，处理当前的事务、交易。

集成的例子：

就拿一家百货公司来说，公司有好多的分公司，每个分公司有自己的日常交易纪录数据。

有真实的详细的交易历史纪录、也有月度、年度归总数据。总公司需要了解公司的运营状

况，以决定以后如何拓展业务，了解客户购物趋势，推广新产品等系列决策。试想想，如果

每个子公司将所有的历史数据都送到总公司，请问，总公司需要多少磁盘、多少资源来存储

这些数据？总公司要这些数据干什么？总公司不需要这些详细的数据，如果子公司根据一

定的周期归总之后在送到总公司，这样一来，数据量小了，有利于分析了，

公司里面，每个公司的数据结构定义可能不相同。需要统一数据定义。

送到总公司来的数据是比较全面的。这样一来，公司可以对用户购物趋势、购物能力等主题

做一个比较全面的分析，以发掘客户、扩大公司规模。

面向主题：

通讯公司可能只是纪录用户的应收款、预付款、通话纪录、费率。如果建立一个客户主题区

域，用来纪录用户所购买的服务、用户所在地域。这个主题区域可以帮助通讯公司预测客户

增长率、客户的地域分布、客户购买服务的倾向以增加新的服务，在那些区域出售什么通讯

产品等等的决策。

随时间变化：

上面两个例子都提到这个。百货公司的记账系统、通讯公司的记账系统都是随时间变化的最

好的例子，记账系统定期归总数据，然后将归总数据不断加到数据仓库里面来，这样数据仓

库也就是随时间变化的。

非易失性的：

一般的，追加到数据仓库里面的数据是不允许更改的，它不同于联机事务处理系统，允许修改数据库纪录。这样数据仓库的数据一般不会丢失。

数据仓库有几个要点：

数据仓库中数据的查询是最重要的。视图、索引是提高查询的选择。

代码库是统一、集成的前提。

数据仓库解决方案篇8

一、总体技术要求 1、市场经营分析系统必须能与各业务系统管理、生产维护系统联网，各系统必须提供经营分析系统所须的各类业务数据，同时要求大部分数据能通过接口自动获取； 2、由于市场经营分析系统需要存放的数据量较大，对统计、查询的时限要求较高，因

1、市场经营分析系统必须能与各业务系统管理、生产维护系统联网，各系统必须提供经营分析系统所须的各类业务数据，同时要求大部分数据能通过接口自动获取；

2、由于市场经营分析系统需要存放的数据量较大，对统计、查询的时限要求较高，因此系统对数据库的性能要求较高，需高性能的大型数据库；存储空间按目前50万用户计，每个用户10K，每月需5GB空间，加上其它业务数据，每月对存储空间的需求为6GB，估算存放两年业务数据所需的磁盘阵列空间为 6GB/月*12月*2年=144GB；

3、系统对数据库产品的要求是在数据存储、灵活高速查询及统计方面必须表现出色；

4、要选择能进行快速开发的前端工具，并且同时支持C/S和WEB的开发方式，

惠州市电信局市场经营分析系统以“九七系统”为主要数据源，其它如网管系统、财务系统等为辅助数据源，通过数据采集机将数据定时采集到数据仓库中。用户通过商用的分析软件、定制的客户端程序、WEB浏览器等多种方式访问数据仓库，获得经营分析信息。

惠州市电信局市场经营分析系统的软件结构主要由三部分组成：数据的抽取、数据的存储和管理、数据的分析展现，

数据仓库实施总体结构惠州市电信局市场经营分析系统的基本功能有：销售管理功能、经营分析功能、客户管理功能、营销计划分析功能、竞争对手情况分析功能等。

由于数据仓库项目需要投入较大的财力、人力、物力，给企业带来的风险也较大，因此，在实施方法上采用分期实施。本项目主要分两期实施，一期主要实现经营分析功能，其余功能将在二期实施。

惠州市电信局市场经营分析系统（一期）采用基于NT平台的解决方案，实现了基于市场经营分析主题的AD-HOC系统，在一期中主要采用了SYBASE的POWERDESIGNER WAREHOUSE ARCHITECT 6.1、AS IQ 12.4、EA SERVER 3.0、POWERBUILDER 7.0等产品。

1）模型设计：采用SYBASE POWERDESIGNER WAREHOUSE ARCHITECT 6.1进行数据仓库模型的设计。

2）数据的抽取：采用编写SQL脚本，定时从“九七系统”的SYBASE ASE 11.9.2数据库、计费系统的INFORMIX数据库、112系统的SYBASE ASE 11.5数据库、网管系统的SYBASE ASE 11.5数据库中抽取数据，抽取频率为每天一次。

3）数据的存储：从各系统中抽取出来的数据全部存放在NT主机上的SYBASE AS IQ 12.4的数据库，数据的加载方式采用BULK LOAD方式。

4）数据的展现：基于三层体系结构编写应用程序。采用SYBASE EA SERVER 3.0及VISUAL COMPONENT的产品。中间层应用服务器采用EA SERVER的JAGUAR CTS，用POWERBUILDER 7及VISUAL COMPONENT编写组件，前端采用基于BROWSER的方式展现数据。

数据仓库解决方案篇9

例如，设想一个“客户”维度，关系型源表有八列：•

••

相应的 Analysis Services 维度应具有七个属性：

••

数据中存在一种自然层次结构，{国家、地区、城市、客户}。出于导航目的，应用程序开发人员可以选择创建第二个层次结构：{年龄、性别}。商务用户并没有看到这两个层次结构行为方式之间有何区别，但是，自然层次却可以从深谙层次关系的索引结构（对用户隐藏）中受益。

新维度结构的最大优势在于：

•

维度不需要加载到内存中。因此，维度可以非常巨大（经测试，Beta 2 可支持上千万名成员）。

•

用户可以添加和删除属性层次结构，而不必再重新处理维度。属性层次索引结构属轻型结构，在后台计算，并不影响多维数据集查询。

•

重复的维度信息被去除；使得维度更加轻巧。

•

由于引擎为并行处理创建了机会，因此维度处理信息性能得到了改进。

维度类型

Analysis Services 中包括两种维度类型：常规层次类型和父子类型。Analysis Services 2005 新增了一些重要的新维度结构。其中有些结构的名称是临时的，但是，这些名称都是 BI 文献中较为通用的。

•

角色扮演：维度扮演着一些重要角色，具体哪些角色要依上下文而定。例如，[时间] 维度可能会被 [订购日期] 和 [发货日期] 重用。在 2005 中，扮演着某些角色的维度只需存储一次，便可多次使用。这样便可使所需的硬盘空间和处理时间降至最低。

•

事实：事实或“退化”维度与事实（如事务编号）具有一一对应的关系。从本质上讲，退化维度不能用于分析，但可用作标识，以定位特定的事务，或识别组成聚合单元的事务。

•

引用：维度并不能够直接和事实数据表发生联系，但可通过另一维度间接发生联系。这方面的原型示例有 [地理位置] 引用维度，它同时关联了 [客户] 和 [销售团队] 两个维度。引用维度可能由数据提供程序提供，并包括在多维数据集中，不必再修改事实数据。

•

数据挖掘：数据挖掘维度支持从数据挖掘模型（包括群集、决策树和关联规则）生成的维度。

•

多对多：这些维度有时被称为多值维度。在大部分维度中，事实能且只能连接一个维度成员。多对多维度解决了多维度成员问题。例如，银行储蓄客户可以有多个帐户（支票、储蓄)；一个帐户可以有多个客户 (Mary Smith、John Smith)。[客户] 维度有多个成员，这些成员都与一个帐户事务相关联。在维度不能够直接关联事实数据表时，2005 多对多维度支持复杂的分析，并扩展了维度模型，使之超越了传统的星形架构。

量度组和透视

Analysis Services 2005 引入了“量度组”和“透视”，以用来简化分析数据库的设计和部署。在 Analysis Services 2000 中，鼓励用户构建多个物理多维数据集。每个多维数据集相当于一个特定的维度，通常还相当于一个特定的关系事实数据表。虚拟多维数据集以一种对商务用户透明，而对开发人员设计又不太复杂的方式，合并多个事实数据表。

在 2005 中，最通用的方案将具有一个包含一个或多个“量度组”的物理多维数据集。量度组中的事实数据具有特定的细化程度（由维度层次的交叉点定义）。查询根据需要被自动定向到不同的量度组。在物理层上，分区（与 Analysis Services 2000 分区类似）在“量度组”上定义。

大型应用程序将为用户提供大量的维度、量度组，而且还会给导航带来难度。在“多维数据集编辑器”的“透视”选择卡中定义的“透视”可以创建一个多维数据集的子集“视图”。为了要提供一定程度的个性化，可以将安全性角色与适合该角色的透视集相关联。

我们希望大部分的 Analysis Services 2005 数据库都包含一个具有多个量度组和多个透视的多维数据集。

对多维数据集事实结构和查询性能所做的其他改进有：

•

量度可以为空；在 SQL SERVER 2000 中，“null” 量度被当作 0 处理。

•

适当的多维数据集分区使得“非重复计数度量值”的查询性能得到了改进，性能值增加了几个数量级。

•

对备选数据库管理系统的访问由可扩展的部件基础结构提供。RDBMS 的部件用于指定如何为关系查询和写入优化 SQL 语句。用户可以轻松添加其他关系系统的部件；部件被作为 XSL 文件实现。

计算和分析

使用分析服务器（如 Analysis Services）最大的争议之一就是其集中定义复杂计算的能力。Analysis Services 一直以来都能交付丰富的分析数据，但对某些复杂概念却很难实现。

其中一种概念就是半累积量度。最通用的量度值（如 [销售额]）能够清晰地汇总所有维度：长期以来的 [总销售额] 是指所有产品、所有客户在所有时间内的销售总额。相比之下，半累积量度值可能在某些维度中是累积的，而在其他的维度却不是累积的。最常见的一个例子便是余额，如仓库中的货品数。很显然的，昨天和今天这两天的余额总计肯定不等于昨天的余额加上今天的余额。相反，它可能是期末余额，虽然在有些情况下它是期初余额。在 Analysis Services 2000 中，您必须定义一个复杂的 MDX 计算，帮能交付正确的度量值。而在 Analysis Services 2005 中，期初余额和期末余额都是本机聚合类型。

非重复计数度量值在 2005 中也得到了很大的改进。现在，非重复计数度量值可定义在字符串数据上，而查询可以被定义为在任意集合上执行“非重复计算”。而 Analysis Services 2000 只能够在预先定义的层次结构上执行非重复计算。

“时间智能”向导将创建一个时间计算维度，其中包含该期间与最后期间的对比计算，可以移动平均值，同时还可创建其他的通用时间计算构造。

MDX 脚本

多维表达式 (MDX: MultiDimension Expression) 是一种功能非常强大的语言，可用于定义 Analysis Services 2000 计算和安全规则。MDX 功能强大，但也也很复杂。Analysis Services 2005 利用被简化了结构和语法的“MDX 脚本”定义了一种新的计算模型。

MDX 还是 Analysis Services 系统中的查询语言。查询工具（如 Excel 透视表）根据用户的“拖放”行为生成 MDX 查询。MDX 的这种使用与“MDX 脚本”无关；“MDX 脚本”用于服务器定义的对象，如计算成员和单元计算，并非用于用户查询。

在定义 Analysis Services 2005 多维数据集时，其中只包含结构，而没有数据。“MDX 脚本”是多维数据集结构的组成部分。一般情况下都会定义一个默认的“MDX 脚本”命令，用来计算默认的聚合。默认的“MDX 脚本”命令只包含一条语句：

转载请保留原文链接：http://www.j458.com/a/5824447.html，并在标注文章来源。
上一篇 : 送给男朋友的圣诞节句子200句
下一篇 : 母亲节的贺卡好句子

" 数据仓库解决方案 " 相关阅读