Thema

print
project

Architektur eines DWH

Definition - Architektur
Grundstruktur einer DWH-Architektur
1. Datengewinnung
2. Datenumformung - ETL
3. Datenbank mit Nur-Lese-Zugriff
4. Analyseschicht - OLAP, Datamining
5. Zugriff über Front-End-Werkzeug / Anwendungen
Infrastruktur und DWH
Literatur

Definition - Architektur

Eine Architektur ist eine Menge von Regeln oder Strukturen, die einen Rahmen für die Gesamtgestaltung eines Systems oder Produkts liefern. Die Datenbankarchitektur soll die Bewegung der Daten durch das System und innerhalb des Unternehmens verständlich machen. Die Datenbankarchitektur eines Data Warehouse ist gekennzeichnet durch einen Nur-Lese-Zugriff. (vgl. Poe/Reeves, S 57)

[zurück zur letzten Seite] [zurück nach oben]

Grundstruktur einer DWH-Architektur

Abbildung 1: Architektur DWH (Quelle: http://www.lehrer-online.de/dyn/9.asp?url=420778.htm)




Die Grundstruktur eines DWH besteht wie aus obiger Grafik ersichtlich, aus folgenden Elementen auf die nun näher eingegangen wird:

1. Datengewinnung aus Quellsystemen, Datenbanken, Dateien

2. Datenumformung - ETL

3. Datenbank mit Nur-Lese-Zugriff

4. Analyseschicht - OLAP, Datamining

5. Zugriff über Front-End-Werkzeug /Anwendung

1. Datengewinnung aus Quellsystemen, Datenbanken, Dateien

Die in der Unternehmung vorhandenen Systeme bilden die vorherrschenden Datenquellen. Dabei muss entschieden werden ob ganze Dateien aus den Systemen verwendet werden können oder nur einzelne Datenfelder, je nachdem wie sehr diese für die Entscheidungsverarbeitung erforderlich sind.

Genauso können externe Daten aus dem Internet oder von Marktforschungs- instituten (wie z.B. A.C. Nielsen) relevant sein.

Es ist in einem Datawarehouse durchaus üblich, dass die Datenquellen aus mehreren Systemen oder Plattformen stammen und unterschiedlichste Formate aufweisen. (vgl. Poe/Reeves, S 58 f)

[zurück zur letzten Seite] [zurück nach oben]

2. Datenumformung - ETL

Einer der wichtigsten Teilaspekte ist die Datenumformung. Die unterschiedlichen Daten aus den unterschiedlichen Systemen müssen zusammengefügt und umgeformt werden damit diese in einer einheitlichen Form in das DWH geladen werden können.

Beispiele um dies zu verdeutlichen:

z.B. unterschiedliche Artikelnummern für das selbe Produkt

Art. Nr.

Artikelbez. Niederlassung, Land
03402 Bleistift, Härte 5 Niederlassung X, in A
03401 Bleistift, Härte 5 Niederlassung Y, in BRD
88473634 Bleistift, Härte 5 Niederlassung Z, in NL

Wenn jede Niederlassung eines Unternehmens eine eigene Artikelnummer für ein und dasselbe Produkt nimmt, müssen diese in eine einheitliche Form umgewandelt werden bevor sie in das DWH geladen werden.

"intelligente" Artikelnummern

Viele Unternehmen verwenden auch so genannte „intelligente“ Artikelnummern. In unserem Beispiel sieht das folgendermaßen aus:

Art. Nr.

Artikelbez. Niederlassung, Land
03402 -7022-02 Bleistift, Härte 5 Niederlassung X, in A

03402

- die ersten 5 Stellen beschreiben das Produkt
7022 - die nächsten 4 Stellen die Verpackungsart (z.B. 5 Stück im Karton)
02 - die letzten beiden Stellen das Herstellerwerk

Sie wollen wissen was die meistverkaufte Verpackungsart ist und wo das Produkt produziert wurde?

Um später einen entsprechenden Bericht generieren zu können, müssen solche Informationen aufgeschlüsselt werden bevor sie im DWH gespeichert werden. (vgl. Poe/Reeves, S 60 f)


Die Herausforderung ist also operative Daten in entsprechender Qualität in ein DWH zu übertragen. Allerdings, je höhere Anforderungen an die Datenqualität gestellt werden desto höher ist der Zeitaufwand, sodaß sich das Thema Datenqualität häufig gar nicht im Rahmen eines BI-Projekts unterbringen lässt. (vgl. Url1 )

Um alle Daten aus den Datenquellen für das DWH aufzubereiten, werden nahezu 80% eines Projektvolumens allein für den Aufbau von funktionsfähigen ETL-Werkzeugen verwendet. (vgl. Url2 )

[zurück zur letzten Seite] [zurück nach oben]

3. Datenbank mit Nur-Lese-Zugriff

Wie oben bereits erwähnt unterscheiden sich die Daten für die operativen Systeme von denen für die Entscheidungsunterstützung. Ein einziges Datenbankdesign kann nicht beide Anforderungen erfüllen, daher werden die Daten für das DWH in eine EIGENE Datenbank gestellt. In operationellen Datenbanken werden die alltäglichen anfallenden Daten immer wieder aktualisiert. Für entscheidungsunterstützende Systeme ist aber der Zugriff auf analytische und historische Informationen ausschlaggebend, d.h. die Daten müssen erhalten bleiben. Daher ist die EIGENE Datenbank mit NUR-LESE-ZUGRIFF elementar für das DWH. (vgl. Poe/Reeves, S 61 f)

Operationale Daten:

• Häufig online

• zeitpunktbezogen

• Für den laufenden Betrieb der Geschäftssysteme notwendig

Entscheidungsunterstützende Daten:

• Historische Daten

• Zur Analyse über einen Zeitraum

[zurück zur letzten Seite] [zurück nach oben]

4. Analyseschicht - OLAP, Datamining

Aus dem Datenbestand des Unternehmens sollen geschäftsrelevante mehrdimensionale Datenverknüpfungen extrahiert und deren Analyse aus mehreren Blickwinkeln ermöglicht werden, um entsprechende Informationen für Unternehmensentscheidungen zu gewinnen. Das Online Analytical Processing (OLAP) ist die Analyse und Auswertung von multidimensional aufbereiteten Daten. (vgl. Url5 )

Des weiteren kommt auch Data Mining zum Einsatz. Darunter versteht man: „... das systematische (in der Regel automatisierte oder halbautomatische) Entdecken und Extrahieren unbekannter Informationen aus großen Mengen von Daten.“ ( Url 6 )

Weiterführende Informationen dazu finden Sie hier: OLTP & OLAP

[zurück zur letzten Seite] [zurück nach oben]

5. Zugriff über Front-End-Werkzeug / Anwendungen

Zentrale Fragestellungen:

Was soll erreicht werden? Sollen elektronische Berichte geliefert werden oder Analysefunktionen bereitgestellt werden?

Die Auswahl der Front-End Werkzeuge ist entscheidend darüber, wie gut oder widerwillig das DWH von den Benutzern angenommen wird. Viele auf dem Markt befindliche Abfragewerkzeuge sind mehr auf die Anwendungsentwicklung abgezielt und für Anwender aus dem geschäftlichen Bereich nur schwer zu erlernen. Ziel muss es also sein, die Bedürfnisse und Fähigkeiten der Anwender realistisch abzuschätzen und Ihnen Werkzeuge zur Verfügung zu stellen, die Ihnen zusagen und die sie auch verwenden. (vgl. Poe/Reeves, S 113 f)

Von einer hausinternen Entwicklung der Datensoftware wird allerdings abgeraten, da die Pflege und Erweiterung mit der Zeit sehr zeitaufwendig und teuer wird. (vgl. Poe/Reeves, S 169 f)

[zurück zur letzten Seite] [zurück nach oben]

Infrastruktur und DWH

Die technische Infrastruktur stellen die Technologien, Plattformen und Datenbanken dar, die zur Unterstützung des DWH notwendig sind. Also jene Komponenten die vorhanden sein müssen, damit die Architektur des DWH funktioniert. Das können z.B. sein:

• Schulung des DWH-Entwicklungsteams

• Schulung Datenbankadministration

• Hardware

• Lokales Netzwerk

• Workstations

• Front-End-Programme auswählen und installieren

Ein wichtiger Aspekt bei der DWH-Architektur ist es, sich Zeit dafür zu nehmen die beste DWH-Architektur für die jeweilige Umgebung zu finden, denn es gibt nicht DIE optimale Lösung die alle anwenden können. Ein weiterer wichtiger Aspekt liegt im Erkennen der Infrastrukturen, die für den Aufbau des DWH notwendig sind.

[zurück zur letzten Seite] [zurück nach oben]

Literatur

verwendete Literatur:

Höhn Reinhard

Der Data Warehouse Spezialist: Entwurf, Methoden und Umsetzung eines Data Warehouse, Addison-Wesley Verlag, München 2000

Poe Vidette, Reeves Laura

Aufbau eines Data Warehouse, Prentice Hall München 1997, Markt & Technik Buch- und Software-Verlag GmbH

Internet:

Url1 - http://www.computerwoche.de/index.cfm?pageid=365&artid=77130&type=detail&kw=data%20warehousing&rc=123 dl. am 03.11.2005

Url2 - http://www.lehrer-online.de/dyn/bin/420778-421140-1-dwh_lehrerpr_sentation.ppt dl. am 03.11.2005

Url5 - http://www.microsoft.com/austria/windowsserversystem/sql_glossar.mspx dl. am 03.02.2006

Url6 - http://de.wikipedia.org/wiki/Data-Mining dl. am 03.02.2006

[zurück zur letzten Seite] [zurück nach oben]

- production | History | erstellt am: 07.02.2006 | Thomas Kellermair