| Was ist ein Data Warehouse? |
| [1] Definition und Eigenschaften |
| [2] Geschichte |
| [3] Grundlagen |
| [1] Definition und Eigenschaften |
Um einen umfassenden Eindruck über den Begriff Data Warehouse zu bekommen, werden im Folgenden unterschiedliche Definitionsvarianten, die einander allerdings durchaus ähneln und sich überschneiden, vorgestellt. Diese dienen überdies dazu, eine Grundlage für die weiteren Teile des Workshops zu schaffen und sollen an das Thema heranführen.
Man kann ein Data Warehouse als eine „analytische Nur-Lese-Datenbank, die als Grundlage eines Entscheidungssystems genutzt wird“ (Poe/Reeves, 1997, 23) verstehen. Die Informationen, auf die zugegriffen werden kann, werden dazu verwendet, Entscheidungen zu treffen.(Vgl. Poe/Reeves, 1997, 41) Simpel lässt sich ein Data Warehouse auch „als eine Sammlung von Schlüsselinformationen, die verwendet werden, um eine Firma auf die profitabelste Art und Weise zu verwalten und zu führen“(Anahory/Murray, 1997, 19), definieren. Komplexer ausgedrückt umfasst es sowohl Meta-, Dimensions- und Aggregationsdaten als auch Verwaltungsprozesse. Letztere dienen der Verfügbarmachung der Informationen und ermöglich Entscheidungen, die auf diesen Daten basieren. (Vgl. Anahory/Murray, 1997, 20) Außerdem wird ein Data Warehouse als ein System definiert, das Daten über einzelne Bereiche hinweg aus operativen Einzelsystemen zusammenführt und integriert. Anschließend werden die Informationen aufbereitet, um Analysen durchführen zu können.(Vgl. Saake/Heuer, 300)

Abbildung: Data Warehouse-Umgebung (Wilmes, C., Dietl, H.M., Van der Velden R., 2004, 8)
Immer detailliertere Informationen können durch die Entwicklung neuer technischer Gegebenheiten gespeichert werden. Um die dadurch gewonnen Daten entsprechend zu analysieren und zu strukturieren, bietet sich ein Data Warehouse, das operative und meist heterogene Datenquellen zusammenführt, an. Eigenschaften eines solchen Systems sind der reine Lesezugriff, ein unternehmensweiter Fokus (d.h. Daten stammen aus dem gesamten Unternehmen und möglicherweise aus externen Quellen), Speicherung über einen bestimmten Zeitraum, Historisierung, Entwicklung für die effiziente Query-Verarbeitung und Analysewerkzeuge für den Zugriff auf die Daten.(Vgl. Sap AG, 2005, 10f)
Laut Inmon charakterisieren vier Eigenschaften ein Data Warehouse, welches Daten sammelt, um Management beim Prozess der Entscheidungsunterstützung zu helfen. Erstens ist es subjektorientiert, wobei die Daten nach dem betriebswirtschaftlichen Umfeld des Unternehmens angereiht werden. Ein zweites Merkmal stellt die Integration dar, weil eine Fülle von internen und externen Datenquellen im Data Warehouse Eingang finden. Die Qualität der Daten ist in diesen Zusammenhang auch von entscheidender Bedeutung, da korrekte und vertrauenswürdige Daten der Inhalt eine Data Warehouses sein sollten. Der dritte Aspekt ist die Zeit, da die Informationen langfristig gespeichert werden, um beispielweise einer Zeitreihenanalyse unterzogen werden zu können. Nicht-Volatilität ist das vierte Charakteristikum, welches beinhaltet, dass der Zugriff auf ein Data Warehouse nur lesend möglich ist und Analysen die Daten nicht verändern können.(Vgl. Kurz, 1999, 49f)
Aus diesen von Inmon beschriebenen Charakteristika leitet Kurz mehrere Annahmen ab. Es besteht etwa eine physikalische Trennung des Data Warehouses vom operativen Quelldatensystem. Des Weiteren beinhaltet ein jedes aktuelle und historische Detaildaten sowie aggregierte Informationen. Große Datenmengen bereitstellen und verarbeiten, um Auswertungen und Analysen in entscheidungsunterstützenden Prozessen durchzuführen, sind Aufgabenfelder des Data Warehouse-Konzepts. Eine Voraussetzung dafür stellt die zweckneutrale Speicherung der Daten im Data Warehouse dar.(Vgl. Mucksch/Behme, 1998, 36)
| [2] Geschichte |

Abbildung: Phasen der ressourcenorientierten Forschung (Wilmes, C., Dietl, H.M., Van der Velden R., 2004, 15)
Die Idee eines Data Warehouses besteht schon seit einigen Jahren, war Ende der 60er Jahre unter anderem unter den Namen Management-Information-System (MIS) bekannt. Der Grundgedanke war damals ein System zu schaffen, dass Entscheidungsträger bei Bedarf alle für sie relevanten und wichtigen Informationen zur Hand haben. Unabhängig von den Funktionsbereichen oder Ebenen des Unternehmens. Weiters war es wichtig dafür zu sorgen, dass die Bereitstellung der Informationen fehlerfrei, zeitnah, flexibel effizient, effektiv, ergonomisch und inspirativ erfolgt (Vgl. Bauer/Günzel, 2001, 11).
Im Laufe der Jahre haben sich viele unterschiedliche Bezeichnungen entwickelt bis der Begriff ‚Data Warehouse’ erstmals 1988 von Devlin gebraucht wurde. Seit wenigen Jahren, ist jedoch eine Ablöse mit neueren Bezeichnungen zu verzeichnen. Die Synonyme ‚Business Warehouse’ oder ‚Business Intelligence Systeme’ finden immer häufiger Anwendung, da durch diese Begriffe verstärkt auf die geschäftliche Wichtigkeit hingewiesen wird. (Vgl. Wikipädia, Data-Warehouse, 13.12.2005)
Im Vergleich zu früher haben sich die Systeme wesentlich verbessert. Heute Grundlegendes, das als Voraussetzung für ein erfolgreiches Data Warehouse System gilt, wie zum Beispiel eine graphische Benutzeroberfläche, schnelle und flächendeckende Kommunikationstechnologien, schnelle und kostengünstige Datenspeicher, leistungsfähige Prozessoren und große Datenbasen durch integrierte operative Systeme, fehlte in der damaligen technischen Infrastruktur. (Vgl. Bauer/Günzel, 2001, 11) Eine zusätzliche Verbesserung und Erweiterung dieser Systeme wurde durch die erstmalige Verwendung des Begriffs OnLine Analytical Processing (OLAP) durch W.H. Inmon erreicht. Durch OLAP wurde aus der statistischen Analyse eine dynamische mit vielen verbesserten Funktionen. (Vgl. Kurz, 1999, 51)
„Automatische Überwachung der kritischen Kennzahlen. […]
Integration von statistischen Methoden von Trend- und Prognosemodellen.
Konzepte der dynamischen multidimensionalen Analyse durch OLAP-Funktionalität, wie z.B. Drill-Down, Roll-Up, etc…
Integration von komplexen Simulationsmodellen, um verschiedene Alternativen berechnen zu können. […]“(Kurz, 1999, 52)
In den 90er Jahren befasste man sich hauptsächlich mit der Aufgabe, entscheidungsrelevante Daten, die bereits an anderen Stellen des Unternehmens elektronisch erfasst waren, verfügbar zu machen. Zusätzlich zu den internen Daten ist es für ein Data Warehouse auch von Vorteil auch externe Informationen aus entsprechenden Systemen zu integrieren. (Vgl. Bauer/Günzel 2001, 11)
Neue Namen wie Web-Data Warehousing, Web-enable Data Warehouse drängen immer mehr an die Öffentlichkeit. Bei diesen Data Warehouse Systemen übernimmt der Webbrowser, anstatt der graphischen Benutzeroberfläche, die Aufgabe als zentrales Werkzeug für den Benutzer. Auf diese spezielle Form eines Data Warehouse wird im späteren Verlauf der Arbeit jedoch noch genauer eingegangen. (Vgl. Kurz, 1999, 52)
Eine weitere wichtige Entwicklung stellen die sogenannten Business Intelligence Portale dar. Sloch ein Portal fasst alle analytischen Werkzeuge unter einer Web-basierten Oberfläche zusammen und ermöglicht somit einen einheitlichen Zugang zu den Informationen. Eine der Hauptfunktionenen eines solchen BI-Portals ist die Personalisierung des Wissens für die unterschiedlichen Anwender. Speziell durch die Verwendung eines Web-Browsers konnten für verschiedenste Arten von Benutzern leicht verständliche Schnittstellen geschaffen werden. (Vgl. Kurz, 1999, 53)

Abbildung: Phasen der Entwicklung managementunterstützender Informationssysteme (Wilmes, C., Dietl, H.M., Van der Velden R., 2004, 24)
Managementunterstützungssysteme haben eine lange Geschichte, doch erst mit den technischen Möglichkeiten der jüngeren Zeit konnten jene „Ideale“ erreicht werden, die in den 1960er Jahren angestrebt wurden (d.h. laufende Verdichtung und Aufbereitung von Daten aus allen Unternehmensbereichen für umfassende Kennzahlensysteme sowie Simulationsmodelle). Erwähnt seien beispielhaft die Begriffe „MIS“ für „Management Informationssysteme“ ab etwa Mitte der 1960er Jahre, „EIS“ für „Executive Information System“ ab etwa Mitte der 1980er Jahre oder als jüngere Begrifflichkeiten jene der „Business Intelligence“ und des „Performance Management“ bzw. „Performance Measurement“.(Vgl. Hansen/Neumann, 2005, 825ff. sowie Spath 2003, 5f.)

Abbildung 1: Entwicklung der Managementunterstützungssysteme im Zeitverlauf (Informatik-Spektrum, 23.02.2005, 4)
| [3] Grundlagen |
Um die späteren Kapitel etwas besser verstehen zu können folgen, hier einige allgemeine Informationen. Der erste Abschnitt erklärt, wie Data Warehouse in den unterschiedlichen Managementebenen eingesetzt wird. Danach wird erläutert, wie dadurch die Kommunikation mit Kunden erleichtert wird und welche generelle Anwendungsgebiete von Data Warehouse vorhanden sind. Das Kapitel Web-enabled Data Warehouse stellt eine neue Verwendungsmöglichkeit des Data Warehouses dar. Es ist nun möglich mit Nutzung von einfachen Browsern darauf zuzugreifen.
3.1 Managementebenen
Es werden traditionellerweise folgende drei Managementebenen unterschieden:
3.1.1 Topmanagement
Das Top-Management hat strategische (richtungweisende) Entscheidungen von großer Tragweite wahrzunehmen, die oft auch unter großer Unsicherheit getroffen werden müssen. Die dafür notwendige Information hat eher Vorhersagecharakter, bezieht sich auf eine mittel- bis langfristige Perspektive, muss nicht detaillierte, sondern vielmehr aggregierte und periodisierte Daten umfassen. (Vgl. Hansen/Neumann, 2005, 771 ff.)
Die technischen Vorraussetzungen für effektives Arbeiten stellt die Anbindung an das firmeninterne Intranet. Der Einsatz eines Web-basierten Business-Infomationsportals als analytisches Informationssystem wäre zu empfehlen. Weiters handelt es sich hier um eine Gruppe von Anwendern von weniger als Hundert Personen. (Vgl. Kurz, 1999, 91)
3.1.2 Middlemanagement
Das Middle-Management hat die bereichsweise Umsetzung der strategischen Ziele zu verantworten. Im Vordergrund stehen Subjekte, geografische Gebiete und Objekte wie beispielsweise Lieferanten, Kunden, Produkte, Absatzgebiete und Mitarbeiter. Man spricht hier von „taktischen“ Entscheidungen, die Informationsanforderungen liegen zwischen der strategischen und er operativen Ebene. (Vgl. Hansen/Neumann, 2005, 771 ff.)
Auch hier bildet die technische Vorrausetzung das Intranet. Sie werden entweder dezentral bzw. räumlich verteilt oder innerhalb einer Abteilung an das DWH angebunden. Das analytische Informationssystem sollte das gleiche wie beim Topmanagement sein. Diese Gruppe umfasst einige Hundert Personen, gegebenenfalls etwas mehr. (Vgl. Kurz, 1999, 91)
3.1.3 Lowermanagement (Operatives Management)
Das operative Management (auf der unteren der drei betrachteten Ebenen) hat Entscheidungen im Tagesgeschäft zu treffen. Diese sind üblicherweise gut strukturiert und lassen sich routinemäßig fällen. Die dafür notwendigen Informationen stammen überwiegend aus internen Quellen und deren Ergebnisse gehen im internen Leistungsprozess ein. Sie müssen zeitnah, genau und detailliert sein. (Vgl. Hansen/Neumann, 2005, 771 ff.)
3.2 Kunden
Die letzte und auch größte Anwendergruppe des DWHs besteht aus den Kunden und Konsumenten. Sie sind räumlich sehr weit verteilt. Im Gegensatz zu den vorher genannten bildet hier die technische Vorrausetzung das Internet als Online oder Offline Medium. Diese Unterstützung ermöglicht es dem Unternehmen eine Vielzahl an Kunden zu bedienen. Auch hier wäre der Einsatz des gleichen analytischen Informationssystems von Vorteil. Die Gruppe dieser Anwender kann nicht wirklich auf eine bestimmte Anzahl reduziert werden. Sie reicht von allen bestehenden Kunden bis hin zu potentiellen Kunden. (Vgl. Kurz, 1999, 91)
3.3 Anwendungsbereiche
Mit Hilfe von Data-Warehouse-Systemen sollen Daten analysiert werden können. Das heißt eine homogene und integrierte Datebasis, die effiziente und zielorientierte Analysen erlaubt, soll dadurch erreicht werden. Da es viele Bereich gibt, in denen Daten gespeichert und anschließend auch ausgewertet werden sollen, sind die Anwendungsbereiche von Data Warehouse vielfältig. So gibt es betriebswirtschaftliche, wissenschaftliche und technische Einsatzgebiete. Aus betriebswirtschaftlicher Sicht lassen sich informations-, analyse-, planungs- und kampagneorientierten Anwendungen unterscheiden. (Vgl. Günzel/Bauer, 2001, 14f.)
3.4 Web-enabled Data Warehouse
Web-enabled Data Warehousing ist ein neuer Begriff im großen Bereich des Data Warehouse. Die Verwendung eines einfachen Internet Browsers vereinfacht hierbei dem Verantwortlichen den Zugang in das Data Warehouse. Mit Hilfe einer zusätzlcihen Web-Schicht (Web-Layer) kann dies ermöglicht werden. Je nach verwendeter Webtechnologie ändert sich auch die Qualität des Systems. (Vgl. Kurz, 1999, 377f)
Der Begriff „Web-enabled Data Warehouse“ kann folgendermaßen erläutert werden:
„Ein Web-enabled Data Warehouse ermöglicht, mittels Standard-Web-Technologien, einen intuitiven Zugang für alle Management-Ebenen auf ein zentrales Data Warehouse bzw. auf einzelne davon abgeleitete Data marts eines Unternehmens. Ein Web-enabled Data Warehouse-System besteht aus einer geschickten Kombination bestehender OLAP-/DWH- und modernen Web-Technologien; dabei erlaubt es den Entscheidern, dynamisch neue OLAP-Abfragen generieren zu können. Die Ergebnispräsentation wird mittels eines herkömmlichen Web-Browsers durchgeführt. Dabei werden diese dynamisch vom Anwender erzeugten Geschäftsberichte mit sogenannter „Hyper-Drill“-OLAP-Funktionalität versehen.“ (Kurz, A., Bonn 1999, 389)
3.4.1 Vorteile
Diese neue Entwicklung bringt einige Vorteile mit sich, die im folgenden Absatz kurz aufgelistet werden. (Genauere Erläuterungen zu den Vorteilen werden in Kurz, 1999, 391 gegeben) Die Hilfe von Standard Web-Technologien, vor allem Standard HTML, ermöglicht hypermediale Informationsaufbereitung. Zentrale Wartung des Systems durch Single Point of Maintenance, Plattformunabhängigkeit, Einsatz von Network Computers, ausschließlicher Einsatz von Web-Technologie und offene und einfache Standards, sind weitere Kriterien, die Vorteile bringen. Vorteile wie zum Beispiel: Geringerer Schuldungsaufwand, Wartung über eine zentrale Stelle, öffentliche Standards, Einsatz von günstigerer Hardware und vieles mehr, sind nur einige der Vorteile. (Kurz, 1999, 392f)
| History| erstellt am: Datum | Autor![]() Themeneinstieg ![]() |