Data Warehousing    &

Helmut Schluderbacher

& Data Warehousing

Datenbanken


DATA WAREHOUSING - Building the Corporate Knowledgebase; Tom Hammergren; Sybase Press / International Thomson Press ISBN 1-85032-856-0, 470 Seiten, 1996

Helmut Schluderbacher

bild1

Seit einiger Zeit geistert ein neuer Begriff durch die EDV: Data Warehouse - Das Datenwarenhaus. Doch was ist ein Datenwarenhaus?

Eine gute transaktionsorientierte Datenbank ist schlank und hat so wenig wie möglich Redundanzen. Anders ein Datenwarenhaus, das die Informationen in verschiedenen Verdichtungen verspeichert hält.

In früheren Jahren war es für die Firmen notwendig, alle Daten so einfach und komprimiert wie möglich zu speichern. Platzsparen war angesagt. Daher wurden alle Daten in den Basisinformationen verspeichert. Wenn nun eine Auswertung über die nicht unbeträchtlichen Daten gefahren wurde, hat dies immer einen Menge Rechenzeit beansprucht. Solche Informationen dienen dann aber der weiteren strategischen Planung!

Zudem sind die herkömmlichen Datenbanken prozeßorientiert aufgebaut. Das rasche Verspeichern und die rasche Abfrage von Detailinformation steht im Vordergrund.

Im Gegensatz dazu stehen die Auswertungen. Bei ihnen muß die Information nach bestimmten Kriterien zu meist verdichtet, sprich, komprimiert sein. Und dies auch noch in verschiedener Hinsicht. Zum Beispiel ein Artikel steckt auch in einer Artikelgruppe und in einer Warengruppe. Diese werden verdichtet auf das einzelne Geschäft (Filiale), das Bundesland und dann auf den einzelnen Staat. Dies alles wird dann noch verdichtet auf den Tag, die Woche, das Monat und dann auf das Jahr. Damit erhält man bei diesem einfachen Beispiel einen dreidimensionalen Würfel, mit den Dimensionen Artikel, Zeit und Ort.

Es sollte also möglich sein, die Informationen so aufzubereiten, daß eine Auswertung nicht die Hälfte des Tages den Rechner blockiert und ein einzelner Fehlerfall die mittlere Katastrophe darstellt. Bei uns gibt es viele Firmen, deren Verarbeitungsprozesse an diese Zeiten herankommen. Die Abfragen sollten auch flexibel sein, damit das Hinzufügen von einfachen Zusatzinformationen nicht einen großen Programmieraufwand bedeutet. Dies ist jedoch nur eine Motivation für ein Data Warehouse.

Nach einer Einführung wird in dem Buch auf die Analyse, das Design und die Erstellung beschrieben. Natürlich werden die Begriffe Star-Schema, Snowflake-Schema, und viele andere sehr anschaulich erklärt. Das Buch von Tom Hammergren geht aber über die einfache Beschreibung des Data Warehouse weit hinaus. Als zusätzliches Zucker wird sehr ausführlich auf Data Warehouse-Projekte als solche eingegangen. Die Bildung eines Projektteams, und das Projektmanagement werden beschrieben. Die beiliegende Diskette enthält einige Tips und Vorlagen, die zumindest als Motivation sehr zu empfehlen sind. Das Buch ist in englischer Sprache.