Bericht über Business Intelligence und Data Warehousing Systeme (Bewertung)

Words: 2624
Topic: Daten

Einführung

Der Name Business Intelligence (BI) wurde Mitte der 1950er Jahre geprägt, um die Umwandlung nicht gruppierter Daten aus den unterschiedlichen Funktionsdaten eines Unternehmens oder einer Organisation in ein gemeinsames Data Warehouse zu beschreiben, das dem Unternehmen bei der Erstellung von Berichten und der Präsentation von Informationen helfen kann.

Die Person nutzt dieses gesammelte Datennetz über eine einfach zu bedienende Schnittstelle, die das Ergebnis des Extraktions-, Transformations- und Ladeverfahrens anzeigt. Dieses Verfahren ist allgemein als ETL-Verfahren bekannt und wird zur Erweiterung des Data Warehouse verwendet.

Dieses besondere Netzwerk fungiert auch als geordnete Berichtsumgebung, die die fertigen und verfügbaren funktionalen Berichte und Geschäftsentscheidungen über die verschiedenen Abteilungen der Organisationen verteilt. In jüngster Zeit hat sich die serviceorientierte Architektur (SOA) dazu entschlossen, Data-Warehousing- und Business-Intelligence-Implementierungen zu verdrängen und zu ergänzen (Biere, 2003).

Die Verschmelzung von Data Warehousing und Business Intelligence hat insofern einen geschäftlichen Vorteil, als die Berichterstattung und die Entscheidungsfindung auf einer gemeinsamen funktionalen Sicht oder besser noch auf einem Modell der Wahrheit beruhen. Der Zugang zu Business-Intelligence-Informationen ist zeitgemäß geworden, und es ist auch bekannt, dass grafische Dashboards entwickelt wurden, die vor allem dazu dienen, die wichtigsten Geschäftsvorgänge zu verfolgen.

Dies hat dazu geführt, dass Business Intelligence immer grafikintensiver wird. In der Praxis sind Diagramme und Geschäftsgrafiken nun ein häufiger Bestandteil von Berichten. Die grafischen Dashboards wurden so genannt, weil sie den üblichen Armaturenbrettern in Autos ähneln. Sie liefern operative Informationen auf einen Blick (Moss & Atre, 2003).

Business Intelligence besteht aus verschiedenen Techniken der Datenanalyse und der Übermittlung von Informationen, die die potenziellen Kunden oder Nutzer benötigen. Zu den Kategorien gehören: Geografische Informationssysteme (GIS), die für die Erfassung räumlicher Daten verwendet werden; statistische Standardverfahren, die für die Erfassung quantitativer Daten zum Zwecke der Vorhersage, prädiktiver Modelle und Entscheidungsbäume verwendet werden; und semantische Analysemethoden, die in der Regel für Textdaten verwendet werden (Biere, 2003).

Das geografische Informationssystem und Business Intelligence

Geografische Informationssysteme sind eine alte, aber gut entwickelte und gut informierte Technologie, die in den späten 1960er Jahren in der Informatikentwicklung der Universität entstanden ist. Der Hauptgrund für die Entwicklung eines geografischen Informationssystems bestand darin, die verfügbaren gesammelten Daten mit geografisch referenzierten Kartengrafiken und Bildern zu verknüpfen, um den Menschen zu helfen, die Auswirkungen und Effekte der Geografie auf Faktoren wie Verhalten und Ergebnisse zu verstehen.

Geografische Informationssysteme und Business Intelligence sind seit jeher dafür bekannt, dass sie unterschiedliche Entwicklungs- und Implementierungswege verfolgen. Aufgrund der überwältigenden Nachfrage der Kunden nach einer umfassenderen Technologie und auch aus praktischen Gründen wurden diese beiden Technologien jedoch zusammengeführt. Innerhalb verschiedener Organisationen ist bekannt, dass die Sichtbarkeit dieser beiden Technologien verbessert wurde, um den gesetzlichen Anforderungen zu entsprechen.

Um den Bedürfnissen und Anforderungen der Nutzer von Business Intelligence und geografischen Informationssystemen gerecht zu werden, haben führende Anbieter von Business Intelligence diese beiden Technologien kontinuierlich eingesetzt und innovative Antworten für die rasch wachsende Zahl von Endnutzern geliefert (Weber, Grothe & Schaffer, 1999).

Das Ergebnis ist, dass die neuen Nutzer darauf mit neuen Anwendungen geantwortet haben, die die Synergie der fusionierten Technologien beeinflussen. Geografische Informationssysteme können mit anderen Datenanalysetechniken und Business Intelligence zusammengeführt werden.

Es gibt verschiedene Faktoren, die ihre Integration sehr einfach gemacht haben, wie in diesem Papier erörtert wird. Die Verschmelzung von geographischen Informationssystemen mit anderen Analysetechniken bietet zahlreiche Vorteile für die gesamte Organisation, ohne die bereits vorhandenen informationstechnischen Daten zu beeinträchtigen oder zu unterbrechen.

In der heutigen Welt erkennt das geografische Informationssystem die Standortkomponente von Daten und setzt die Daten in Beziehung zu geografischen Merkmalen, die in einem GIS zu finden sind. Bei diesen Merkmalen handelt es sich um geografische Darstellungen realer Merkmale wie Straßen, Flüsse, Wälder, Seen, Meere, Berge, Gebäude, Wildparks und -reservate, Wüsten und vieles mehr. Sie umfassen auch konzeptionelle Merkmale wie politische Grenzen und Versorgungsgebiete.

Wenn man Informationen mit diesen Merkmalen in Verbindung bringt, können die Benutzer die Daten nach dem geografischen Gebiet jedes Datensatzes anordnen. Sie erfahren zum Beispiel Daten über Berge, Wasserquellen, können bei einer Umfrage leicht Straßen, Häuser und Schulen ausfindig machen. Diese Art von geografischen Datenoperationen wird als Karte dargestellt und zeigt deutlich räumliche Beziehungen und Einflüsse, die in traditionellen tabellarischen Datenansichten nicht aufgezeigt werden können (Hall & Jordan, 2010).

Geografisch sortierte Daten bieten die Möglichkeit, neue Daten zu nutzen, die mit den bereits vorhandenen Daten außer dem Standort nichts gemeinsam haben, z. B. Schulen und andere staatliche Organisationen, die Daten sammeln, wie Versicherungsunternehmen.

GIS-Analysten können die benötigten Adressen oder die der versicherten Einrichtungen kartieren und die Grenzen der Überschwemmungsgebiete überlagern, um alle Einrichtungen innerhalb der überschwemmungsgefährdeten Gebiete zu ermitteln. Anhand dieser Informationen können sie die logistischen Reserven für potenzielle Hochwasserkatastrophen berechnen und den Schulen bei der Aufstellung eines Budgets helfen. In ähnlicher Weise können auch private und öffentliche Organisationen dieselbe Untersuchung durchführen, um die potenziellen Auswirkungen auf Einrichtungen, Lieferketten und Mitarbeiter zu ermitteln (Hall & Jordan, 2010).

Geografische Informationssysteme und Business Intelligence kamen zu einer Zeit zum Einsatz bzw. wurden zu einer Zeit eingeführt, als sich die allgemeine Informationstechnologie weiterentwickelte, um gemeinsame Wege der Zusammenstellung, Verteilung, Speicherung und Nutzung von Daten zu finden. Die meisten Unternehmen, sowohl öffentliche als auch private, mussten immer effizienter arbeiten, um die Anforderungen der wachsenden Zahl von Kunden zu erfüllen.

Infolgedessen empfanden sie ein proprietäres System als großes Hindernis für ihre täglichen Geschäftsabläufe. Um dieses Problem zu lösen, schlugen verschiedene IT-Anbieter und Organisationen vor, dass sie versuchen sollten, eine Methode zu adaptieren, die Konzepte zur Verwendung von Standard- und gemeinsamen Wegen der Datenintegration enthielt. Seitdem diese Standards von den IT-Anbietern übernommen wurden, war es für die verschiedenen Anwendungen sehr einfach, miteinander zu interagieren, da sie die gleichen technologischen Grundlagen nutzten.

Es ist auch festzustellen, dass sich die Internet-Technologie ebenfalls enorm verbessert hat und zu einem wichtigen Kommunikationsprotokoll wurde, das den Informationsaustausch zwischen den verschiedenen funktionalen Abteilungen eines Unternehmens ermöglichte. Im Zuge der Anwendung der Standards konzentrierten sich Business Intelligence und GIS mehr auf den Umgang mit und die Bereitstellung von Informationen, die sie als sehr wichtig für ihre Hauptnutzer erachteten (Prabhu, 2004).

Die BI-Anbieter stellten Konnektoren für die gängigsten Dateiformate her, die von Unternehmen verwendet wurden, während die GIS-Experten hart daran arbeiteten, Verbindungen zwischen den damals weltweit verwendeten Formaten für geografische Merkmale herzustellen. Die zunehmende Nutzung des Internets und die Einführung von Standards als Daten- und Informationsmedium trugen zum Teil zum Einsatz von Unternehmensanwendungen bei.

Die Betreiber von BI-Anwendungen verfügten über technologische Grundlagen und Anwendungen, die bei der Erfüllung der Anforderungen von Unternehmensimplementierungen helfen könnten. Wie bereits erwähnt, funktionieren BI- und GIS-Anwendungen jedoch unterschiedlich. Es wurde daher davon ausgegangen, dass die Zusammenlegung dieser beiden Anwendungen Möglichkeiten zur Verbreitung der Technologien bieten würde und dass die Vorteile dieser beiden Technologien durch die Nutzung von Betriebseinheiten, die derzeit keine ähnlichen Technologien verwenden, realisiert werden könnten.

Dies würde folglich zu einer Ausweitung der integrierten Anwendungen im gesamten Unternehmen führen. Dieselbe Meinung vertraten auch die Innovatoren in Regierungsorganisationen, die aus den vorhandenen Daten verwertbare Informationen gewinnen mussten (Prabhu, 2004).

Die BI-Experten stellten auch fest, dass die bereits eingeführten Standardtechnologie-Architekturen die Verschmelzung von GIS und BI sehr einfach machen würden. Wenn überhaupt, dann bot jede Technologie Lösungen und Antworten auf Probleme, die als große Hindernisse für die Unternehmensimplementierung der jeweiligen Anwendungen angesehen wurden.

Die GIS-Experten sahen ein, dass die Verwendung tabellarischer Daten aus zahlreichen Datenbanken und Dateisystemen schwierig und teuer gewesen wäre, während die BI-Experten dieses Problem mit Hilfe der ETL-Methode oder mit Hilfe von Konnektoren lösten, die es den BI-Anwendungen ermöglichten, die Muttersprache zu verwenden.

Die BI-Anbieter fanden es jedoch am schwierigsten, mit geografischen Datenformaten, CAD-Daten und Bildmaterial zu arbeiten. Außerdem hatten sie Schwierigkeiten mit den in GIS-Karten verwendeten Projektionen. Aber die GIS-Anbieter lösten dieses Problem durch die Verwendung von Standards für die Interoperabilität ihrer Daten (Prabhu, 2004).

Data Warehousing und Business Intelligence

Data Warehousing ist ein wichtiger Aspekt, über den man sprechen muss, wenn es um Business Intelligence geht. Für Data Warehousing gibt es verschiedene Definitionen, von denen einige im Folgenden aufgeführt sind:

Data Warehouse ist eine neuere Entwicklung im Bereich der Datenbankverwaltung, bei der Kopien aller Datenbanken einer Organisation oder eines Unternehmens an einem einzigen Ort aufbewahrt oder angeordnet werden und von Mitarbeitern von jedem Ort aus leicht abgerufen werden können. Es handelt sich auch um eine Methode zur Entwicklung, Erstellung und Pflege eines Data-Warehouse-Systems (SCN Education, 2001). Data Warehouse kann auch als eine Sammlung von Daten einer Organisation definiert werden, die elektronisch zusammengestellt und aufbewahrt werden.

Sie sind so konzipiert, dass sie die Berichterstattung und Analyse von Informationen erleichtern (Thierauf, 2001). Data Warehousing ist mit Business Intelligence (BI) verbunden. Sie besagt, dass das Projektpersonal in erster Linie Informationen von den Endverbrauchern sammeln sollte, da diese in der Regel nicht gut mit Data Warehouse-Angelegenheiten vertraut sind und daher die Anleitung eines Business Sponsors benötigen.

Es ist sehr wichtig, das Personal und die Werkzeuge für das Data Warehouse sowie die Business Intelligence-Software richtig auszuwählen. Bei dem Personal kann es sich entweder um externe Berater handeln, die in der Regel über mehr Erfahrung und umfassende Kenntnisse in diesem Bereich verfügen, oder um fest angestellte Mitarbeiter. Festangestellte Mitarbeiter sind im Gegensatz zu Beratern, die sehr teuer sind, wesentlich wirtschaftlicher (Hall & Jordan, 2010).

Der nächste Schritt ist die Ausführung des Data-Warehouse-Designs, das mehrere Schritte umfasst, wie z. B. die Qualitätssicherung, die inkrementelle Verbesserung, die Einrichtung der physischen Umgebung und vieles mehr.

Bei der Planung des Data Warehousing müssen verschiedene Aspekte berücksichtigt werden, z. B. was zu tun ist, um die Phase erfolgreich abzuschließen, die ungefähre Zeit, die dafür benötigt wird, und die Dokumente, die am Ende der Aufgabe benötigt werden, um jeden einzelnen Schritt während der Data-Warehouse-Aufgabe aufzuzeigen. Die Dokumente helfen den Beratern, ihre Ergebnisse an die Kunden weiterzugeben.

Modelle des Data Warehousing

Die Data-Warehousing-Modelle werden in ein dimensionales Modell, ein konzeptionelles Modell und ein logisches Modell unterteilt. Das dimensionale Modell wird normalerweise in Data-Warehousing-Systemen verwendet, die für übersetzungsbasierte Systeme eingesetzt werden. Es befasst sich mit Aspekten wie der Kategorie von Informationen, z. B. Zeit und Attribute. Es enthält auch eine Faktentabelle, eine Tabelle, die Informationen über die interessierende Größe, wie z. B. die Höhe des Umsatzes in einem Unternehmen, enthält.

Andererseits zeigt ein konzeptionelles Datenmodell die Beziehungsebene zwischen verschiedenen Bereichen. Ein logisches Datenmodell gibt eine sehr detaillierte Beschreibung der Daten, ohne zu berücksichtigen, wie sie in der Datenbank implementiert werden. Business Intelligence besteht aus verschiedenen Techniken zur Analyse von Daten und zur Übermittlung von Informationen an die potenziellen Entscheidungsträger.

Statistische Standardmethoden und Business Intelligence

Hierbei handelt es sich um eine Methode, bei der anhand von statistischen Erhebungen quantitative Informationen über Merkmale einer Bevölkerung zusammengestellt werden. Diese Analyse kann sich auf Meinungen oder faktische Informationen konzentrieren, je nachdem, wofür sie verwendet wird, und sie beinhaltet meist die direkte Befragung von Personen. “Diese Fragen können von einem Forscher gestellt werden, wobei diese Art der Untersuchung als strukturiertes Interview oder als vom Forscher durchgeführte Umfrage bezeichnet wird” (Thierauf, 2001, S. 67).

Sie kann auch in Form von Fragebögen erfolgen. Bei dieser Technik sind die Fragen in der Regel so angeordnet und standardisiert, dass die Frage keinen Einfluss auf die Antworten auf die Fragen hat. Dies geschieht, um die Gültigkeit, Zuverlässigkeit und Verallgemeinerbarkeit der Untersuchung zu gewährleisten.

Allen anderen Personen, die an der Umfrage teilnehmen, sollten die gleichen Fragen in der gleichen Reihenfolge gestellt werden wie den anderen Personen. Dies gewährleistet die Genauigkeit und Zuverlässigkeit der erhobenen Daten. In der Organisationsentwicklung (OE) werden in der Regel stark strukturierte Untersuchungsinstrumente auf der Grundlage der Datenerhebung, der Organisationsdiagnose und anderer erwarteter Ergebnisse des Unternehmens eingesetzt (Weber et al., 1999).

Diese Technik kann zur Untersuchung von Konzepten wie der Lehrplanentwicklung verwendet werden. Sie ist besonders nützlich, wenn der Forscher ein persönliches Gespräch mit den Befragten führen möchte. Hier werden die Erhebungsfragen in Form von Fragebögen gestellt. Die beteiligten Personen gehen von Tür zu Tür oder von Haus zu Haus und stellen Fragen, während sie gleichzeitig ihre Daten sammeln.

Die gesammelten Daten werden dann für die spätere Verwendung quantifiziert. Wenn ein Land beispielsweise seinen Lehrplan ändern muss, muss es zunächst einen Entwurf für den neuen Lehrplan erstellen, die Fächer, die gelehrt werden sollen und die, die weggelassen werden sollen, die Stufen, in denen die Fächer gelehrt werden sollen, die Ressourcen, die die Lehrer verwenden sollen, die Lehrmethoden sowie die Form der Verhaltensverstärkung, um nur einige zu nennen.

Die Antworten auf diese Fragen während der Pilotphase geben den Entwicklern grünes Licht für die Umsetzung des neuen strukturierten Lehrplans oder sie müssen zurück ans Reißbrett. Wenn zum Beispiel die Mehrheit der Menschen der Meinung ist, dass der neu vorgeschlagene Lehrplan den Bedürfnissen des Landes in Bezug auf Bildung und Arbeitskräfte entspricht, kann er umgesetzt werden.

Wenn andererseits die Mehrheit der Befragten mit dem vorgeschlagenen Lehrplan nicht zufrieden ist, werden die Entwickler ihre Antworten und Meinungen nutzen, um einen Lehrplan zu entwickeln, der für ihre Bürger geeignet ist und den Bedürfnissen ihres Landes entspricht. In der Regel ist das Ergebnis dieser Technik sehr zuverlässig und effektiv und kann auch mit einem geografischen Informationssystem kombiniert werden, um den Beteiligten zu helfen, verschiedene Regionen des Landes zu erreichen (Thierauf, 2001).

Die üblichen statistischen Methoden können von einem Land auch verwendet werden, um herauszufinden, wie sich seine Bürger technologisch entwickelt haben. So können Erhebungsbeauftragte zum Beispiel herausfinden, wie viele Menschen zu Hause elektronische Geräte wie Computer, Fernseher, Mikrowellenherde, Elektroherde, Kühlschränke und andere elektronische Geräte benutzen.

In einem solchen Fall gehen die Erheber von Haus zu Haus, sowohl in ländlichen als auch in städtischen Gebieten, und sammeln Daten über jedes der oben genannten Geräte. Unternehmen können diese Technik auch nutzen, um herauszufinden, wie ihre Kunden über ihre Produkte und Dienstleistungen denken. Die Ergebnisse der Umfrage können dem Unternehmen helfen, Entscheidungen zu treffen, die den Kundenstamm vergrößern, indem sie Produkte und Dienstleistungen entwickeln, die den Bedürfnissen der Kunden entsprechen.

Der Vorteil dieser Methode besteht darin, dass die Nutzer nicht über einen hohen Bildungsstand verfügen müssen, um die Daten interpretieren zu können. Nachteilig ist, dass sie zeitaufwändig ist, da sie manuell und nicht elektronisch durchgeführt wird. Diese Technik wird viel effektiver, wenn sie mit GIS kombiniert wird, denn während die Technik selbst keine Karten und Bilder liefert, kann sie Karten und Bilder aus dem GIS verwenden (Prabhu, 2004).

Semantisches Textmining und BI gehen ebenfalls Hand in Hand, da es dabei hilft, Daten aus großen Datenmengen, die hauptsächlich in Textform gesammelt werden, abzurufen. Text Mining hilft BI-Experten, indem es ihnen die Fähigkeit vermittelt, Textdaten so zu organisieren und zu ordnen, dass sie leicht zu nutzen sind. Die meisten Unternehmen, wie z. B. Callcenter, E-Mail und viele andere, sammeln ihre Daten in Textform. Es wird festgestellt, dass diese Informationen täglich und in hohem Maße zunehmen.

Durch den Einsatz von Text Mining wenden BI-Experten das Wissen des Text Mining an, indem sie nummerierte und kurzfristige Dateninformationen in der Unternehmensorganisation untersuchen. Anschließend organisieren sie diese Informationen in einer handhabbaren Form, die von anderen genutzt werden kann. Sie tun dies, ohne den wichtigsten Teil der Informationen auszulassen, der andernfalls verloren gegangen wäre, wenn Text Mining nicht eingesetzt worden wäre (Gao, Chang & Han, 2005).

Referenzliste

Biere, M. (2003). Business Intelligence für das Unternehmen. Upper Saddle River: Pearson Education.

Gao, L., Chang, E., & Han, S. (2005). Leistungsstarkes Werkzeug zur Erweiterung der Business Intelligence: Text Mining. World Academy of Science, Engineering and Technology, 8, 110-115.

Hall, D., & Jordan, J. (2010). Menschenzentrierte Informationsfusion. Chicago: Artech House.

Moss, L., & Atre, S. (2003). Business Intelligence Roadmap: Der komplette Projektlebenszyklus für entscheidungsunterstützende Anwendungen. New York: Addison-Wesley.

Prabhu, C. (2004). Data Warehousing: Konzepte, Techniken, Produkte und Anwendungen. Neu Delhi: Prentice-Hall of India.

SCN Bildung. (2001). Data Warehousing: Der ultimative Leitfaden zum Aufbau von Business Intelligence in Unternehmen. Berlin: Wiley-VCH.

Thierauf, R. (2001). Effektive Business Intelligence Systeme. London: Greenwood Publishing Group.

Weber, J., Grothe, M., & Schaffer, U. (1999). Business Intelligence. Berlin: Wiley-VCH.