<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>mibe000170</Identifier>
    <IdentifierDoi>10.3205/mibe000170</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-mibe0001706</IdentifierUrn>
    <ArticleType>Originalarbeit</ArticleType>
    <TitleGroup>
      <Title language="de">Konsolidierte Datenmodellierung von Versorgungsdaten mit dem Entity-Attribute-Value-Modell und Data Vault</Title>
      <TitleTranslated language="en">Consolidated data modeling of health services research data with the entity-attribute-value model and data vault</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Rauch</Lastname>
          <LastnameHeading>Rauch</LastnameHeading>
          <Firstname>Jens</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address>Hochschule Osnabr&#252;ck, Fakult&#228;t Wirtschafts- und Sozialwissenschaften, Forschungsgruppe Informatik im Gesundheitswesen, Postfach 1940, 49009 Osnabr&#252;ck, Deutschland<Affiliation>Hochschule Osnabr&#252;ck, Fakult&#228;t Wirtschafts- und Sozialwissenschaften, Forschungsgruppe Informatik im Gesundheitswesen, Osnabr&#252;ck, Deutschland</Affiliation></Address>
        <Email>j.rauch&#64;hs-osnabrueck.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Weiss</Lastname>
          <LastnameHeading>Weiss</LastnameHeading>
          <Firstname>Jan-Patrick</Firstname>
          <Initials>JP</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Hochschule Osnabr&#252;ck, Fakult&#228;t Wirtschafts- und Sozialwissenschaften, Forschungsgruppe Informatik im Gesundheitswesen, Osnabr&#252;ck, Deutschland</Affiliation>
          <Affiliation>Universit&#228;t Osnabr&#252;ck, Institut f&#252;r Informationsmanagement und Unternehmensf&#252;hrung (IMU), Osnabr&#252;ck, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Teuteberg</Lastname>
          <LastnameHeading>Teuteberg</LastnameHeading>
          <Firstname>Frank</Firstname>
          <Initials>F</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;t Osnabr&#252;ck, Institut f&#252;r Informationsmanagement und Unternehmensf&#252;hrung (IMU), Osnabr&#252;ck, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>H&#252;bner</Lastname>
          <LastnameHeading>H&#252;bner</LastnameHeading>
          <Firstname>Ursula</Firstname>
          <Initials>U</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Hochschule Osnabr&#252;ck, Fakult&#228;t Wirtschafts- und Sozialwissenschaften, Forschungsgruppe Informatik im Gesundheitswesen, Osnabr&#252;ck, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">health services research</Keyword>
      <Keyword language="en">data warehouse</Keyword>
      <Keyword language="en">data collection</Keyword>
      <Keyword language="en">common data elements</Keyword>
      <Keyword language="en">information storage and retrieval</Keyword>
      <Keyword language="de">Versorgungsforschung</Keyword>
      <Keyword language="de">Data-Warehouse</Keyword>
      <Keyword language="de">Datensammlung</Keyword>
      <Keyword language="de">gemeinsame Datenelemente</Keyword>
      <Keyword language="de">Informationsspeicherung und -abruf</Keyword>
      <SectionHeading language="de">Beitrag f&#252;r die GMDS-Jahrestagung 2017</SectionHeading>
    </SubjectGroup>
    <DatePublishedList>
      
    <DatePublished>20170829</DatePublished></DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>1860-9171</ISSN>
        <Volume>13</Volume>
        <Issue>1</Issue>
        <JournalTitle>GMS Medizinische Informatik, Biometrie und Epidemiologie</JournalTitle>
        <JournalTitleAbbr>GMS Med Inform Biom Epidemiol</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>03</ArticleNo>
    <Fundings>
      <Funding fundId="ZN 3103">Land Niedersachsen</Funding>
    </Fundings>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph>F&#252;r die Versorgungsforschung ist wichtig, dass verteilte und heterogene Daten so integriert werden, dass sie offen f&#252;r neue Analyse-Anforderungen und leicht um neue Datenquellen erweiterbar sind. F&#252;r die Integration von Versorgungsdaten werden bislang haupts&#228;chlich Data-Warehouses eingesetzt, die Daten dimensional oder als Entity-Attribute-Value-Struktur (EAV) modellieren. Diese Datenmodelle sind jedoch entweder unflexibel oder weisen ein zu geringes Ma&#223; an Datenorganisation auf, was longitudinale Analysen erschwert. Wir haben den EAV-Ansatz um die Data-Vault-Modellierung erg&#228;nzt und damit die Datenstrukturen der Krankenhaus-Qualit&#228;tsberichte des Gemeinsamen Bundesausschusses (G-BA) modelliert sowie die Daten der Jahre 2011 bis 2015 integriert. Dies erm&#246;glicht eine Historisierung der Metadaten f&#252;r Merkmale, insbesondere der Qualit&#228;tsindikatoren, sowie ein hohes Ma&#223; an Erweiterbarkeit gegen&#252;ber neuen heterogenen Datenquellen. Der vorgeschlagene Ansatz erlaubt es, den Abstraktionsgrad f&#252;r die zu modellierenden Entit&#228;ten frei zu w&#228;hlen, so dass auch ein vollst&#228;ndig generisches EAV-Modell mit historisierten Metadaten erstellt werden kann.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph>Distributed and heterogeneous data must be integrated for health services research in a way, which is open to new requirements and easily expandable for new data sources. For data integration in the health services research domain, mainly data warehouses have been used that model data either as a dimensional or an entity-attribute-value (EAV) model. However, these data models are either not flexible enough or lack data management capabilities, which makes longitudinal data analyses more difficult. We have extended the EAV approach with data vault modelling and hereby modelled the data structures of the hospital quality reports by the Gemeinsamer Bundesauschuss (G-BA) and integrated data from the years 2011 to 2015 accordingly. This makes it possible to historicise metadata of features, in particular those of quality indicators, and establishes a high degree of extensibility towards new heterogeneous data sources. The proposed approach allows a free selection of the abstraction level for the entities to be modelled, so that a completely generic EAV model with historicised metadata can be created.</Pgraph></Abstract>
    <TextBlock linked="yes" name="Einleitung">
      <MainHeadline>Einleitung</MainHeadline><Pgraph>Die rasant wachsende und verteilte Menge an Datenquellen im Gesundheitswesen birgt gro&#223;es Potential f&#252;r die Versorgungsforschung <TextLink reference="1"></TextLink>. Die zunehmende Digitalisierung der Gesellschaft macht es aber auch f&#252;r die Forschung einfacher, Versorgungsdaten im Rahmen von Befragungen und Interviews zu erheben <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>, <TextLink reference="4"></TextLink>. Diese Vielzahl an internen wie externen, verteilten Datenquellen geht einher mit informationstechnologischen Barrieren und einem hohen Grad semantischer Heterogenit&#228;t <TextLink reference="5"></TextLink>. Daraus resultiert ein hoher Bedarf an integrierten Datenbest&#228;nden, konsistenter Datenhaltung und strukturiertem Datenmanagement. Denn von besonderer Bedeutung in der Versorgungsforschung ist die Sichtweise auf Versorgungsdaten im L&#228;ngsschnitt, um Trends und Pr&#228;diktoren aufzusp&#252;ren <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>. </Pgraph><Pgraph>F&#252;r L&#228;ngsschnittbetrachtungen dieser Art m&#252;ssen Datens&#228;tze, die dieselben Informationsobjekte beschreiben, aufeinander abgebildet und ihre Ver&#228;nderung erfasst werden. Neue Forschungsideen f&#252;hren dabei oft zu sich &#228;ndernden Erhebungs-Items und damit zu sich &#228;ndernden Schnittstellen. Hinzu kommt, dass in gr&#246;&#223;eren Forschungsprojekten eine Vielzahl von Wissenschaftlern verschiedene Fragestellungen untersuchen, auch wenn sie eine gemeinsame Datenbasis verwenden <TextLink reference="9"></TextLink>. Dabei entstehen oft erst w&#228;hrend des Forschungsprozesses neue Ans&#228;tze, Ideen und Fragestellungen, die im Verlauf n&#228;her untersucht werden <TextLink reference="10"></TextLink>.</Pgraph><Pgraph>Daraus leiten sich zwei Anforderungen f&#252;r das zentrale Datenmodell eines Forschungs-Data-Warehouse ab: F&#252;r die laufend neu zu erschlie&#223;enden Datenquellen ist ein Datenmodell zu entwickeln, das in hohem Ma&#223; <Mark2>erweiterbar</Mark2> ist und die Integration von Daten aus neuen Datenstrukturen m&#246;glichst einfach macht. Andererseits sollte diese Integration in zweifacher Hinsicht <Mark2>offen</Mark2> sein. Wenn zu erwarten ist, dass Daten ihre Semantik &#228;ndern, weil beispielsweise die Items eines Fragebogens umformuliert werden, ist es wichtig, dass das Datenmodell dies ad&#228;quat abbilden kann, ohne daf&#252;r gesondert angepasst zu werden (Offenheit gegen&#252;ber ge&#228;nderter Semantik der Datenquellen). Dar&#252;ber hinaus soll das Datenmodell keine analytischen Entscheidungen vorwegnehmen, etwa weil seine Struktur bestimmte Analysedimensionen vorsieht, die bestimmen, wonach Daten aggregiert werden k&#246;nnen. Die Datenbasis sollte daher gegen&#252;ber anderen &#8222;Sichten&#8220; auf die Daten, neuen Fragestellungen, aber auch ungeplanten Analysen offen sein (Offenheit gegen&#252;ber ge&#228;nderten Analyseanforderungen) <TextLink reference="11"></TextLink>.</Pgraph><Pgraph>Diese Anforderungen sind typisch f&#252;r komplexe langfristige Forschungsvorhaben wie das Projekt ROSE <TextLink reference="12"></TextLink> in dem neben Versorgungsdaten aus Interviews und Befragungen ein breites Spektrum an externen Daten anfallen. Im Projekt ROSE an der Hochschule Osnabr&#252;ck fallen neben Versorgungsdaten aus Interviews und Befragungen ein breites Spektrum an externen Daten an. Dazu geh&#246;ren die Krankenhaus-Qualit&#228;tsberichte des Gemeinsamen Bundesausschusses (G-BA) <TextLink reference="13"></TextLink>, das Krankenhausverzeichnis <TextLink reference="14"></TextLink> sowie soziodemographische Daten der statistischen Landes&#228;mter. F&#252;r die Integration dieser Versorgungsdaten lassen sich die Anforderungen Erweiterbarkeit und Offenheit konkretisieren:</Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1.">Das Datenmodell soll sowohl einer hohen und wachsenden Anzahl von Merkmalen standhalten, als auch die Vereinzelung von Merkmalsauspr&#228;gungen handhaben k&#246;nnen (vgl. <TextLink reference="15"></TextLink>).</ListItem><ListItem level="1" levelPosition="2" numString="2.">Das Datenmodell soll Analysen im Quer- und L&#228;ngsschnitt erm&#246;glichen. Dies erfordert insbesondere, dass identische Teilnehmer und &#252;bereinstimmende Merkmale aufeinander abgebildet werden und dass erfasst wird, wie sich Items &#252;ber die Zeit ver&#228;ndert haben.</ListItem><ListItem level="1" levelPosition="3" numString="3.">Das Datenmodell soll um Kontextdaten erweiterbar sein, die Merkmale und Teilnehmer beschreiben, wiederum ohne die bestehende Struktur des Datenmodells &#228;ndern zu m&#252;ssen.</ListItem><ListItem level="1" levelPosition="4" numString="4.">Das Datenmodell soll datengetrieben und nicht auswertungsgetrieben sein. Es soll insbesondere nicht zwischen abh&#228;ngigen und unabh&#228;ngigen Variablen unterscheiden oder Analysen auf eine Auswahl von Informationsobjekten (z.B. Qualit&#228;tsindikatoren vs. Diagnosen) beschr&#228;nken.</ListItem></OrderedList></Pgraph><Pgraph>Wir stellen im Folgenden ein Konzept f&#252;r ein Datenmodell vor, das diese Anforderungen umsetzt, und dessen Implementierung anhand der Krankenhaus-Qualit&#228;tsberichte des G-BA.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Stand der Forschung">
      <MainHeadline>Stand der Forschung</MainHeadline><Pgraph>Informationssysteme, die regelm&#228;&#223;ig anfallende Daten aus verschiedenen Quellen integrieren und so organisieren, dass jeder beliebige Zustand von Informationsobjekten in der Vergangenheit, aber auch ihre Ver&#228;nderung &#252;ber die Zeit abrufbar sind, werden als Data-Warehouses bezeichnet <TextLink reference="16"></TextLink>. Sie haben als Systeme zur Datenintegration in die Versorgungsforschung bereits Einzug gehalten <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>.</Pgraph><Pgraph>Das Datenmodell eines Data-Warehouse gibt vor, wie die Daten so zu organisieren sind, dass die genannten Anforderungen bestm&#246;glich erf&#252;llt werden. Die am weitesten verbreiteten Datenmodelle f&#252;r Data-Warehouse-Systeme sind normalisierte Relationale Modelle und die Dimensionale Modellierung (Sternschema) <TextLink reference="19"></TextLink>, <TextLink reference="20"></TextLink>. Ein normalisiertes Modell sichert zwar Konsistenz und referentielle Integrit&#228;t der Daten, erzwingt aber in aller Regel tiefgreifende strukturelle Anpassungen, wenn neue Datenquellen integriert werden m&#252;ssen oder Datenspezifikationen sich &#228;ndern <TextLink reference="21"></TextLink>. Dimensionale Modelle unterteilen Daten in Ereignisse (&#8222;Fakten&#8220;) und ereignisbeschreibende Dimensionen. Sie setzen mithin voraus, bestimmte Daten als zentrale Ereignisse zu identifizieren und vorab festzulegen, anhand welcher Dimensionen diese ausgewertet werden sollen. Diese Festlegungen sind stark anforderungsgetrieben und erfordern es, festzulegen, welche Daten f&#252;r die Analyse als abh&#228;ngige Variablen (Fakten) gelten und welche unabh&#228;ngig (Dimensionen) sind <TextLink reference="22"></TextLink>. &#196;ndern sich die Anforderungen m&#252;ssen Dimensionale Modelle erheblich angepasst werden.</Pgraph><Pgraph>In j&#252;ngster Zeit konnten sich f&#252;r Gesch&#228;ftsanwendungen aber auch einige neuere Modellierungstechniken wie Data Vault (DV) etablieren <TextLink reference="23"></TextLink>, <TextLink reference="24"></TextLink>. Sie trennen in strikter Weise Informationsobjekte, deren Attribute und Beziehungen voneinander, so dass schematische &#196;nderungen immer nur eine Erweiterung und niemals eine Anpassung bestehender Datenbankstrukturen zur Folge haben <TextLink reference="20"></TextLink>, <TextLink reference="25"></TextLink>. Diese j&#252;ngeren Ans&#228;tze fanden bislang in der wissenschaftlichen Literatur nur z&#246;gerlich Beachtung.</Pgraph><Pgraph>In der Versorgungsforschung hat parallel zu den genannten Data-Warehouse-Datenmodellen, das Entity-Attribute-Value-Datenmodell (EAV) Verbreitung gefunden <TextLink reference="21"></TextLink>, <TextLink reference="26"></TextLink>, <TextLink reference="27"></TextLink>. Diese Art der Modellierung liefert ein einfaches und flexibles Datenmodell, das sich besonders robust bei stark <Mark2>vereinzeltem</Mark2> und <Mark2>ver&#228;nderlichem</Mark2> Auftreten von Merkmalen zeigt <TextLink reference="15"></TextLink>. Die Informationsobjekte von Versorgungsdaten verf&#252;gen &#252;ber eine hohe Anzahl an potentiellen Merkmalen, aber oft ist nur eine kleine Teilmenge ihrer Auspr&#228;gungen erfasst. Es kommen au&#223;erdem laufend neue Merkmale hinzu. Diese Eigenschaften vertragen sich nur schwer mit den klassischen Data-Warehouse-Modellen, die voraussetzen, dass Merkmale ersch&#246;pfend und abschlie&#223;end vorab festgelegt werden. EAV begegnet dem Problem, indem die erfassten Merkmale nicht strukturell im relationalen Schema festgeschrieben werden, sondern auf Datensatzebene (zeilenweise) repr&#228;sentiert werden <TextLink reference="21"></TextLink>.</Pgraph><Pgraph>Reine EAV-Datenmodelle bieten also einen robusten Ansatz bei hoher Datenheterogenit&#228;t und rascher Evolution von Datenstrukturen. Sie leisten dies aber zu Lasten der Datenorganisation, was sich vor allem durch komplexe Abfragen bemerkbar macht <TextLink reference="21"></TextLink>. Bisher wurde deshalb versucht, die EAV-Daten entweder in sp&#228;teren Architekturschichten des Data-Warehouse (DW) anforderungsgetrieben doch wieder in ein Sternschema-Modell zu &#252;berf&#252;hren <TextLink reference="28"></TextLink> oder sie in eine dimensionale Struktur einzubetten <TextLink reference="29"></TextLink>, <TextLink reference="30"></TextLink>. Da der erste Ansatz die urspr&#252;nglichen Probleme der sich wandelnden Merkmale und unterspezifizierter Anforderungen in sp&#228;tere Schichten verlagert, ist hier nur der zweite interessant. Es werden dazu EAV-Tabellen wie Faktentabellen im Sternschema behandelt und durch Dimensionstabellen beschrieben. Die Dimensionen beschreiben in dem Fall keine Auswertungsdimensionen, sondern Attributdimensionen, je nachdem, welche Attributtypen als Spalten der Faktentabelle modelliert sind <TextLink reference="30"></TextLink>. Dieses Vorgehen bewahrt im Wesentlichen die Flexibilit&#228;t des EAV-Modells f&#252;r die eigentlichen Messdaten, bringt aber die bekannten Einschr&#228;nkungen des Sternschemas f&#252;r die Dimensionstabellen mit sich. Bisher gibt es keinen Ansatz, der EAV-Modelle mit neueren DW-Datenmodellen wie DV verkn&#252;pft, um auf diese Weise Daten besser zu strukturieren, ohne die Flexibilit&#228;t von EAV aufzugeben.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Konzept">
      <MainHeadline>Konzept</MainHeadline><Pgraph>Die Anforderungen 2. und 3. an die Verarbeitung von Versorgungsdaten im ROSE-Projekt sprechen f&#252;r einen Data-Warehouse-Ansatz. Allerdings wird an den Anforderungen 1. und 4. deutlich, dass die g&#228;ngigen Datenmodelle f&#252;r Data-Warehouses nicht im gew&#252;nschten Ma&#223;e offen und erweiterbar gegen&#252;ber neuen oder sich &#228;ndernden Quellsystem sind, ohne umfangreiche und aufw&#228;ndige Modifikationen des Datenschemas nach sich zu ziehen. Deshalb wurde f&#252;r die vorliegende Arbeit ein EAV-Ansatz um ein DV-Modell erweitert.</Pgraph><Pgraph>Zentral f&#252;r die Modellierung von Versorgungsdaten ist die Beziehung zwischen den Informationsobjekten Merkmalstr&#228;ger, Merkmal und Merkmalsauspr&#228;gung. In einem einfachen EAV-Schema w&#252;rden diese Informationsobjekte entsprechend als Entit&#228;t, Attribut bzw. Wert modelliert. Gem&#228;&#223; Anforderungen sind zu Merkmalen und ihren Auspr&#228;gungen jedoch Metadaten zu erfassen und Merkmalstr&#228;ger mit Daten aus weiteren Datenquellen zu verkn&#252;pfen. Aus diesem Grund abstrahieren wir von Attributen und Werten, indem diese ebenfalls als eigenst&#228;ndige Entit&#228;ten modelliert werden. Die Versorgungsdaten organisieren sich somit in Entit&#228;ten f&#252;r Merkmalstr&#228;ger (z.B. Klinikstandorte, Personen), Klassen von Merkmalen (z.B. Qualit&#228;tsindikatoren, Personalausstattung) und Auspr&#228;gungen (z.B. ICD-Codes, Antwortm&#246;glichkeiten f&#252;r Befragungsitems). Die DV-Modellierung sieht f&#252;r jede Entit&#228;t im logischen Datenbankmodell eine Hub-Tabelle vor, die einmalig das Vorkommen einer konkreten Entit&#228;tsinstanz anhand ihres nat&#252;rlichen Schl&#252;ssels erfasst und ihr durch einen Hashwert einen technischen Schl&#252;ssel zuweist <TextLink reference="31"></TextLink>. Die Verkn&#252;pfung von Entit&#228;ten erfolgt &#252;ber Link-Tabellen, die lediglich Referenzen auf die jeweiligen technischen Schl&#252;ssel in den Hubs enthalten. Es ergibt sich also an Stelle der Entit&#228;t-Attribut-Wert-Tabelle ein n-facher Link, der bestimmte Merkmalstr&#228;ger mit mehreren Merkmalsklassen und Auspr&#228;gungen verkn&#252;pft und auf die entsprechenden Entit&#228;tsschl&#252;ssel verweist. Nach der DV-Spezifikation <TextLink reference="31"></TextLink> geben Hubs und Links Aufschluss dar&#252;ber, welche Entit&#228;tsinstanzen und -beziehungen jemals aufgetreten sind. Entit&#228;tsattribute, und damit auch alle zeitabh&#228;ngigen Daten, werden im DV-Modell in Satellites modelliert. Datens&#228;tze werden hierbei niemals ver&#228;ndert oder gel&#246;scht. Die Historisierung erfolgt &#252;ber Zeitstempel.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Implementierung">
      <MainHeadline>Implementierung</MainHeadline><Pgraph>Das Datenmodell wurde ausgehend von den Qualit&#228;tsberichten des G-BA f&#252;r die Jahre 2011 bis 2014 in <TextGroup><PlainText>PostgreSQL</PlainText></TextGroup> 9.6 implementiert, die im Laufe der Entwicklung mit Befragungsdaten (z.B. <TextLink reference="3"></TextLink>) und anderen externen Daten verkn&#252;pft wurden. Ein Ausschnitt des resultierenden Datenbankschemas ist in Abbildung 1 <ImgLink imgNo="1" imgType="figure"/> dargestellt. Gezeigt sind Tabellen und Fremdschl&#252;sselbeziehungen, die die Ergebniskennzahlen des Teil C der Qualit&#228;tsberichte <TextLink reference="13"></TextLink> enthalten: Die zentrale Beziehung besteht hier zwischen dem 4-Tupel der Entit&#228;ten Klinikstandorte, Auswertungseinheiten, Leistungsbereiche und Qualit&#228;tsindikatoren. Gem&#228;&#223; der Data-Vault-Spezifikation wurden f&#252;r Entit&#228;ten Hubs und f&#252;r deren Beziehungen Links als relationale Tabellen erstellt. Ihre zeitabh&#228;ngigen und deskriptiven Attribute werden in Satellites ausgelagert. Da die Auspr&#228;gungen der Qualit&#228;tsindikatoren numerisch sind, gibt es f&#252;r diese Klasse von Merkmalen keine eigene Auspr&#228;gungsentit&#228;t. Die zeitabh&#228;ngige Auspr&#228;gung f&#252;r den 4-Tupel Standort-Auswertungseinheit-Leistungs-Bereich-Qualit&#228;tsbericht ist in den Satellite des Links dieser Beziehung ausgelagert. Es wurden alle Informationsobjekte als Hubs modelliert, deren Beschreibung durch Metadaten vorliegt bzw. fachlich zu erwarten ist (z.B. Adressen) oder die mit mehr als einem Informationsobjekt in Beziehung stehen.</Pgraph><Pgraph>Die technischen Schl&#252;ssel der Entit&#228;ten wurden &#252;ber Anwendung des MD5-Hashing-Algorithmus auf die nat&#252;rlichen Schl&#252;sselattribute gebildet. Da alle Datenquellen als Flatfiles vorliegen, wird das Feld <Mark2>rcd&#95;src</Mark2>, das die Datenquelle eines Datensatzes enth&#228;lt, mit dem vollst&#228;ndigen Dateipfad der jeweiligen Quelldatei bef&#252;llt. Das Feld <Mark2>load&#95;dts</Mark2> enth&#228;lt &#8211; entgegen der DV-Spezifikation &#8211; das Erhebungsdatum der Befragung und nicht den Zeitpunkt, zu dem der Datensatz in die Datenbank geschrieben wurde. Grund ist, dass die Historisierung von technisch bedingten Daten&#228;nderungen im vorliegenden Fall nicht von Interesse ist, so dass die daf&#252;r erforderliche zus&#228;tzliche Komplexit&#228;t (zweite Datumsspalte oder Indextabelle) zu rechtfertigen w&#228;re. Entsprechend der Zielsetzung &#252;bergreifend historisierter Merkmale werden die Qualit&#228;tsindikatoren in dem Hub <Mark2>h&#95;quality&#95;indicator</Mark2> abgelegt, der somit offen gegen&#252;ber neuen Qualit&#228;tsindikatoren ist. Dieser Hub hat den Satellite <Mark2>s&#95; quality&#95;indicator</Mark2>, der der Indikatorspezifikation des G-BA <TextLink reference="13"></TextLink> gen&#252;gt (vgl. Abbildung 1 <ImgLink imgNo="1" imgType="figure"/>).</Pgraph><Pgraph>Dieses Datenmodell enth&#228;lt Daten zu 2.883 Klinik-Standorten. F&#252;r diese liegen hier f&#252;r den Ergebnisteil der Qualit&#228;tsberichte insgesamt 733.000 Datenwerte f&#252;r 381 Qualit&#228;tsindikatoren vor, verteilt auf insgesamt knapp 20.000 Auswertungseinheiten, 39 Leistungsbereiche und die Jahre 2011 bis 2014. Das gesamte Datenmodell findet sich in Anhang 1 <AttachmentLink attachmentNo="1"/>.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Lessons learned">
      <MainHeadline>Lessons learned</MainHeadline><Pgraph>Das DV-Modell erwies sich im Verlaufe des Projekts als nat&#252;rliche Erweiterung des EAV-Ansatzes <TextLink reference="21"></TextLink>. Die DV-Spezifikation <TextLink reference="31"></TextLink> gibt einfache konzeptionelle Bausteine vor, mit denen von Entit&#228;ten, Attributen und Werten abstrahiert werden kann, so dass diese als eigenst&#228;ndige Informationsobjekte mit lose gekoppelten Beziehungen untereinander r&#252;ckverfolgbar integriert und historisiert werden. Die wichtigsten Designentscheidungen bestehen darin, festzulegen, welche Daten als Entit&#228;ten (Hubs) und welche als elementare Attribute (Spalten der Satellites) zu modellieren waren. Diese Entscheidung beeinflusst, wie flexibel das Datenmodell f&#252;r jene Daten ist. Es empfiehlt sich daher, Informationsobjekte, f&#252;r die heterogene oder inkonsistente Daten erwartet werden, von vornherein als vollwertige Entit&#228;ten zu modellieren. Dies zieht jedoch f&#252;r jede solche Entit&#228;t die Definition eines Hubs und ggf. mehrerer Links und Satellites nach sich. Die nachtr&#228;gliche Aufwertung von Attributspalten im Satellite zu eigenen Hubs ist in jedem Fall mit erheblichem Aufwand verbunden.</Pgraph><Pgraph>Bei der Modellierung von Beziehungen war besonders zu beachten, welche Datenzusammenh&#228;nge zeitvariant und welche zeitinvariant sind. Links f&#252;r Teilnahmen an Befragungen sind beispielsweise zeitinvariant, da eine Teilnahme niemals r&#252;ckg&#228;ngig gemacht werden kann. Der Link f&#252;r Qualit&#228;tsindikatoren dagegen ist zeitvariant, weil ein Krankenhaus nicht zwangsl&#228;ufig immer alle erforderlichen Indikatoren an den G-BA meldet. Die Information &#252;ber die Existenz einer Beziehung zu gegebenem Zeitpunkt muss also im Satellite stehen. Da das Konzept des Links zeitinvariant ist, ist es erforderlich, dass es f&#252;r zeitabh&#228;ngige Zusammenh&#228;nge einen eigenen Satellite gibt, auch wenn der Link &#252;ber keine Attribute verf&#252;gt.</Pgraph><Pgraph>Die ausgepr&#228;gte Flexibilit&#228;t des DV-Modells erzwingt, dass klar abzugrenzen ist, welche Daten&#228;nderungen historisiert werden, da sonst die Gefahr von &#8222;Overengineering&#8220; besteht. Im Hinblick auf den Grad der Datenorganisation stellt sich die DV-Modellierung als solider Kompromiss zwischen EAV und Sternschema heraus. EAV ist ein vollends generisches Datenmodell mit nur rudiment&#228;rer Datenorganisation, da nur zwischen Entit&#228;ten, Attributen und Werten unterschieden wird <TextLink reference="15"></TextLink>, <TextLink reference="21"></TextLink>. Entsprechend hoch ist die Komplexit&#228;t der Abfragen. Das Sternschema auf der anderen Seite definiert inhaltlich festgelegte deskriptive Dimensionen und zu analysierende Faktenwerte, was die Daten fachlich und leicht zug&#228;nglich strukturiert und Abfragen f&#252;r die vorgegebenen Anwendungsf&#228;lle minimiert. Das DV-Modell bewegt sich zwischen diesen Polen und kann nach Bedarf generischer oder konkreter definiert werden <TextLink reference="23"></TextLink>. Dies illustriert unsere Wahl der Qualit&#228;tsindikatoren als Hubs. Denkbar w&#228;re stattdessen auch ein g&#228;nzlich generischer Hub &#8222;Krankenhausmerkmal&#8220; oder aber noch konkretere Hubs f&#252;r bestimmte Indikatoren gewesen. </Pgraph><Pgraph>Abbildung 2 <ImgLink imgNo="2" imgType="figure"/> illustriert, wie sich das implementierte Schema gegen&#252;ber einem vergleichbaren Sternschema verh&#228;lt. Das EAV-&#47;DV-Modell erm&#246;glicht insbesondere die Aggregation beliebiger Kennzahlen und erlaubt eine flexiblere Zusammenf&#252;hrung historischer Versionen von Datens&#228;tzen. Mit wachsender Datenmenge und steigenden Anfragen wird man zuk&#252;nftig Aussagen &#252;ber die Performanz im Echtbetrieb t&#228;tigen k&#246;nnen.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Fazit">
      <MainHeadline>Fazit</MainHeadline><Pgraph>Im vorliegenden Beitrag wurde ein kombiniertes EAV-&#47;DV-Modell f&#252;r die historisierte und flexible Integration von semantisch heterogenen Befragungsdaten entwickelt. Es liefert eine integrierte Datensicht auf Versorgungsdaten und historisiert vollst&#228;ndig Metadaten zu Merkmalen und ggf. Auspr&#228;gungen, wodurch Analysen auf frei zusammenstellbaren Teilmengen der Daten bestehen k&#246;nnen. Dar&#252;ber hinaus ist das Datenmodell beliebig um neue Entit&#228;ten und Beziehungen erweiterbar.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Anmerkungen">
      <MainHeadline>Anmerkungen</MainHeadline><SubHeadline>Interessenkonflikte</SubHeadline><Pgraph>Die Autoren erkl&#228;ren, dass sie keine Interessenkonflikte in Zusammenhang mit diesem Artikel haben.</Pgraph><SubHeadline>Danksagung</SubHeadline><Pgraph>Die Arbeiten werden in dem durch das Land Niedersachsen gef&#246;rderten Projekt &#8222;Das Lernende Gesundheitssystem in der Region Osnabr&#252;ck Emsland (ROSE)&#8220; (F&#246;rderkennzeichen ZN 3103) durchgef&#252;hrt.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Kuo MH</RefAuthor>
        <RefAuthor>Sahama T</RefAuthor>
        <RefAuthor>Kushniruk AW</RefAuthor>
        <RefAuthor>Borycki EM</RefAuthor>
        <RefAuthor>Grunwell D</RefAuthor>
        <RefTitle>Health big data analytics: current perspectives, challenges and potential solutions</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>Int J Big Data Intelligence</RefJournal>
        <RefPage>114-26</RefPage>
        <RefTotal>Kuo MH, Sahama T, Kushniruk AW, Borycki EM, Grunwell D. Health big data analytics: current perspectives, challenges and potential solutions. Int J Big Data Intelligence. 2014;1(1&#47;2):114-26. DOI: 10.1504&#47;IJBDI.2014.063835</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1504&#47;IJBDI.2014.063835</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Thye J</RefAuthor>
        <RefAuthor>Straede MC</RefAuthor>
        <RefAuthor>Liebe JD</RefAuthor>
        <RefAuthor>H&#252;bner U</RefAuthor>
        <RefTitle>IT-benchmarking of clinical workflows: concept, implementation, and evaluation</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>Stud Health Technol Inform</RefJournal>
        <RefPage>116-24</RefPage>
        <RefTotal>Thye J, Straede MC, Liebe JD, H&#252;bner U. IT-benchmarking of clinical workflows: concept, implementation, and evaluation. Stud Health Technol Inform. 2014;198:116-24. DOI: 10.3233&#47;978-1-61499-397-1-116</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3233&#47;978-1-61499-397-1-116</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>H&#252;bner U</RefAuthor>
        <RefAuthor>Liebe JD</RefAuthor>
        <RefAuthor>Straede MC</RefAuthor>
        <RefAuthor>Thye J</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2014</RefYear>
        <RefBookTitle>IT-Report Gesundheitswesen: Schwerpunkt IT-Unterst&#252;tzung klinischer Prozesse</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>H&#252;bner U, Liebe JD, Straede MC, Thye J. IT-Report Gesundheitswesen: Schwerpunkt IT-Unterst&#252;tzung klinischer Prozesse. Hannover: Nieders&#228;chsisches Ministerium f&#252;r Wirtschaft, Arbeit und Verkehr; 2014. (Schriftenreihe des Nieders&#228;chsischen Ministeriums f&#252;r Wirtschaft, Arbeit und Verkehr).</RefTotal>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Pommerening K</RefAuthor>
        <RefAuthor>Deserno TM</RefAuthor>
        <RefAuthor>Ingenerf J</RefAuthor>
        <RefAuthor>Lenz R</RefAuthor>
        <RefAuthor>Schm&#252;cker P</RefAuthor>
        <RefTitle>Der Impact der Medizinischen Informatik</RefTitle>
        <RefYear>2015</RefYear>
        <RefJournal>Informatik Spektrum</RefJournal>
        <RefPage>347-69</RefPage>
        <RefTotal>Pommerening K, Deserno TM, Ingenerf J, Lenz R, Schm&#252;cker P. Der Impact der Medizinischen Informatik. Informatik Spektrum. 2015;38(5):347-69. DOI: 10.1007&#47;s00287-014-0767-7</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;s00287-014-0767-7</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Lenz R</RefAuthor>
        <RefAuthor>Beyer M</RefAuthor>
        <RefAuthor>Kuhn KA</RefAuthor>
        <RefTitle>Semantic integration in healthcare networks</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Int J Med Inform</RefJournal>
        <RefPage>201-7</RefPage>
        <RefTotal>Lenz R, Beyer M, Kuhn KA. Semantic integration in healthcare networks. Int J Med Inform. 2007 Feb-Mar;76(2-3):201-7. DOI: 10.1016&#47;j.ijmedinf.2006.05.008</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1016&#47;j.ijmedinf.2006.05.008</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>L&#228;nsisalmi H</RefAuthor>
        <RefAuthor>Kivim&#228;ki M</RefAuthor>
        <RefAuthor>Aalto P</RefAuthor>
        <RefAuthor>Ruoranen R</RefAuthor>
        <RefTitle>Innovation in healthcare: a systematic review of recent research</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Nurs Sci Q</RefJournal>
        <RefPage>66-72; discussion 65</RefPage>
        <RefTotal>L&#228;nsisalmi H, Kivim&#228;ki M, Aalto P, Ruoranen R. Innovation in healthcare: a systematic review of recent research. Nurs Sci Q. 2006 Jan;19(1):66-72; discussion 65. DOI: 10.1177&#47;0894318405284129</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1177&#47;0894318405284129</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Farr&#233; N</RefAuthor>
        <RefAuthor>Vela E</RefAuthor>
        <RefAuthor>Cl&#232;ries M</RefAuthor>
        <RefAuthor>Bustins M</RefAuthor>
        <RefAuthor>Cainzos-Achirica M</RefAuthor>
        <RefAuthor>Enjuanes C</RefAuthor>
        <RefAuthor>Moliner P</RefAuthor>
        <RefAuthor>Ruiz S</RefAuthor>
        <RefAuthor>Verd&#250;-Rotellar JM</RefAuthor>
        <RefAuthor>Com&#237;n-Colet J</RefAuthor>
        <RefTitle>Real world heart failure epidemiology and outcome: A population-based analysis of 88,195 patients</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>PLoS One</RefJournal>
        <RefPage>e0172745</RefPage>
        <RefTotal>Farr&#233; N, Vela E, Cl&#232;ries M, Bustins M, Cainzos-Achirica M, Enjuanes C, Moliner P, Ruiz S, Verd&#250;-Rotellar JM, Com&#237;n-Colet J. Real world heart failure epidemiology and outcome: A population-based analysis of 88,195 patients. PLoS One. 2017 Feb 24;12(2):e0172745. DOI: 10.1371&#47;journal.pone.0172745</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1371&#47;journal.pone.0172745</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Sacker A</RefAuthor>
        <RefAuthor>Ross A</RefAuthor>
        <RefAuthor>MacLeod CA</RefAuthor>
        <RefAuthor>Netuveli G</RefAuthor>
        <RefAuthor>Windle G</RefAuthor>
        <RefTitle>Health and social exclusion in older age: evidence from understanding society, the UK household longitudinal study</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>J Epidemiol Community Health</RefJournal>
        <RefPage>681-90</RefPage>
        <RefTotal>Sacker A, Ross A, MacLeod CA, Netuveli G, Windle G. Health and social exclusion in older age: evidence from understanding society, the UK household longitudinal study. J Epidemiol Community Health. 2017 Feb;71:681-90. DOI: 10.1136&#47;jech-2016-208037</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1136&#47;jech-2016-208037</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Lenz R</RefAuthor>
        <RefAuthor>Beyer M</RefAuthor>
        <RefAuthor>Meiler C</RefAuthor>
        <RefAuthor>Jablonski S</RefAuthor>
        <RefAuthor>Kuhn KA</RefAuthor>
        <RefTitle>Informationsintegration in Gesundheitsversorgungsnetzen &#8211; Herausforderungen an die Informatik</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Informatik Spektrum</RefJournal>
        <RefPage>105-19</RefPage>
        <RefTotal>Lenz R, Beyer M, Meiler C, Jablonski S, Kuhn KA. Informationsintegration in Gesundheitsversorgungsnetzen &#8211; Herausforderungen an die Informatik. Informatik Spektrum. 2005;28(2):105-19. DOI: 10.1007&#47;s00287-005-0467-4</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;s00287-005-0467-4</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Abbott MR</RefAuthor>
        <RefTitle>A new path for science&#63;</RefTitle>
        <RefYear>2009</RefYear>
        <RefBookTitle>The fourth paradigm: data-intensive scientific discovery</RefBookTitle>
        <RefPage>111-6</RefPage>
        <RefTotal>Abbott MR. A new path for science&#63; In: Hey T, Tansley S, Tolle K, editors. The fourth paradigm: data-intensive scientific discovery. Redmond, WA: Microsoft Research; 2009. p. 111-6.</RefTotal>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Patel NV</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2003</RefYear>
        <RefBookTitle>Adaptive evolutionary information systems</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Patel NV, editor. Adaptive evolutionary information systems. Hershey, PA: Idea Group (IGI); 2003. DOI: 10.4018&#47;978-1-59140-034-9</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.4018&#47;978-1-59140-034-9</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>H&#252;bner U</RefAuthor>
        <RefAuthor>Babitsch B</RefAuthor>
        <RefAuthor>Kortekamp S</RefAuthor>
        <RefAuthor>Egbert N</RefAuthor>
        <RefAuthor>Braun von Reinersdorff A</RefAuthor>
        <RefTitle>ROSE &#8211; das lernende Gesundheitssystem in der Region Osnabr&#252;ck-Emsland</RefTitle>
        <RefYear>2016</RefYear>
        <RefJournal>International Journal of Health Professions</RefJournal>
        <RefPage>14-20</RefPage>
        <RefTotal>H&#252;bner U, Babitsch B, Kortekamp S, Egbert N, Braun von Reinersdorff A. ROSE &#8211; das lernende Gesundheitssystem in der Region Osnabr&#252;ck-Emsland &#91;ROSE &#8211; the learning health care system in the Osnabr&#252;ck-Emsland&#93;. International Journal of Health Professions. 2016;3(1):14-20. DOI: 10.1515&#47;ijhp-2016-0006</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1515&#47;ijhp-2016-0006</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Anonym</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2014</RefYear>
        <RefBookTitle>Regelungen des Gemeinsamen Bundesausschusses gem&#228;&#223; &#167; 137 Abs. 3 Satz 1 Nr. 4 SGB V &#252;ber Inhalt, Umfang und Datenformat eines strukturierten Qualit&#228;tsberichts f&#252;r nach &#167; 108 SGB V zugelassene Krankenh&#228;user (Regelungen zum Qualit&#228;tsbericht der Krankenh&#228;user, Qb-R)</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Regelungen des Gemeinsamen Bundesausschusses gem&#228;&#223; &#167; 137 Abs. 3 Satz 1 Nr. 4 SGB V &#252;ber Inhalt, Umfang und Datenformat eines strukturierten Qualit&#228;tsberichts f&#252;r nach &#167; 108 SGB V zugelassene Krankenh&#228;user (Regelungen zum Qualit&#228;tsbericht der Krankenh&#228;user, Qb-R). Stand: 19. Juni 2014. Available from: http:&#47;&#47;www.g-ba.de&#47;downloads&#47;62-492-906&#47;Qb-R&#92;&#95;2014-06-19.pdf</RefTotal>
        <RefLink>http:&#47;&#47;www.g-ba.de&#47;downloads&#47;62-492-906&#47;Qb-R&#92;&#95;2014-06-19.pdf</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Deutsche Krankenhausgesellschaft</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2010</RefYear>
        <RefBookTitle>Deutsches Krankenhausverzeichnis</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Deutsche Krankenhausgesellschaft. Deutsches Krankenhausverzeichnis. 2010. Available from: http:&#47;&#47;www.deutsches-krankenhaus-verzeichnis.de</RefTotal>
        <RefLink>http:&#47;&#47;www.deutsches-krankenhaus-verzeichnis.de</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>L&#246;per D</RefAuthor>
        <RefAuthor>Klettke M</RefAuthor>
        <RefAuthor>Bruder I</RefAuthor>
        <RefAuthor>Heuer A</RefAuthor>
        <RefTitle>Integrating healthcare-related information using the entity-attribute-value storage model</RefTitle>
        <RefYear>2012</RefYear>
        <RefBookTitle>Health Information Science. First International Conference, HIS 2012, Beijing, China, April 8-10, 2012. Proceedings</RefBookTitle>
        <RefPage>13-24</RefPage>
        <RefTotal>L&#246;per D, Klettke M, Bruder I, Heuer A. Integrating healthcare-related information using the entity-attribute-value storage model. In: He J, Liu X, Krupinski EA, Xu G, editors. Health Information Science. First International Conference, HIS 2012, Beijing, China, April 8-10, 2012. Proceedings. Berlin: Springer; 2012. (Lecture Notes in Computer Science; 7231). p. 13-24. DOI: 10.1007&#47;978-3-642-29361-0&#95;4</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;978-3-642-29361-0&#95;4</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Inmon WH</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2005</RefYear>
        <RefBookTitle>Building the data warehouse</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Inmon WH. Building the data warehouse. 4th ed. Indianapolis, IN: Wiley; 2005.</RefTotal>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Khan SI</RefAuthor>
        <RefAuthor>Hoque ASML</RefAuthor>
        <RefTitle>Towards development of health data warehouse: Bangladesh perspective</RefTitle>
        <RefYear>2015</RefYear>
        <RefBookTitle>2015 International Conference on Electrical Engineering and Information Communication Technology (ICEEICT); 21-23 May 2015; Dhaka, Bangladesh</RefBookTitle>
        <RefPage>1-6</RefPage>
        <RefTotal>Khan SI, Hoque ASML. Towards development of health data warehouse: Bangladesh perspective. In: 2015 International Conference on Electrical Engineering and Information Communication Technology (ICEEICT); 21-23 May 2015; Dhaka, Bangladesh. IEEE; 2015. p. 1-6. DOI: 10.1109&#47;iceeict.2015.7307514</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1109&#47;iceeict.2015.7307514</RefLink>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Turley CB</RefAuthor>
        <RefAuthor>Obeid J</RefAuthor>
        <RefAuthor>Larsen R</RefAuthor>
        <RefAuthor>Fryar KM</RefAuthor>
        <RefAuthor>Lenert L</RefAuthor>
        <RefAuthor>Bjorn A</RefAuthor>
        <RefAuthor>Lyons G</RefAuthor>
        <RefAuthor>Moskowitz J</RefAuthor>
        <RefAuthor>Sanderson I</RefAuthor>
        <RefTitle>Leveraging a Statewide Clinical Data Warehouse to Expand Boundaries of the Learning Health System</RefTitle>
        <RefYear>2016</RefYear>
        <RefJournal>EGEMS (Wash DC)</RefJournal>
        <RefPage>1245</RefPage>
        <RefTotal>Turley CB, Obeid J, Larsen R, Fryar KM, Lenert L, Bjorn A, Lyons G, Moskowitz J, Sanderson I. Leveraging a Statewide Clinical Data Warehouse to Expand Boundaries of the Learning Health System. EGEMS (Wash DC). 2016 Dec 6;4(1):1245. DOI: 10.13063&#47;2327-9214.1245</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.13063&#47;2327-9214.1245</RefLink>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Bauer A</RefAuthor>
        <RefAuthor>G&#252;nzel H</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2013</RefYear>
        <RefBookTitle>Data-Warehouse-Systeme: Architektur, Entwicklung, Anwendung</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Bauer A, G&#252;nzel H, editors. Data-Warehouse-Systeme: Architektur, Entwicklung, Anwendung. 4th ed. Heidelberg: dpunkt-Verlag; 2013.</RefTotal>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Jovanovic V</RefAuthor>
        <RefAuthor>Subotic D</RefAuthor>
        <RefAuthor>Mrdalj S</RefAuthor>
        <RefTitle>Data modeling styles in data warehousing</RefTitle>
        <RefYear>2014</RefYear>
        <RefBookTitle>2014 37th International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO); 26-30 May 2014; Opatija, Croatia</RefBookTitle>
        <RefPage>1458-63</RefPage>
        <RefTotal>Jovanovic V, Subotic D, Mrdalj S. Data modeling styles in data warehousing. In: 2014 37th International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO); 26-30 May 2014; Opatija, Croatia. IEEE; 2014. p. 1458-63. DOI: 10.1109&#47;mipro.2014.6859796</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1109&#47;mipro.2014.6859796</RefLink>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Dinu V</RefAuthor>
        <RefAuthor>Nadkarni P</RefAuthor>
        <RefTitle>Guidelines for the effective use of entity-attribute-value modeling for biomedical databases</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Int J Med Inform</RefJournal>
        <RefPage>769-79</RefPage>
        <RefTotal>Dinu V, Nadkarni P. Guidelines for the effective use of entity-attribute-value modeling for biomedical databases. Int J Med Inform. 2007 Nov-Dec;76(11-12):769-79. DOI: 10.1016&#47;j.ijmedinf.2006.09.023</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1016&#47;j.ijmedinf.2006.09.023</RefLink>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Kimball R</RefAuthor>
        <RefAuthor>Ross M</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2013</RefYear>
        <RefBookTitle>The data warehouse toolkit: the definitive guide to dimensional modeling</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Kimball R, Ross M. The data warehouse toolkit: the definitive guide to dimensional modeling. 3rd ed. Indianapolis, IN: Wiley; 2013.</RefTotal>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Gluchowski P</RefAuthor>
        <RefAuthor>Chamoni P</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2016</RefYear>
        <RefBookTitle>Analytische Informationssysteme Business Intelligence-Technologien und -Anwendungen</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Gluchowski P, Chamoni P, editors. Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen. 5th ed. Berlin, Heidelberg: Springer; 2016. DOI: 10.1007&#47;978-3-662-47763-2</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;978-3-662-47763-2</RefLink>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>Linstedt D</RefAuthor>
        <RefAuthor>Graziano K</RefAuthor>
        <RefAuthor>Hultgren H</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2009</RefYear>
        <RefBookTitle>The business of data vault modeling</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Linstedt D, Graziano K, Hultgren H. The business of data vault modeling. 2nd ed. Lulu.com; 2009.</RefTotal>
      </Reference>
      <Reference refNo="25">
        <RefAuthor>Bojicic I</RefAuthor>
        <RefAuthor>Marjanovic Z</RefAuthor>
        <RefAuthor>Turajlic N</RefAuthor>
        <RefAuthor>Petrovic M</RefAuthor>
        <RefAuthor>Vuckovic M</RefAuthor>
        <RefAuthor>Jovanovic V</RefAuthor>
        <RefTitle>A comparative analysis of data warehouse data models</RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>2016 6th International Conference on Computers Communications and Control (ICCCC); 10-14 May 2016; Oradea, Romania</RefBookTitle>
        <RefPage>151-9</RefPage>
        <RefTotal>Bojicic I, Marjanovic Z, Turajlic N, Petrovic M, Vuckovic M, Jovanovic V. A comparative analysis of data warehouse data models. In: 2016 6th International Conference on Computers Communications and Control (ICCCC); 10-14 May 2016; Oradea, Romania. IEEE; 2016. p. 151-9. DOI: 10.1109&#47;icccc.2016.7496754</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1109&#47;icccc.2016.7496754</RefLink>
      </Reference>
      <Reference refNo="26">
        <RefAuthor>Nadkarni PM</RefAuthor>
        <RefAuthor>Marenco L</RefAuthor>
        <RefAuthor>Chen R</RefAuthor>
        <RefAuthor>Skoufos E</RefAuthor>
        <RefAuthor>Shepherd G</RefAuthor>
        <RefAuthor>Miller P</RefAuthor>
        <RefTitle>Organization of heterogeneous scientific data using the EAV&#47;CR representation</RefTitle>
        <RefYear>1999</RefYear>
        <RefJournal>J Am Med Inform Assoc</RefJournal>
        <RefPage>478-93</RefPage>
        <RefTotal>Nadkarni PM, Marenco L, Chen R, Skoufos E, Shepherd G, Miller P. Organization of heterogeneous scientific data using the EAV&#47;CR representation. J Am Med Inform Assoc. 1999 Nov-Dec;6(6):478-93. DOI: &#47;10.1136&#47;jamia.1999.0060478</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;&#47;10.1136&#47;jamia.1999.0060478</RefLink>
      </Reference>
      <Reference refNo="27">
        <RefAuthor>Nadkarni PM</RefAuthor>
        <RefAuthor>Brandt C</RefAuthor>
        <RefTitle>Data extraction and ad hoc query of an entity-attribute-value database</RefTitle>
        <RefYear>1998</RefYear>
        <RefJournal>J Am Med Inform Assoc</RefJournal>
        <RefPage>511-27</RefPage>
        <RefTotal>Nadkarni PM, Brandt C. Data extraction and ad hoc query of an entity-attribute-value database. J Am Med Inform Assoc. 1998 Nov-Dec;5(6):511-27. DOI: 10.1136&#47;jamia.1998.0050511</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1136&#47;jamia.1998.0050511</RefLink>
      </Reference>
      <Reference refNo="28">
        <RefAuthor>Yamamoto K</RefAuthor>
        <RefAuthor>Sumi E</RefAuthor>
        <RefAuthor>Yamazaki T</RefAuthor>
        <RefAuthor>Asai K</RefAuthor>
        <RefAuthor>Yamori M</RefAuthor>
        <RefAuthor>Teramukai S</RefAuthor>
        <RefAuthor>Bessho K</RefAuthor>
        <RefAuthor>Yokode M</RefAuthor>
        <RefAuthor>Fukushima M</RefAuthor>
        <RefTitle>A pragmatic method for electronic medical record-based observational studies: developing an electronic medical records retrieval system for clinical research</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>BMJ Open</RefJournal>
        <RefArticleNo>e001622</RefArticleNo>
        <RefTotal>Yamamoto K, Sumi E, Yamazaki T, Asai K, Yamori M, Teramukai S, Bessho K, Yokode M, Fukushima M. A pragmatic method for electronic medical record-based observational studies: developing an electronic medical records retrieval system for clinical research. BMJ Open. 2012 Oct 31;2(6). pii: e001622. DOI: 10.1136&#47;bmjopen-2012-001622</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1136&#47;bmjopen-2012-001622</RefLink>
      </Reference>
      <Reference refNo="29">
        <RefAuthor>Wade TD</RefAuthor>
        <RefAuthor>Hum RC</RefAuthor>
        <RefAuthor>Murphy JR</RefAuthor>
        <RefTitle>A Dimensional Bus model for integrating clinical and research data</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>J Am Med Inform Assoc</RefJournal>
        <RefPage>i96-102</RefPage>
        <RefTotal>Wade TD, Hum RC, Murphy JR. A Dimensional Bus model for integrating clinical and research data. J Am Med Inform Assoc. 2011 Dec;18 Suppl 1:i96-102. DOI: 10.1136&#47;amiajnl-2011-000339</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1136&#47;amiajnl-2011-000339</RefLink>
      </Reference>
      <Reference refNo="30">
        <RefAuthor>Murphy SN</RefAuthor>
        <RefAuthor>Weber G</RefAuthor>
        <RefAuthor>Mendis M</RefAuthor>
        <RefAuthor>Gainer V</RefAuthor>
        <RefAuthor>Chueh HC</RefAuthor>
        <RefAuthor>Churchill S</RefAuthor>
        <RefAuthor>Kohane I</RefAuthor>
        <RefTitle>Serving the enterprise and beyond with informatics for integrating biology and the bedside (i2b2)</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>J Am Med Inform Assoc</RefJournal>
        <RefPage>124-30</RefPage>
        <RefTotal>Murphy SN, Weber G, Mendis M, Gainer V, Chueh HC, Churchill S, Kohane I. Serving the enterprise and beyond with informatics for integrating biology and the bedside (i2b2). J Am Med Inform Assoc. 2010 Mar-Apr;17(2):124-30. DOI: 10.1136&#47;jamia.2009.000893</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1136&#47;jamia.2009.000893</RefLink>
      </Reference>
      <Reference refNo="31">
        <RefAuthor>Linstedt D</RefAuthor>
        <RefAuthor>Olschimke M</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2015</RefYear>
        <RefBookTitle>Building a scalable data warehouse with Data Vault 2.0</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Linstedt D, Olschimke M. Building a scalable data warehouse with Data Vault 2.0. 1st ed. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc.; 2015.</RefTotal>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <Figure format="png" height="703" width="1051">
          <MediaNo>1</MediaNo>
          <MediaID>1</MediaID>
          <Caption><Pgraph><Mark1>Abbildung 1: Der Ausschnitt des Gesamt-Datenmodells, der die Daten f&#252;r Qualit&#228;tsindikatoren umfasst. Die gezeigten Hubs und Links sind mit weiteren nicht abgebildeten Hubs und Links verkn&#252;pft, die weitere Daten der Qualit&#228;tsberichte und aus anderen Quellen (z.B. Befragungsdaten) enthalten.</Mark1></Pgraph></Caption>
        </Figure>
        <Figure format="png" height="583" width="1249">
          <MediaNo>2</MediaNo>
          <MediaID>2</MediaID>
          <Caption><Pgraph><Mark1>Abbildung 2: Vergleich von SQL-Abfragen gegen das implementierte DV-Modell und gegen ein vergleichbares Sternschema</Mark1></Pgraph></Caption>
        </Figure>
        <NoOfPictures>2</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <Attachment>
          <MediaNo>1</MediaNo>
          <MediaID filename="mibe000170.a1.png" mimeType="image/png" origFilename="supplement-complete-data-model.png" size="297201" url="">1</MediaID>
          <AttachmentTitle>Gesamtes Datenmodell</AttachmentTitle>
        </Attachment>
        <NoOfAttachments>1</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>