<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>mibe000258</Identifier>
    <IdentifierDoi>10.3205/mibe000258</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-mibe0002583</IdentifierUrn>
    <ArticleType>&#220;bersichtsarbeit</ArticleType>
    <TitleGroup>
      <Title language="de">Alternative Ans&#228;tze f&#252;r Confounder-Adjustierung durch Gewichtung auf der Grundlage des PropensityScores</Title>
      <TitleTranslated language="en">Alternative approaches for confounding adjustment using weighting based on the propensity score</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Basic</Lastname>
          <LastnameHeading>Basic</LastnameHeading>
          <Firstname>Edin</Firstname>
          <Initials>E</Initials>
          <AcademicTitle>Dr.</AcademicTitle>
        </PersonNames>
        <Address>Takeda Pharma Vertrieb GmbH &#38; Co. KG, Potsdamer Str. 125, 10783 Berlin, Deutschland<Affiliation>Takeda Pharma Vertrieb GmbH &#38; Co. KG, Berlin, Deutschland</Affiliation></Address>
        <Email>Edin.Basic&#64;takeda.com</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <SectionHeading language="de">Propensity Scores</SectionHeading>
    </SubjectGroup>
    <DatePublishedList>
      
    <DatePublished>20240105</DatePublished></DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>1860-9171</ISSN>
        <Volume>20</Volume>
        <JournalTitle>GMS Medizinische Informatik, Biometrie und Epidemiologie</JournalTitle>
        <JournalTitleAbbr>GMS Med Inform Biom Epidemiol</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>02</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph>Propensity-Score-Methoden (PSMs) wie Matching und Gewichtung sind zu einem Eckpfeiler der Sch&#228;tzung von Behandlungseffekten aus Beobachtungsdaten geworden. PSMs erfordern die Wahl eines interessierenden Behandlungseffekts unter Ber&#252;cksichtigung einer bestimmten Zielpopulation oder Subpopulation. Die am h&#228;ufigsten verwendeten Behandlungseffekte in Beobachtungsstudien sind der durchschnittliche Behandlungseffekt (average treatment effect (ATE)) und der durchschnittliche Behandlungseffekt f&#252;r die Gruppe der Personen, die die Behandlung erhalten haben (average treatment effect among the treated population (ATT)). W&#228;hrend der traditionelle Matching-Ansatz in der Regel Beobachtungen, die nicht gematcht werden k&#246;nnen, ausschlie&#223;t und daher haupts&#228;chlich f&#252;r die Sch&#228;tzung des ATT verwendet wird, verwendet der Gewichtungsansatz in den meisten F&#228;llen alle Beobachtungen und kann sowohl f&#252;r die Sch&#228;tzung des ATE als auch des ATT verwendet werden. Ein Problem bei der Verwendung des Gewichtungsansatzes ist das Auftreten von gro&#223;en Gewichten, die die Ergebnisse unverh&#228;ltnism&#228;&#223;ig stark beeinflussen und zu Sch&#228;tzungen mit hoher Varianz f&#252;hren k&#246;nnen. In letzter Zeit wurden jedoch mehrere neuere Ans&#228;tze vorgeschlagen, darunter Matching- und Overlap-Gewichte, um diese Einschr&#228;nkungen zu &#252;berwinden. Allerdings kann dies eine erschwerte Interpretation der Ergebnisse zur Folge haben, da die Population, &#252;ber die eine Aussage getroffen werden soll, von der Propensity-Score-Sch&#228;tzung selbst abh&#228;ngt.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph>Propensity score methods (PSMs) such as matching and weighting have become a mainstay for the estimation of treatment effects from observational data. PSMs require the choice of a treatment effect of interest given a specific target population or subpopulation. The most commonly used treatment effects in observational studies are the average treatment effect (ATE) and the average treatment effect among the treated population (ATT). While the traditional matching approach usually discards observations that cannot be matched and is therefore mainly used for estimation of the ATT, the weighting approach utilizes all observations in most cases and can be used for estimation of both, the ATE and ATT. One concern when using the weighting approach is the occurrence of large weights which may disproportionately influence the results and yield estimates with high variance. Recently several newer approaches, including matching weights and overlap weights have been proposed to overcome these limitations. However, this may complicate the interpretation of the results as the population to be inferred depends on the PS estimate itself.</Pgraph></Abstract>
    <TextBlock linked="yes" name="Einleitung">
      <MainHeadline>Einleitung</MainHeadline><Pgraph>Randomisierte kontrollierte Studien (RCT) gelten in der klinischen Forschung als der Goldstandard f&#252;r die &#220;berpr&#252;fung der Wirksamkeit und Sicherheit von neuen Interventionen oder Behandlungen. Sie spielen auch eine entscheidende Rolle f&#252;r die Bewertung von Gesundheitstechnologien (Health Technology Assessment, HTA). Der Grund hierf&#252;r liegt in der Tatsache, dass erwartungsge<TextGroup><PlainText>m</PlainText></TextGroup>&#228;&#223; die Randomisierung die Vergleichbarkeit der zu vergleichenden Gruppen in Bezug auf die bekannten als auch unbekannten Patientencharakteristika gew&#228;hrleistet. Seit der Verabschiedung des Gesetzes f&#252;r mehr Sicherheit in der Arzneimittelversorgung (GSAV) im Jahre 2020 k&#246;nnen allerdings in Deutschland unter gewissen Voraussetzungen auch versorgungsnahe Daten (Real World Data (RWD)) f&#252;r die Nutzenbewertung herangezogen werden. Die Verwendung von RWD f&#252;r die Nutzenbewertung ist jedoch mit einigen methodischen Herausforderungen verbunden. Beispielsweise kann aufgrund der fehlenden Randomisierung nicht gew&#228;hrleistet werden, dass keine systematischen Unterschiede zwischen den zu vergleichenden Gruppen bestehen. Bei systematischer Ungleichheit w&#252;rde ein direkter Vergleich der Outcomes zwischen den Behandlungsgruppen zu einer verzerrten Sch&#228;tzung des Behandlungseffekts f&#252;hren.  Propensity-Score-Methoden (PSM) wie Matching und Gewichtung sind zu einem Eckpfeiler der Sch&#228;tzung von Behandlungseffekten aus RWD geworden. In diesem Aufsatz beschreiben wir die Implementierung der Propensity-Score-Gewichtungsans&#228;tze zusammen mit den grundlegenden Eigenschaften der einzelnen Ans&#228;tze. </Pgraph></TextBlock>
    <TextBlock linked="yes" name="Propensity Score und Definition von Behandlungseffekten">
      <MainHeadline>Propensity Score und Definition von Behandlungseffekten</MainHeadline><Pgraph>Der Propensity Score (PS)  ist ein Balancing-Score und wird definiert als die auf beobachteten Kovariaten beruhende bedingte Wahrscheinlichkeit, mit der ein Patient die interessierende Behandlung erh&#228;lt. Auf Basis des PS kann gleichzeitig eine gro&#223;e Anzahl an Kovariaten zwischen der Behandlungs- und der Kontrollpopulation angeglichen werden. Beim Matching wird die Ausbalanciertheit der Kovariaten dadurch sichergestellt, dass die zu vergleichenden Gruppen im Durchschnitt vergleichbare PS haben, d.h. der PS ist innerhalb der gematchten Paare ausbalanciert <TextLink reference="1"></TextLink>. Im Gegensatz dazu wird bei Gewichtungsmethoden auf Basis einer Funktion des PS eine Neu-Gewichtung der zu vergleichenden Gruppen vorgenommen, so dass in dieser gewichteten Population die Gruppenzugeh&#246;rigkeit unabh&#228;ngig von den Kovariaten ist, die f&#252;r die Sch&#228;tzung von PS verwendet wurden <TextLink reference="2"></TextLink>.  </Pgraph><Pgraph>Es lassen sich verschiedene Behandlungseffekte in Beobachtungsstudien definieren, je nachdem, wie die Behandlung definiert und welche Population betrachtet wird. Am h&#228;ufigsten werden der durchschnittliche Behandlungseffekt (average treatment effect (ATE)) und der durchschnittliche Behandlungseffekt f&#252;r die Gruppe der Personen, die die Behandlung erhalten haben (average treatment effect among the treated population (ATT)) verwendet. Der ATE beschreibt den Fall, dass alle Patienten der Population behandelt versus nicht oder alternativ behandelt w&#252;rden, w&#228;hrend der ATT den Fall beschreibt, dass alle tats&#228;chlich behandelten Patienten behandelt versus nicht oder alternativ behandelt w&#252;rden. Bei fehlender Heterogenit&#228;t des Behandlungseffekts durch Kovariaten (d.h. keine Interaktionseffekte zwischen Behandlung und Kovariaten) sind ATE und ATT identisch, wenn die Effekte additiv sind. Besteht jedoch Behandlungsheterogenit&#228;t, unterscheiden sich ATE und ATT <TextLink reference="3"></TextLink>. Beispielsweise d&#252;rfte der Effekt von  langwirksamen Beta-Agonisten (LABA) auf die Asthma-Mortalit&#228;t bei Patienten mit schwerem Asthma st&#228;rker ausgepr&#228;gt sein als bei Patienten mit nur leichtem Asthma. Bei Vorliegen einer solchen Behandlungsheterogenit&#228;t wird der ATT sehr unterschiedlich zum ATE ausfallen, auch wenn kein Unterschied in der Behandlung (LABA) besteht. </Pgraph><Pgraph>Es kann auch Situationen geben, in denen das Interesse in der Sch&#228;tzung von ATE in der Subgruppe der Patienten mit sehr &#228;hnlichen Charakteristika, sog. klinischem Equipoise besteht. Dar&#252;ber hinaus lassen sich noch zahlreiche andere Behandlungseffekte definieren. Welcher Behandlungseffekt schlie&#223;lich von Interesse ist, h&#228;ngt von der jeweiligen Fragestellung und den vorhandenen Daten ab.</Pgraph><Pgraph>Um verschiedene Behandlungseffekte in Beobachtungsstudien sch&#228;tzen zu k&#246;nnen, m&#252;ssen einige Annahmen getroffen werden. Die erste Annahme bezieht sich auf die bedingte Austauschbarkeit oder die Annahme, dass es kein unbeobachtetes Confounding gibt. Diese Annahme impliziert, dass nur die beobachtbaren Kovariaten einen Einfluss darauf haben, ob ein Patient behandelt wurde oder nicht. Dar&#252;ber hinaus ist es n&#246;tig, Collider und Mediatoren (und deren Nachfahren) aus der Analyse auszuschlie&#223;en. Hierzu kann das Pearl&#8217;s Back-Door-K<TextGroup><PlainText>rit</PlainText></TextGroup>erium verwendet werden, welches die grafische Repr&#228;sentation kausaler Beziehungsgeflechte erm&#246;glicht <TextLink reference="4"></TextLink>. Die zweite Annahme ist als Konsistenz-Annahme bekannt und besagt, dass keine Zusammenh&#228;nge zwischen den verschiedenen Patienten und auch keine allgemeinen Gleichgewichtseffekte existieren, da das Outcome eines bestimmten Patienten nicht vom Behandlungsstatus anderer Patienten abh&#228;ngt. Eine weitere Annahme ist die Overlap-Annahme, welche besagt, dass Patienten mit denselben Kovariatenwerten (sowohl alle Werte einzeln als auch in jeder vorkommenden Kombination der Werte) eine positive Wahrscheinlichkeit haben, sowohl behandelt als auch nicht behandelt zu werden. Eine detaillierte Beschreibung dieser Annahmen findet sich bei Hernan und Robins (<TextLink reference="5"></TextLink>, S. 25-36).</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Korrekte Spezifikation des PS-Modells">
      <MainHeadline>Korrekte Spezifikation des PS-Modells</MainHeadline><Pgraph>In der Praxis ist der PS unbekannt und muss daher anhand der verf&#252;gbaren Daten gesch&#228;tzt werden. Bei der Sch&#228;tzung des PS muss ein statistisches Modell festgelegt sowie eine Auswahl der beobachteten Kovariaten, die in das Modell aufgenommen  werden, getroffen werden. Die logistische Regression ist das am h&#228;ufigsten verwendete Modell zur Sch&#228;tzung des PS. Es k&#246;nnen jedoch auch flexiblere Modelle wie Boosting, Random <TextGroup><PlainText>Forests</PlainText></TextGroup> oder verallgemeinerte additive Modelle f&#252;r die PS-Sch&#228;tzung verwendet werden <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>. Die Sch&#228;tzung des ATE und ATT beruht auf der Annahme der bedingten Unabh&#228;ngigkeit, die voraussetzt, dass das Outcome unabh&#228;ngig von der Behandlung ist, gegeben der PS. Die Sch&#228;tzung des PS erfordert daher die Auswahl von Kovariaten, die diese Bedingung erf&#252;llen. Daher m&#252;ssen alle beobachteten Confounder, d.h. Kovariaten, die gleichzeitig die Behandlung und das Outcome beeinflussen, in das PS-Modell aufgenommen werden. Andererseits gibt es keinen einheitlichen Konsens &#252;ber die Ber&#252;cksichtigung von Kovariaten, die das Outcome, aber nicht die Behandlung beeinflussen, oder von Kovariaten, die nur die Behandlung beeinflussen. Beispielsweise zeigen Brookhart et al., dass die Ber&#252;cksichtigung von Kovariaten, die mit dem Outcome, aber nicht mit der Behandlung zusammenh&#228;ngen, die Varianz des gesch&#228;tzten Behandlungseffekts verringern k&#246;nnen, ohne die Verzerrung zu erh&#246;hen <TextLink reference="8"></TextLink>. Im Gegensatz dazu kann die Ber&#252;cksichtigung von Kovariaten, die mit der Behandlung, aber nicht mit dem Outcome zusammenh&#228;ngen, die Varianz des gesch&#228;tzten Behandlungseffekts erh&#246;hen und bei Vorliegen von ungemessenem Confounding die Verzerrung verst&#228;rken <TextLink reference="9"></TextLink>, <TextLink reference="10"></TextLink>. In der Praxis kann die Unterscheidung zwischen den obigen Variablen eine Herausforderung darstellen. Eine Abhilfe hierzu bieten die sog. kausalen gerichteten azyklischen Graphen (DAG). Sie sind besonders hilfreich bei der Abgrenzung und dem Verst&#228;ndnis von St&#246;rgr&#246;&#223;en und potenziellen Ursachen f&#252;r Verzerrungen in Behandlungs-Outcome-Beziehungen <TextLink reference="11"></TextLink>. Weiterhin schlagen Schneeweiss et al. vor, das hochdimensionale PS-Modell zu verwenden, um das Risiko von ungemessenem Confounding weiter zu verringern <TextLink reference="12"></TextLink>. Der hochdimensionale PS bezieht sich auf die Verwendung einer gro&#223;en Anzahl von Kovariaten, die als Proxies f&#252;r unbeobachtete Confounder dienen. Es sollte jedoch bedacht werden, dass die besten Pr&#228;diktionsmodelle nicht unbedingt hilfreich sind, da dies zu einer Verletzung der Overlap-Bedingung f&#252;hren k&#246;nnte. Au&#223;erdem ist bei seltenen Krankheiten mit einer geringen Anzahl behandelter Patienten die Anzahl der Kovariaten, die f&#252;r die PS-Sch&#228;tzung verwendet werden k&#246;nnen, ebenfalls begrenzt. Die aufgef&#252;hrten Punkte implizieren, dass kein allumfassendes Konzept verf&#252;gbar ist, sondern wissenschaftliches Verst&#228;ndnis, fr&#252;here empirische Erkenntnisse und die vorliegende Datenstruktur eine entscheidende Rolle bei der Auswahl der Variablen f&#252;r das PS-Modell spielen k&#246;nnen.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Evaluation der &#220;berlappung der Propensity-Score-Verteilung zwischen Behandlungs- und Referenzgruppe">
      <MainHeadline>Evaluation der &#220;berlappung der Propensity-Score-Verteilung zwischen Behandlungs- und Referenzgruppe</MainHeadline><Pgraph>Nach der Sch&#228;tzung des PS sollte die &#220;berlappung der Verteilungen der gesch&#228;tzten PS f&#252;r die Behandlungs- und die Kontrollgruppe grafisch untersucht werden. Hierzu gibt es drei m&#246;gliche Szenarien: </Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1.">Die PS-Verteilungen k&#246;nnen sich sowohl in Bezug auf den Wertebereich als auch auf die Dichte sehr gut &#252;berlappen, was bedeutet, dass beide Gruppen in Bezug auf die gew&#228;hlten Kovariaten-Verteilungen sehr &#228;hnlich sind. </ListItem><ListItem level="1" levelPosition="2" numString="2.">Es existiert kaum &#220;berlappung zwischen den PS-Verteilungen. </ListItem><ListItem level="1" levelPosition="3" numString="3.">Die PS-Verteilungen &#252;berschneiden sich bis zu einem gewissen Grad. </ListItem></OrderedList></Pgraph><Pgraph>Das erste Szenario, das im Rahmen einer randomisierten kontrollierten Studie zu erwarten ist, ist f&#252;r die meisten Beobachtungsstudien sehr unwahrscheinlich. Das zweite Szenario kann darauf hindeuten, dass zu viele Unterschiede zwischen den behandelten Personen und den Vergleichspersonen bestehen, um eine kausale Aussage treffen zu k&#246;nnen. Das dritte Szenario ist das in der Praxis am h&#228;ufigsten anzutreffende Szenario. In der praktischen Anwendung k&#246;nnen gesch&#228;tzte PS nahe 0 und nahe 1 ein Hinweis auf eine unzureichende &#220;berlappung bzw. auf die Verletzung der Overlap-Annahme sein.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="&#220;berlegungen bei der Auswahl einer Gewichtungsmethode">
      <MainHeadline>&#220;berlegungen bei der Auswahl einer Gewichtungsmethode</MainHeadline><Pgraph>Basierend auf der Wahl des interessierenden Behandlungseffekts existieren verschiedene Gewichtungsans&#228;tze, um die zu vergleichenden Behandlungsgruppen in Bezug auf die beobachteten Confounder anzugleichen.  </Pgraph><SubHeadline>Gewichtungsans&#228;tze zur Sch&#228;tzung von ATE</SubHeadline><Pgraph>Es existieren zwei Gewichtungsans&#228;tze, <Mark2>inverse probability treatment weighting</Mark2> (IPTW) und <Mark2>fine stratifcation weights</Mark2> <TextLink reference="13"></TextLink>, f&#252;r die Sch&#228;tzung von ATE in Beobachtungsstudien. Beiden Ans&#228;tzen ist gemeinsam, dass sie versuchen, die Verteilung der Kovariaten in der Behandlungs- und der Kontrollgruppe anzugleichen, so dass sie der Verteilung in der Gesamtstichprobe entsprechen.</Pgraph><SubHeadline2>Inverse probability treatment weighting (IPTW)</SubHeadline2><Pgraph>Bei diesem Ansatz entsprechen die Gewichte der inversen Wahrscheinlichkeit, die tats&#228;chliche Behandlung erhalten zu haben. Demzufolge erhalten Patienten aus der Behandlungsgruppe das Gewicht 1&#47;PS und die aus der Referenzgruppe das Gewicht 1&#47;(1&#8211;PS). Dies bedeutet, dass Patienten, die der Behandlungsgruppe zugeordnet wurden, obwohl sie nach ihren Charakteristika viel wahrscheinlicher der Kontrollgruppe h&#228;tten zugeordnet werden m&#252;ssen, ein hohes Gewicht bekommen. Auf der anderen Seite erhalten Patienten, die der erwarteten Behandlungsgruppe zugeordnet wurden, ein kleines Gewicht. </Pgraph><Pgraph>Aufgrund der direkten Verwendung des PS zur Berechnung der Gewichte k&#246;nnen extreme Gewichte vorkommen. Dies geschieht, wenn der gesch&#228;tzte PS nahe 0 oder 1 ist. In einem solchen Fall k&#246;nnen einzelne Patienten einen sehr hohen Einfluss auf die Sch&#228;tzung haben. Hierbei sollte zuerst &#252;berpr&#252;ft werden, ob diese Patienten &#252;berhaupt zur Zielpopulation geh&#246;ren oder stattdessen als Ausrei&#223;er betrachtet und aus der Stichprobe entfernt werden sollten. Dar&#252;ber hinaus k&#246;nnen extreme Gewichte entweder durch Stabilisierung, Trunkierung oder Trimming behandelt werden. Eine Gewicht-Stabilisierung kann erreicht werden, indem der Z&#228;hler &#8211; der bei den nicht stabilisierten Gewichten 1 ist &#8211; durch die marginale Behandlungswahrscheinlichket ersetzt wird <TextLink reference="14"></TextLink>. Als weitere Ma&#223;nahme k&#246;nnen extreme Gewichte auch durch Trunkierung behandelt werden <TextLink reference="15"></TextLink>. Hierzu werden besonders kleine PS (z.B. &#60;0.01 oder &#60;0.001) durch den Trunkierungswert ersetzt, um hohe Gewichte zu verhindern. Dies erzeugt eine verzerrte Sch&#228;tzung des Behandlungseffekts, kann aufgrund potentiell geringerer Varianz aber zu einem besseren mittleren quadratischen Fehler (MSE) f&#252;hren. Schlie&#223;lich besteht noch die M&#246;glichkeit, ein Trimming durchzuf&#252;hren, d.h. alle Beobachtungen mit einem PS unter dem unteren und &#252;ber dem oberen PS-Grenzwert auszuschlie&#223;en. Dabei existieren mehrere Methoden, um die Grenzwerte zu definieren: </Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1.">Bei der Common-Range-Methode wird als unterer Grenzwert der niedrigste PS bei den Behandelten und als oberer Grenzwert der h&#246;chste PS bei den Patienten aus der Kontrollgruppe genommen.</ListItem><ListItem level="1" levelPosition="2" numString="2.">Bei der St&#252;rmer-Methode entspricht der untere Grenzwert dem 5&#37;-Perzentil der PS-Verteilung der Behandelten und der obere Grenzwert dem 95&#37;-Perzentil der Nicht-Behandelten.</ListItem><ListItem level="1" levelPosition="3" numString="3.">Die Walker-Methode geht von einem unteren Grenzwert von 0.3 des sog. Pr&#228;ferenzwertes und einem oberen von 0.7 aus, wobei h&#246;here Werte eine h&#246;here Pr&#228;ferenz f&#252;r die Behandlung bei gemessenen Kovariaten widerspiegeln und der Logit des Pr&#228;ferenzwertes als der Logit des PS minus der Logit der Behandlungspr&#228;valenz definiert ist.</ListItem><ListItem level="1" levelPosition="4" numString="4.">Bei der Crump-Methode wird der untere Grenzwert auf 0.1 und der obere auf 0.9 festgelegt <TextLink reference="15"></TextLink>, <TextLink reference="16"></TextLink>, <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>. </ListItem></OrderedList></Pgraph><Pgraph>Hierbei ist zu beachten, dass bei Ausschluss von Beobachtungen generell die Gefahr von Selektionsbias besteht.</Pgraph><Pgraph>Nach der Berechnung der Gewichte werden f&#252;r die Sch&#228;tzung des Behandlungseffekts Patienten gem&#228;&#223; ihres Gewichts verwendet. Dabei wird entsprechend dem interessierenden Outcome ein gewichtetes statistisches Modell spezifiziert, z.B. eine gewichtete logistische Regression bei bin&#228;ren Outcomes bzw. ein gewichtetes Cox-Regressionsmodell bei Time to Event Outcomes. Hierbei ist zu beachten, dass durch die Gewichtung eine &#8222;Pseudopopulation&#8220; generiert wird, die &#8222;Replikationen&#8220; von Patienten enth&#228;lt, wodurch eine Korrelation innerhalb der Patienten induziert wird. Dieser Mangel an Unabh&#228;ngigkeit muss ber&#252;cksichtigt werden, um die Varianz korrekt zu sch&#228;tzen. Zus&#228;tzlich muss auch ber&#252;cksichtigt werden, dass die Gewichte eine Variation aufweisen, da sie auf dem gesch&#228;tzten PS basieren. Dies kann bei der Varianzsch&#228;tzung entweder durch die Verwendung eines robusten &#8222;Sandwich&#8220;-Varianzsch&#228;tzers oder durch Bootstrap-basierte Methoden ber&#252;cksichtigt werden <TextLink reference="14"></TextLink>.</Pgraph><SubHeadline2>Fine stratification weights</SubHeadline2><Pgraph>Bei diesem Ansatz werden die gesch&#228;tzten PS nicht zur Berechnung der Gewichte, sondern zur Bildung der sog. Feinschichten verwendet. Es gibt mehrere M&#246;glichkeiten, die Schichten auf Basis von PS zu bilden: </Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1.">Die PS-Verteilung der gesamten Kohorte wird verwendet. </ListItem><ListItem level="1" levelPosition="2" numString="2.">Die PS-Verteilung der kleineren der beiden zu vergleichenden Gruppen wird verwendet. </ListItem><ListItem level="1" levelPosition="3" numString="3.">Eine feste Breite der PS (z.B. 0&#8211;0.1 Schicht 1, &#62;0.1&#8211;0.2 Schicht 2, &#8230; &#62;0.9&#8211;1) wird verwendet. </ListItem></OrderedList></Pgraph><Pgraph>Bei einer niedrigen Behandlungspr&#228;valenz gew&#228;hrleistet die Bildung von Schichten auf Basis der PS-Verteilung der behandelten Patienten die Zuordnung aller Patienten zu den jeweiligen Schichten. Nach der Bildung von Schichten werden die Gewichte f&#252;r beide Gruppen in allen Schichten berechnet. Hierzu wird in einem ersten Schritt innerhalb der Schichten ein neuer, vereinfachter PS berechnet. Dieser neue PS ergibt sich aus der Anzahl der behandelten Patienten dividiert durch die Gesamtanzahl der Patienten in einer bestimmten Schicht. In einem zweiten Schritt wird der Kehrwert dieses neuen PS gebildet. Anschlie&#223;end wird dieser Kehrwert mit der marginalen Wahrscheinlichkeit der Gesamtstichprobe behandelt zu werden (Stabilisierungsfaktor bei dem IPTW-Ansatz) multipliziert. Analog hierzu werden die Gewichte f&#252;r nicht-behandelte Patienten gebildet. </Pgraph><Pgraph>Anschlie&#223;end erhalten innerhalb jeder Schicht alle behandelten bzw. nicht behandelten Patienten das gleiche Gewicht. Solange keine schwach besetzten Schichten vorkommen, sind  extreme Gewichte  bei diesem Ansatz unwahrscheinlich <TextLink reference="19"></TextLink>. Bez&#252;glich der Varianzsch&#228;tzung gelten hier die gleichen &#220;berlegungen wie bei IPTW. </Pgraph><SubHeadline>Gewichtungsans&#228;tze zur Sch&#228;tzung von ATT</SubHeadline><Pgraph><Mark2>Standardised mortality ratio weighting</Mark2> (SMRW) und <Mark2>fine stratification weights</Mark2> werden f&#252;r die Sch&#228;tzung von ATT in Beobachtungsstudien herangezogen. Beide Ans&#228;tze versuchen die Verteilung der Kovariaten in der Kontrollgruppe an die Kovariaten-Verteilung der Behandlungsgruppe anzugleichen. </Pgraph><SubHeadline2>Standardised mortality ratio weighting (SMRW)</SubHeadline2><Pgraph>Bei diesem Ansatz gehen die behandelten Patienten unver&#228;ndert in die Analyse ein, w&#228;hrend die nicht behandelten Patienten so umgewichtet werden, dass sie den Behandelten sehr &#228;hnlich sind. Hierf&#252;r wird den Patienten aus der Behandlungsgruppe das Gewicht 1 und denen aus der Kontrollgruppe das Gewicht PS&#47;(1&#8211;PS) zugewiesen. Trotz der Verwendung einer Art der Stabilisierung bei der Berechnung der Gewichte f&#252;r die Kontrollgruppe ist das Auftreten extremer Gewichte m&#246;glich. In einem solchen Fall kann Trunkierung oder Trimming verwendet werden. Bez&#252;glich der Varianzsch&#228;tzung gelten auch hier die gleichen &#220;berlegungen wie bei IPTW. </Pgraph><SubHeadline2>Fine stratification weights</SubHeadline2><Pgraph>&#196;hnlich wie bei den <Mark2>fine stratification weights</Mark2> f&#252;r die Sch&#228;tzung von ATE werden auch hier PS zur Bildung von Schichten verwendet. Allerdings erhalten hier alle behandelten Patienten das Gewicht 1, w&#228;hrend die Patienten aus der Kontrollgruppe ein Gewicht, das im Verh&#228;ltnis zur Verteilung der behandelten zu den nicht behandelten Patienten in der jeweiligen Schicht steht, bekommen. Durch diese Gewichtung wird eine &#8222;Pseudopopulation&#8220; generiert, in der die Kovariaten-Verteilung zumindest in jeder Schicht zwischen der Behandlungs- und Kontrollgruppe ann&#228;hernd &#252;bereinstimmt. Bez&#252;glich der Varianzsch&#228;tzung gelten auch hier die gleichen &#220;berlegungen wie bei IPTW. </Pgraph><SubHeadline>Gewichtungsans&#228;tze zur Sch&#228;tzung von ATE in der Subgruppe der Patienten mit sehr &#228;hnlichen Charakteristika, sog. klinischem Equipoise</SubHeadline><Pgraph>Die n&#228;chsten beiden Gewichtungsans&#228;tze, Matching- und Overlap-Gewichte, haben ein variables Ziel der Inferenz, das stark von der &#220;berlappung der PS-Verteilungen der zu vergleichenden Gruppen abh&#228;ngt <TextLink reference="20"></TextLink>, <TextLink reference="21"></TextLink>. Vereinfacht gesagt wird mit den beiden Ans&#228;tzen der ATE in einer Subgruppe der Patienten mit einem gewissen klinischem Equipoise gesch&#228;tzt. Demzufolge versuchen beide Ans&#228;tze die Verteilung der Kovariaten in der Behandlungs- und der Kontrollgruppe so anzugleichen, dass sie der Verteilung der Kovariaten in der Teilmenge der Gesamtstichprobe entsprechen. In dieser haben Patienten aus beiden Gruppen relativ hohe Wahrscheinlichkeiten sowohl behandelt als auch nicht behandelt zu sein. </Pgraph><SubHeadline2>Matching-Gewichte</SubHeadline2><Pgraph>Bei diesem Ansatz entsprechen die Gewichte dem Verh&#228;ltnis der niedrigeren der beiden vorhergesagten Wahrscheinlichkeiten (PS bzw. 1&#8211;PS) zur vorhergesagten Wahrscheinlichkeit der tats&#228;chlich erhaltenen Behandlung. Es handelt sich um eine Modifikation der Gewichte aus dem IPTW Ansatz, indem der Z&#228;hler der IPTW-Gewichte durch das Minimum aus PS und 1&#8211;PS ersetzt wird. Dies bedeutet, dass alle behandelten Patienten mit einem gesch&#228;tzten PS&#60;0.5 unver&#228;ndert in die Analyse eingehen, w&#228;hrend Patienten aus der Kontrollgruppe mit dem gleichen PS ein Gewicht &#60;1 bekommen. F&#252;r Patienten mit einem gesch&#228;tzten PS&#62;0.5 ist es genau umgekehrt, d.h. hierbei werden alle behandelten Patienten heruntergewichtet, w&#228;hrend Patienten aus der Kontrollgruppe unver&#228;ndert in die Analyse eingehen. </Pgraph><Pgraph>Bei diesem Ansatz k&#246;nnen keine extremen Gewichte auftreten, da sie aufgrund des Designs immer zwischen 0 und 1 liegen. Das Ziel der Inferenz ist nahe am ATE in der Gesamtpopulation, wenn die zu vergleichenden Gruppen gleich gro&#223; sind und die PS-Verteilungen eine gute &#220;berlappung aufweisen. Im Falle ungleicher Gruppengr&#246;&#223;en und einer guten &#220;berlappung der PS-Verteilungen wird der ATT in der kleineren Gruppe gesch&#228;tzt. Bei einer begrenzten &#220;berlappung der PS-Verteilungen wird der Behandlungseffekt in einer Teilpopulation gesch&#228;tzt, die weder die Gruppe der behandelten Patienten noch die Gesamtpopulation repr&#228;sentiert. Bei der Varianzsch&#228;tzung sollten  robuste &#8222;Sandwich&#8220;-Varianzsch&#228;tzer oder Bootstrap-basierte Methoden verwendet werden, da dadurch eine eventuelle Fehlspezifikation des PS-Modells korrigiert werden kann <TextLink reference="20"></TextLink>, <TextLink reference="21"></TextLink>.</Pgraph><SubHeadline2>Overlap-Gewichte</SubHeadline2><Pgraph>Bei diesem Ansatz entsprechen die Gewichte der Wahrscheinlichkeit die entgegens&#228;tzliche Behandlung bekommen zu haben, d.h. Patienten aus der Behandlungsgruppe bekommen das Gewicht 1&#8211;PS und Patienten aus der Referenzgruppe das Gewicht PS. Die Verwendung dieser Art von Gewichten bedeutet, dass alle Patienten heruntergewichtet werden. Wie stark Patienten heruntergewichtet werden, h&#228;ngt von ihrem gesch&#228;tzten PS ab. So werden bei einem hohen gesch&#228;tzten PS Patienten aus der Interventionsgruppe deutlich st&#228;rker heruntergewichtet als Patienten aus der Kontrollgruppe. Im Gegensatz dazu werden bei einem niedrigen gesch&#228;tzten PS Patienten aus der Kontrollgruppe st&#228;rker heruntergewichtet, w&#228;hrend Patienten aus beiden Gruppen, deren gesch&#228;tzter PS nahe 0.5 liegt, gleich stark heruntergewichtet werden. Dies bedeutet, dass Patienten mit einem gesch&#228;tzten PS von 0.5 den gr&#246;&#223;ten Beitrag zur Analyse leisten. Je weiter sich der PS von 0.5 entfernt, desto kleiner f&#228;llt der Beitrag zur Analyse der einzelnen Patienten aus. &#196;hnlich wie bei dem Matching-Ansatz sind extreme Gewichte unm&#246;glich, da sie per Definition durch 0 und 1 begrenzt sind. Eine weitere attraktive Eigenschaft dieses Ansatzes besteht darin, dass die Kovariaten im Mittel zwischen den Gruppen exakt ausbalanciert sind <TextLink reference="21"></TextLink>. Das Ziel der Inferenz bei diesem Ansatz ist der ATE in der &#220;berlappungspopulation, der sich von dem ATE oder dem ATT in der gesamten Studienpopulation unterscheiden kann. Bez&#252;glich der Varianzsch&#228;tzung gelten hier die gleichen &#220;berlegungen wie beim Matching-Ansatz.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Diskussion">
      <MainHeadline>Diskussion</MainHeadline><Pgraph>Gewichtungsans&#228;tze auf Basis von PS stellen eine flexible M&#246;glichkeit zur Sch&#228;tzung von Behandlungseffekten in Beobachtungsstudien dar. Im Unterschied zum Matching-Ansatz, mit dem gew&#246;hnlicherweise der ATT gesch&#228;tzt wird, lassen sich mit den Gewichtungsans&#228;tzen verschiedene Behandlungseffekte relativ einfach sch&#228;tzen. Allerdings ist zu beachten, dass die Gewichtungsans&#228;tze eine korrekte Spezifikation des PS-Modells erfordern. Hierbei ist wiederum zu beachten, dass mit der &#8222;korrekten&#8220; Spezifikation des PS-Modells nicht das vollst&#228;ndige Wissen &#252;ber den zugrundeliegenden Datengenerierungspro<TextGroup><PlainText>z</PlainText></TextGroup>ess, der der Behandlungszuweisung zugrunde liegt, verlangt wird <TextLink reference="22"></TextLink>. Vielmehr geht es darum, alle Confounder und deren Einfluss auf die Behandlungszuweisung ad&#228;quat im PS-Modell zu ber&#252;cksichtigen. Die Simulationsergebnisse zur Performance verschiedener Gewichtungsans&#228;tze zeigen jeweils eine relativ hohe Sensitivit&#228;t bzgl. einer Fehlspezifikation des PS-Modells <TextLink reference="16"></TextLink>, <TextLink reference="21"></TextLink>. In der Publikation von St&#252;rmer et al.  findet sich jedoch ein Hinweis, dass der IPTW mit anschlie&#223;endem Trimming zu einer Reduzierung des <Mark2>unmeasured confounding</Mark2> f&#252;hren kann <TextLink reference="16"></TextLink>. </Pgraph><Pgraph>Ein weiterer wichtiger Punkt bei der Nutzung der Gewichtungsans&#228;tze ist das Vorliegen einer ausreichenden &#220;berlappung. Es herrscht kein einheitlicher Konsens dar&#252;ber, zu welchem Grad sich die beiden PS-Verteilungen &#252;berlappen m&#252;ssen, um die Gewichtungsans&#228;tze anwenden zu k&#246;nnen. Vor allem geht es hier um die Frage, ab welchem Grad der Nicht-&#220;berlappung die urspr&#252;ngliche Fragestellung mit den vorhandenen Daten nicht mehr beantwortet werden kann <TextLink reference="18"></TextLink>. </Pgraph><Pgraph>Schlie&#223;lich muss nach der Anwendung der Gewichtungsans&#228;tze die Balanciertheit der einzelnen Confounder &#252;berpr&#252;ft werden. Hierzu k&#246;nnen die standardisierten Differenzen oder z-Differenzen herangezogen werden <TextLink reference="23"></TextLink>, <TextLink reference="24"></TextLink>. Es sollten aber auch die ungewichteten Differenzen als eine Art Benchmark dargestellt werden.</Pgraph><Pgraph>All diese Punkte implizieren, dass die Sch&#228;tzung von Behandlungseffekten in Beobachtungsstudien mittels PS einen mehrstufigen Prozess darstellt. Zun&#228;chst muss die korrekte Spezifikation des PS-Modells gepr&#252;ft werden. Anschlie&#223;end ist das Ausma&#223; der &#220;berlappung zwischen den zu vergleichenden Behandlungsgruppen zu beurteilen. Wenn eine ausreichende &#220;berlappung vorliegt, muss die Entscheidung bez&#252;glich des interessierenden Behandlungseffekts getroffen werden. Darauffolgend ist der Gewichtungsansatz auszuw&#228;hlen und die &#220;berlappung der gewichteten PS-Verteilungen sowie die Balanciertheit der einzelnen Confounder zu pr&#252;fen. </Pgraph></TextBlock>
    <TextBlock linked="yes" name="Anmerkungen">
      <MainHeadline>Anmerkungen</MainHeadline><SubHeadline>Danksagung</SubHeadline><Pgraph>Der Autor dankt Sarah B&#246;hme, Jens-Otto Andreas, Dietrich Knoerzer, Tobias Bluhmki und Friedhelm Leverkus f&#252;r deren wertvolle und hilfreiche Anmerkungen. </Pgraph><SubHeadline>Interessenkonflikte</SubHeadline><Pgraph>Edin Basic ist Mitarbeiter der Takeda Pharma Vertrieb GmbH &#38; Co. KG.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Rosenbaum PR</RefAuthor>
        <RefAuthor>Rubin DB</RefAuthor>
        <RefTitle>The central role of the propensity score in observational studies for causal effects</RefTitle>
        <RefYear>1983</RefYear>
        <RefJournal>Biometrika</RefJournal>
        <RefPage>41-55</RefPage>
        <RefTotal>Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies for causal effects. Biometrika. 1983;70:41-55. DOI: 10.1093&#47;biomet&#47;70.1.41</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1093&#47;biomet&#47;70.1.41</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Rosenbaum PR</RefAuthor>
        <RefTitle>Model-based direct adjustment</RefTitle>
        <RefYear>1987</RefYear>
        <RefJournal>J Am Stat Assoc</RefJournal>
        <RefPage>387-94</RefPage>
        <RefTotal>Rosenbaum PR. Model-based direct adjustment. J Am Stat Assoc. 1987;82:387-94. DOI: 10.1080&#47;01621459.1987.10478441</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;01621459.1987.10478441</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Moodie EE</RefAuthor>
        <RefAuthor>Saarela O</RefAuthor>
        <RefAuthor>Stephens DA</RefAuthor>
        <RefTitle>A doubly robust weighting estimator of the average treatment effect on the treated</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>Stat</RefJournal>
        <RefPage>e205</RefPage>
        <RefTotal>Moodie EE, Saarela O, Stephens DA. A doubly robust weighting estimator of the average treatment effect on the treated. Stat. 2018;7:e205. DOI: 10.1002&#47;sta4.205</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1002&#47;sta4.205</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Pearl J</RefAuthor>
        <RefTitle>The Foundations of Causal Inference</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Sociological Methodology</RefJournal>
        <RefPage>75-149</RefPage>
        <RefTotal>Pearl J. The Foundations of Causal Inference. Sociological Methodology. 2010;40:75-149.</RefTotal>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Hern&#225;n MA</RefAuthor>
        <RefAuthor>Robins JM</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2020</RefYear>
        <RefBookTitle>Causal Inference: What If</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Hern&#225;n MA, Robins JM. Causal Inference: What If. Boca Raton: Chapman &#38; Hall&#47;CRC; 2020.</RefTotal>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>McCaffrey DF</RefAuthor>
        <RefAuthor>Ridgeway G</RefAuthor>
        <RefAuthor>Morral AR</RefAuthor>
        <RefTitle>Propensity score estimation with boosted regression for evaluating causal effects in observational studies</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Psychol Methods</RefJournal>
        <RefPage>403-25</RefPage>
        <RefTotal>McCaffrey DF, Ridgeway G, Morral AR. Propensity score estimation with boosted regression for evaluating causal effects in observational studies. Psychol Methods. 2004 Dec;9(4):403-25. DOI: 10.1037&#47;1082-989X.9.4.403</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1037&#47;1082-989X.9.4.403</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Setoguchi S</RefAuthor>
        <RefAuthor>Schneeweiss S</RefAuthor>
        <RefAuthor>Brookhart MA</RefAuthor>
        <RefAuthor>Glynn RJ</RefAuthor>
        <RefAuthor>Cook EF</RefAuthor>
        <RefTitle>Evaluating uses of data mining techniques in propensity score estimation: a simulation study</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Pharmacoepidemiol Drug Saf</RefJournal>
        <RefPage>546-55</RefPage>
        <RefTotal>Setoguchi S, Schneeweiss S, Brookhart MA, Glynn RJ, Cook EF. Evaluating uses of data mining techniques in propensity score estimation: a simulation study. Pharmacoepidemiol Drug Saf. 2008 Jun;17(6):546-55. DOI: 10.1002&#47;pds.1555 </RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1002&#47;pds.1555</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Brookhart MA</RefAuthor>
        <RefAuthor>Schneeweiss S</RefAuthor>
        <RefAuthor>Rothman KJ</RefAuthor>
        <RefAuthor>Glynn RJ</RefAuthor>
        <RefAuthor>Avorn J</RefAuthor>
        <RefAuthor>St&#252;rmer T</RefAuthor>
        <RefTitle>Variable selection for propensity score models</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Am J Epidemiol</RefJournal>
        <RefPage>1149-56</RefPage>
        <RefTotal>Brookhart MA, Schneeweiss S, Rothman KJ, Glynn RJ, Avorn J, St&#252;rmer T. Variable selection for propensity score models. Am J Epidemiol. 2006 Jun 15;163(12):1149-56. 
DOI: 10.1093&#47;aje&#47;kwj149</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1093&#47;aje&#47;kwj149</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Brookhart MA</RefAuthor>
        <RefAuthor>St&#252;rmer T</RefAuthor>
        <RefAuthor>Glynn RJ</RefAuthor>
        <RefAuthor>Rassen J</RefAuthor>
        <RefAuthor>Schneeweiss S</RefAuthor>
        <RefTitle>Confounding control in healthcare database research: challenges and potential approaches</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Med Care</RefJournal>
        <RefPage>S114-20</RefPage>
        <RefTotal>Brookhart MA, St&#252;rmer T, Glynn RJ, Rassen J, Schneeweiss S. Confounding control in healthcare database research: challenges and potential approaches. Med Care. 2010 Jun;48(6 Suppl):S114-20. DOI: 10.1097&#47;MLR.0b013e3181dbebe3</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;MLR.0b013e3181dbebe3</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Myers JA</RefAuthor>
        <RefAuthor>Rassen JA</RefAuthor>
        <RefAuthor>Gagne JJ</RefAuthor>
        <RefAuthor>Huybrechts KF</RefAuthor>
        <RefAuthor>Schneeweiss S</RefAuthor>
        <RefAuthor>Rothman KJ</RefAuthor>
        <RefAuthor>Joffe MM</RefAuthor>
        <RefAuthor>Glynn RJ</RefAuthor>
        <RefTitle>Effects of adjusting for instrumental variables on bias and precision of effect estimates</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Am J Epidemiol</RefJournal>
        <RefPage>1213-22</RefPage>
        <RefTotal>Myers JA, Rassen JA, Gagne JJ, Huybrechts KF, Schneeweiss S, Rothman KJ, Joffe MM, Glynn RJ. Effects of adjusting for instrumental variables on bias and precision of effect estimates. Am J Epidemiol. 2011 Dec 1;174(11):1213-22. 
DOI: 10.1093&#47;aje&#47;kwr364</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1093&#47;aje&#47;kwr364</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Williams TC</RefAuthor>
        <RefAuthor>Bach CC</RefAuthor>
        <RefAuthor>Matthiesen NB</RefAuthor>
        <RefAuthor>Henriksen TB</RefAuthor>
        <RefAuthor>Gagliardi L</RefAuthor>
        <RefTitle>Directed acyclic graphs: a tool for causal studies in paediatrics</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>Pediatr Res</RefJournal>
        <RefPage>487-93</RefPage>
        <RefTotal>Williams TC, Bach CC, Matthiesen NB, Henriksen TB, Gagliardi L. Directed acyclic graphs: a tool for causal studies in paediatrics. Pediatr Res. 2018 Oct;84(4):487-93. DOI: 10.1038&#47;s41390-018-0071-3</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1038&#47;s41390-018-0071-3</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Schneeweiss S</RefAuthor>
        <RefAuthor>Rassen JA</RefAuthor>
        <RefAuthor>Glynn RJ</RefAuthor>
        <RefAuthor>Avorn J</RefAuthor>
        <RefAuthor>Mogun H</RefAuthor>
        <RefAuthor>Brookhart MA</RefAuthor>
        <RefTitle>High-dimensional propensity score adjustment in studies of treatment effects using health care claims data</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Epidemiology</RefJournal>
        <RefPage>512-22</RefPage>
        <RefTotal>Schneeweiss S, Rassen JA, Glynn RJ, Avorn J, Mogun H, Brookhart MA. High-dimensional propensity score adjustment in studies of treatment effects using health care claims data. Epidemiology. 2009 Jul;20(4):512-22. DOI: 10.1097&#47;EDE.0b013e3181a663cc</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;EDE.0b013e3181a663cc</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Desai RJ</RefAuthor>
        <RefAuthor>Rothman KJ</RefAuthor>
        <RefAuthor>Bateman BT</RefAuthor>
        <RefAuthor>Hernandez-Diaz S</RefAuthor>
        <RefAuthor>Huybrechts KF</RefAuthor>
        <RefTitle>A Propensity-score-based Fine Stratification Approach for Confounding Adjustment When Exposure Is Infrequent</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>Epidemiology</RefJournal>
        <RefPage>249-57</RefPage>
        <RefTotal>Desai RJ, Rothman KJ, Bateman BT, Hernandez-Diaz S, Huybrechts KF. A Propensity-score-based Fine Stratification Approach for Confounding Adjustment When Exposure Is Infrequent. Epidemiology. 2017 Mar;28(2):249-57. 
DOI: 10.1097&#47;EDE.0000000000000595</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;EDE.0000000000000595</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Hern&#225;n MA</RefAuthor>
        <RefAuthor>Brumback B</RefAuthor>
        <RefAuthor>Robins JM</RefAuthor>
        <RefTitle>Marginal structural models to estimate the causal effect of zidovudine on the survival of HIV-positive men</RefTitle>
        <RefYear>2000</RefYear>
        <RefJournal>Epidemiology</RefJournal>
        <RefPage>561-70</RefPage>
        <RefTotal>Hern&#225;n MA, Brumback B, Robins JM. Marginal structural models to estimate the causal effect of zidovudine on the survival of HIV-positive men. Epidemiology. 2000 Sep;11(5):561-70. 
DOI: 10.1097&#47;00001648-200009000-00012</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;00001648-200009000-00012</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>Crump RK</RefAuthor>
        <RefAuthor>Hotz VJ</RefAuthor>
        <RefAuthor>Imbens GW</RefAuthor>
        <RefAuthor>Mitnik OA</RefAuthor>
        <RefTitle>Dealing with limited overlap in estimation of average treatment effects</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Biometrika</RefJournal>
        <RefPage>187-99</RefPage>
        <RefTotal>Crump RK, Hotz VJ, Imbens GW, Mitnik OA. Dealing with limited overlap in estimation of average treatment effects. Biometrika. 2009;96(1):187-99. DOI: 10.1093&#47;biomet&#47;asn055</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1093&#47;biomet&#47;asn055</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>St&#252;rmer T</RefAuthor>
        <RefAuthor>Webster-Clark M</RefAuthor>
        <RefAuthor>Lund JL</RefAuthor>
        <RefAuthor>Wyss R</RefAuthor>
        <RefAuthor>Ellis AR</RefAuthor>
        <RefAuthor>Lunt M</RefAuthor>
        <RefAuthor>Rothman KJ</RefAuthor>
        <RefAuthor>Glynn RJ</RefAuthor>
        <RefTitle>Propensity Score Weighting and Trimming Strategies for Reducing Variance and Bias of Treatment Effect Estimates: A Simulation Study</RefTitle>
        <RefYear>2021</RefYear>
        <RefJournal>Am J Epidemiol</RefJournal>
        <RefPage>1659-70</RefPage>
        <RefTotal>St&#252;rmer T, Webster-Clark M, Lund JL, Wyss R, Ellis AR, Lunt M, Rothman KJ, Glynn RJ. Propensity Score Weighting and Trimming Strategies for Reducing Variance and Bias of Treatment Effect Estimates: A Simulation Study. Am J Epidemiol. 2021 Aug 1;190(8):1659-70. DOI: 10.1093&#47;aje&#47;kwab041</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1093&#47;aje&#47;kwab041</RefLink>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>St&#252;rmer T</RefAuthor>
        <RefAuthor>Rothman KJ</RefAuthor>
        <RefAuthor>Avorn J</RefAuthor>
        <RefAuthor>Glynn RJ</RefAuthor>
        <RefTitle>Treatment effects in the presence of unmeasured confounding: dealing with observations in the tails of the propensity score distribution &#8211; a simulation study</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Am J Epidemiol</RefJournal>
        <RefPage>843-54</RefPage>
        <RefTotal>St&#252;rmer T, Rothman KJ, Avorn J, Glynn RJ. Treatment effects in the presence of unmeasured confounding: dealing with observations in the tails of the propensity score distribution &#8211; a simulation study. Am J Epidemiol. 2010 Oct 1;172(7):843-54. DOI: 10.1093&#47;aje&#47;kwq198</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1093&#47;aje&#47;kwq198</RefLink>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Walker AM</RefAuthor>
        <RefAuthor>Patrick AR</RefAuthor>
        <RefAuthor>Lauer MS</RefAuthor>
        <RefAuthor>Hornbrook MC</RefAuthor>
        <RefAuthor>Marin MG</RefAuthor>
        <RefAuthor>Platt R</RefAuthor>
        <RefAuthor>Roger VL</RefAuthor>
        <RefAuthor>Stang P</RefAuthor>
        <RefAuthor>Schneeweiss S</RefAuthor>
        <RefTitle>A tool for assessing the feasibility of comparative effectiveness research</RefTitle>
        <RefYear>2013</RefYear>
        <RefJournal>Comp Eff Res</RefJournal>
        <RefPage>11-20</RefPage>
        <RefTotal>Walker AM, Patrick AR, Lauer MS, Hornbrook MC, Marin MG, Platt R, Roger VL, Stang P, Schneeweiss S. A tool for assessing the feasibility of comparative effectiveness research. Comp Eff Res. 2013;2013(3):11-20. DOI: 10.2147&#47;CER.S40357</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.2147&#47;CER.S40357</RefLink>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Franklin JM</RefAuthor>
        <RefAuthor>Eddings W</RefAuthor>
        <RefAuthor>Austin PC</RefAuthor>
        <RefAuthor>Stuart EA</RefAuthor>
        <RefAuthor>Schneeweiss S</RefAuthor>
        <RefTitle>Comparing the performance of propensity score methods in healthcare database studies with rare outcomes</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>Stat Med</RefJournal>
        <RefPage>1946-63</RefPage>
        <RefTotal>Franklin JM, Eddings W, Austin PC, Stuart EA, Schneeweiss S. Comparing the performance of propensity score methods in healthcare database studies with rare outcomes. Stat Med. 2017 May 30;36(12):1946-63. DOI: 10.1002&#47;sim.7250</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1002&#47;sim.7250</RefLink>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Li L</RefAuthor>
        <RefAuthor>Greene T</RefAuthor>
        <RefTitle>A weighting analogue to pair matching in propensity score analysis</RefTitle>
        <RefYear>2013</RefYear>
        <RefJournal>Int J Biostat</RefJournal>
        <RefPage>215-34</RefPage>
        <RefTotal>Li L, Greene T. A weighting analogue to pair matching in propensity score analysis. Int J Biostat. 2013 Jul 31;9(2):215-34. DOI: 10.1515&#47;ijb-2012-0030</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1515&#47;ijb-2012-0030</RefLink>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Li F</RefAuthor>
        <RefAuthor>Thomas LE</RefAuthor>
        <RefAuthor>Li F</RefAuthor>
        <RefTitle>Addressing Extreme Propensity Scores via the Overlap Weights</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>Am J Epidemiol</RefJournal>
        <RefPage>250-7</RefPage>
        <RefTotal>Li F, Thomas LE, Li F. Addressing Extreme Propensity Scores via the Overlap Weights. Am J Epidemiol. 2019 Jan 1;188(1):250-7. DOI: 10.1093&#47;aje&#47;kwy201</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1093&#47;aje&#47;kwy201</RefLink>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Chakraborty B</RefAuthor>
        <RefAuthor>Moodie E</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2013</RefYear>
        <RefBookTitle>Statistical methods for dynamic treatment regimes</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Chakraborty B, Moodie E. Statistical methods for dynamic treatment regimes. New York: Springer; 2013.</RefTotal>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Rosenbaum PR</RefAuthor>
        <RefAuthor>Rubin DB</RefAuthor>
        <RefTitle>Constructing a Control Group Using Multivariate Matched Sampling Methods that Incorporate the Propensity Score</RefTitle>
        <RefYear>1985</RefYear>
        <RefJournal>The American Statistican</RefJournal>
        <RefPage>33-8</RefPage>
        <RefTotal>Rosenbaum PR, Rubin DB. Constructing a Control Group Using Multivariate Matched Sampling Methods that Incorporate the Propensity Score. The American Statistican. 1985 Feb;39(1):33-8. DOI: 10.2307&#47;2683903</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.2307&#47;2683903</RefLink>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>Kuss O</RefAuthor>
        <RefTitle>The z-difference can be used to measure covariate balance in matched propensity score analyses</RefTitle>
        <RefYear>2013</RefYear>
        <RefJournal>J Clin Epidemiol</RefJournal>
        <RefPage>1302-7</RefPage>
        <RefTotal>Kuss O. The z-difference can be used to measure covariate balance in matched propensity score analyses. J Clin Epidemiol. 2013 Nov;66(11):1302-7. DOI: 10.1016&#47;j.jclinepi.2013.06.001</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;j.jclinepi.2013.06.001</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>