<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>zma001473</Identifier>
    <IdentifierDoi>10.3205/zma001473</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0014734</IdentifierUrn>
    <ArticleType language="en">article</ArticleType>
    <ArticleType language="de">Artikel</ArticleType>
    <TitleGroup>
      <Title language="en">Statistical literacy and scientific reasoning &#38; argumentation in physicians</Title>
      <TitleTranslated language="de">Statistikverst&#228;ndnis und wissenschaftliches Denken &#38; Argumentieren bei praktizierenden &#196;rzt&#42;innen</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Schmidt</Lastname>
          <LastnameHeading>Schmidt</LastnameHeading>
          <Firstname>Felicitas M.</Firstname>
          <Initials>FM</Initials>
          <AcademicTitleSuffix>MPH</AcademicTitleSuffix>
        </PersonNames>
        <Address language="en">
          <Affiliation>University Hospital, LMU Munich, Institute of Medical Education, Munich, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Klinikum der Universit&#228;t M&#252;nchen, LMU M&#252;nchen, Institut f&#252;r Didaktik und Ausbildungsforschung in der Medizin, M&#252;nchen, Deutschland</Affiliation>
        </Address>
        <Email>Felicitasmariaschmidt&#64;gmail.com</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Zottmann</Lastname>
          <LastnameHeading>Zottmann</LastnameHeading>
          <Firstname>Jan M.</Firstname>
          <Initials>JM</Initials>
          <AcademicTitle>Dr. phil.</AcademicTitle>
        </PersonNames>
        <Address language="en">
          <Affiliation>University Hospital, LMU Munich, Institute of Medical Education, Munich, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Klinikum der Universit&#228;t M&#252;nchen, LMU M&#252;nchen, Institut f&#252;r Didaktik und Ausbildungsforschung in der Medizin, M&#252;nchen, Deutschland</Affiliation>
        </Address>
        <Email>Jan.Zottmann&#64;med.uni-muenchen.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Sailer</Lastname>
          <LastnameHeading>Sailer</LastnameHeading>
          <Firstname>Maximilian</Firstname>
          <Initials>M</Initials>
          <AcademicTitle>Prof. Dr. phil.</AcademicTitle>
        </PersonNames>
        <Address language="en">
          <Affiliation>University of Passau, Chair of Educational Science, Passau, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t Passau, Lehrstuhl f&#252;r Erziehungswissenschaft, Passau, Deutschland</Affiliation>
        </Address>
        <Email>maximlian.sailer&#64;uni-passau.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Fischer</Lastname>
          <LastnameHeading>Fischer</LastnameHeading>
          <Firstname>Martin R.</Firstname>
          <Initials>MR</Initials>
          <AcademicTitle>Prof. Dr. med.</AcademicTitle>
        </PersonNames>
        <Address language="en">
          <Affiliation>University Hospital, LMU Munich, Institute of Medical Education, Munich, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Klinikum der Universit&#228;t M&#252;nchen, LMU M&#252;nchen, Institut f&#252;r Didaktik und Ausbildungsforschung in der Medizin, M&#252;nchen, Deutschland</Affiliation>
        </Address>
        <Email>Martin.Fischer&#64;med.uni-muenchen.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Berndt</Lastname>
          <LastnameHeading>Berndt</LastnameHeading>
          <Firstname>Markus</Firstname>
          <Initials>M</Initials>
          <AcademicTitle>Dr. phil.</AcademicTitle>
        </PersonNames>
        <Address language="en">University Hospital, LMU Munich, Institute of Medical Education, Pettenkoferstr. 8a, D-80336 Munich, Germany<Affiliation>University Hospital, LMU Munich, Institute of Medical Education, Munich, Germany</Affiliation><Affiliation>Walden University, Richard W. Riley College of Education and Leadership, Minneapolis, USA</Affiliation></Address>
        <Address language="de">Klinikum der Universit&#228;t M&#252;nchen, LMU M&#252;nchen, Institut f&#252;r Didaktik und Ausbildungsforschung in der Medizin, Pettenkoferstr. 8a, 80336 M&#252;nchen, Deutschland<Affiliation>Klinikum der Universit&#228;t M&#252;nchen, LMU M&#252;nchen, Institut f&#252;r Didaktik und Ausbildungsforschung in der Medizin, M&#252;nchen, Deutschland</Affiliation><Affiliation>Walden University, Richard W. Riley College of Education and Leadership, Minneapolis, USA</Affiliation></Address>
        <Email>Markus.Berndt&#64;med.uni-muenchen.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">evidence-based practice</Keyword>
      <Keyword language="en">scientific reasoning and argumentation</Keyword>
      <Keyword language="en">statistical literacy</Keyword>
      <Keyword language="en">medical education</Keyword>
      <Keyword language="en">postgraduate medical education</Keyword>
      <Keyword language="de">evidenzbasierte Praxis</Keyword>
      <Keyword language="de">wissenschaftliches Denken und Argumentieren</Keyword>
      <Keyword language="de">Statistikverst&#228;ndnis</Keyword>
      <Keyword language="de">medizinische Ausbildung</Keyword>
      <Keyword language="de">postgraduale medizinische Weiterbildung</Keyword>
      <SectionHeading language="en">statistical literacy</SectionHeading>
      <SectionHeading language="de">Statistikverst&#228;ndnis</SectionHeading>
    </SubjectGroup>
    <DateReceived>20200427</DateReceived>
    <DateRevised>20201205</DateRevised>
    <DateAccepted>20210125</DateAccepted>
    <DatePublishedList>
      
    <DatePublished>20210415</DatePublished></DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>2366-5017</ISSN>
        <Volume>38</Volume>
        <Issue>4</Issue>
        <JournalTitle>GMS Journal for Medical Education</JournalTitle>
        <JournalTitleAbbr>GMS J Med Educ</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>77</ArticleNo>
    <Fundings>
      <Funding fundId="01PB14004C">Bundesministerium f&#252;r Bildung und Forschung</Funding>
      <Funding>LMU M&#252;nchen, Medizinische Fakult&#228;t, F&#246;rderverein WiFoMed</Funding>
    </Fundings>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph><Mark1>Ziel: </Mark1>Statistikverst&#228;ndnis (SV) von &#196;rztInnen, d. h. die F&#228;higkeit statistische Zahlen im wissenschaftlichen Kontext zu verwenden und zu interpretieren, ist eine wichtige Voraussetzung f&#252;r Risikoabsch&#228;tzung und -kommunikation. Statistikverst&#228;ndnis bildet in Verbindung mit der F&#228;higkeit zum wissenschaftlichen Denken und Argumentieren (WDA) die Grundlage f&#252;r eine evidenzbasierte medizinische Praxis. Mehrere Studien legen nahe, dass beide F&#228;higkeiten bei Medizinstudierenden nicht ausreichend entwickelt sind. Ziel der vorliegenden Studie war die Untersuchung dieser F&#228;higkeiten bei praktizierenden &#196;rztInnen und wie diese F&#228;higkeiten erworben wurden. </Pgraph><Pgraph><Mark1>Methoden: </Mark1>Die Daten von <Mark2>N</Mark2>&#61;71 &#196;rztInnen wurden online und in Papierform erhoben. Statistikverst&#228;ndnis wurde anhand von Multiple-Choice-Fragen gemessen, die WDA-Aktivit&#228;ten Evidenzen bewerten und Schlussfolgerungen ziehen anhand eines Entscheidungsszenarios. </Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Die Studienergebnisse zeigten bei &#196;rztInnen ein mittleres Niveau im SV (<Mark2>M</Mark2>&#61;17.58, <Mark2>SD</Mark2>&#61;6.92, max. 30 Pkt.) und WDA (Evidenzen bewerten: <Mark2>M</Mark2>&#61;7.75, <Mark2>SD</Mark2>&#61;1.85, max. 10 Pkt.; Schlussfolgerungen ziehen: <Mark2>M</Mark2>&#61;37.20, SD&#61;5.35, max. 60 Pkt.). Die Entwicklung entsprechender F&#228;higkeiten durch autodidaktische Lernaktivit&#228;ten (<Mark2>M</Mark2>&#61;4.78, <Mark2>SD</Mark2>&#61;1.13, Spannweite 1&#8211;6) wurde signifikant h&#228;ufiger angegeben als w&#228;hrend der formalen medizinischen Ausbildung (<Mark2>M</Mark2>&#61;2.31, <Mark2>SD</Mark2>&#61;1.46), <Mark2>t</Mark2>(71)&#61;-9.915, <Mark2>p</Mark2>&#60;.001 oder durch au&#223;ercurricul&#228;re Aktivit&#228;ten (<Mark2>M</Mark2>&#61;3.34, <Mark2>SD&#61;1.87), t</Mark2>(71)&#61;4.673, <Mark2>p</Mark2>&#60;.001. Die aktive Beteiligung an Forschung schien eine entscheidende Rolle zu spielen: Die Anzahl der Ver&#246;ffentlichungen und die Zeit der T&#228;tigkeit in der Forschung korrelierten signifikant mit dem SV, <Mark2>r</Mark2>(71)&#61;.355, <Mark2>p</Mark2>&#61;.002; respektive <Mark2>r</Mark2>(71)&#61;.280, <Mark2>p</Mark2>&#61;.018. WDA-F&#228;higkeiten wurden vorhergesagt durch die Art der medizinischen Doktorarbeit, <Mark2>&#946;</Mark2>&#61;-.380, <Mark2>p</Mark2>&#61;.016, sowie durch die T&#228;tigkeit in der Forschung, <Mark2>&#946;</Mark2>&#61;3.355, <Mark2>p</Mark2>&#61;.008.</Pgraph><Pgraph><Mark1>Schlussfolgerung: </Mark1>Das aktive Mitwirken an Forschungsaktivit&#228;ten scheint ein sehr wichtiger Faktor f&#252;r die Entwicklung sowohl des SV als auch des WDA zu sein. Dies spricht f&#252;r die Implementierung einer systematischen F&#246;rderung dieser F&#228;higkeiten in die formale medizinische Ausbildung.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph><Mark1>Objective: </Mark1>Statistical literacy (SL) of physicians, i.e. the ability to use and interpret statistical numbers in the context of science, is an essential prerequisite for risk estimation and communication. Together with scientific reasoning and argumentation (SRA) skills, SL provides the basis for evidence-based practice. Several studies suggest that in medical students both skills are underdeveloped. The aim of the present study was to investigate these skills in practicing physicians and how these skills were acquired. </Pgraph><Pgraph><Mark1>Methods: </Mark1>Data collection in <Mark2>N</Mark2>&#61;71 physicians was conducted online and as paper pencil.  SL was assessed with multiple-choice items. SRA skills evidence evaluation and drawing conclusions were measured with a decision scenario. </Pgraph><Pgraph><Mark1>Results: </Mark1>Study results indicated that physicians have medium levels of SL (<Mark2>M</Mark2>&#61;17.58, <Mark2>SD</Mark2>&#61;6.92, max 30 pts.) and SRA (evidence evaluation: <Mark2>M</Mark2>&#61;7.75, <Mark2>SD</Mark2>&#61;1.85, max 10 pts.; drawing conclusions: <Mark2>M</Mark2>&#61;37.20, <Mark2>SD</Mark2>&#61;5.35, max 60 pts.). Skills development via autodidactic learning activities (<Mark2>M</Mark2>&#61;4.78, <Mark2>SD</Mark2>&#61;1.13, range 1-6) was reported significantly more often than development during formal medical education (<Mark2>M</Mark2>&#61;2.31, <Mark2>SD</Mark2>&#61;1.46), <Mark2>t</Mark2>(71)&#61;-9.915, <Mark2>p</Mark2>&#60;.001, or in extracurricular activities (<Mark2>M</Mark2>&#61;3.34, <Mark2>SD</Mark2>&#61;1.87), <Mark2>t</Mark2>(71)&#61;4.673, <Mark2>p</Mark2>&#60;.001. The active involvement in research seemed decisive: The number of publications and time spent in research significantly correlated with SL, <Mark2>r</Mark2>(71)&#61;.355, <Mark2>p</Mark2>&#61;.002; respectively <Mark2>r</Mark2>(71)&#61;.280, <Mark2>p</Mark2>&#61;.018. SRA skills were predicted by the type of MD-thesis, <Mark2>&#946;</Mark2>&#61;-.380, <Mark2>p</Mark2>&#61;.016, and working in research, <Mark2>&#946;</Mark2>&#61;3.355, <Mark2>p</Mark2>&#61;.008. </Pgraph><Pgraph><Mark1>Conclusion: </Mark1>Active involvement in research activities seems to be a very important factor for the development of both SL and SRA skills. The implementation of systematic fostering of these skills during formal medical education seems warranted.</Pgraph></Abstract>
    <TextBlock language="en" linked="yes" name="1. Background">
      <MainHeadline>1. Background</MainHeadline><Pgraph>Following Sackett et al. (1997) regarding the modern definition of evidence-based medicine, scientific reasoning skills are considered essential together with physicians&#8217; expertise for best possible decision-making in the best interest of the patient <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>. For the assessment of risks and probabilities and their applicability to specific patients, a basic understanding of statistics and evidence evaluation is necessary. Statistical literacy (SL) is not only the ability to understand statistical information, but also to apply it in decision-making <TextLink reference="4"></TextLink>. It comprises the aptitude of critical reflection about statistics as evidence in arguments <TextLink reference="5"></TextLink>. Statistical literacy is based on numeracy, the aptitude of mathematical operations <TextLink reference="6"></TextLink>, and encompasses the ability to use and interpret statistical numbers in the context of science <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink> and the ability to explain and critically evaluate them <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink> (working definition for the present study). Furthermore, it is intertwined with scientific reasoning and argumentation skills (SRA), to provide the basis for evidence-based decision-making <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. </Pgraph><Pgraph>Based on the framework by Fischer et al. (2014), SRA can be defined as the competence of comprehending and applying scientific working methods and their results when solving problems <TextLink reference="14"></TextLink>, <TextLink reference="15"></TextLink>. SRA can be described by eight epistemic activities and this study focuses on two of them, evidence evaluation (EE) and drawing conclusions (DC).</Pgraph><Pgraph>Various studies suggest an intertwining of SRA and SL, with Anderson et al. (2013) stating that the latter is needed to evaluate scientific evidence <TextLink reference="16"></TextLink> and Franklin et al. (2005) hypothesizing that SL itself encompasses also SRA skills <TextLink reference="17"></TextLink>. </Pgraph><Pgraph>However, a collective statistical illiteracy has been observed among physicians <TextLink reference="4"></TextLink>, <TextLink reference="18"></TextLink>. Similarly, SRA skills needed for evidence-based practice <TextLink reference="19"></TextLink>, such as EE or DC, are underdeveloped <TextLink reference="4"></TextLink>, <TextLink reference="7"></TextLink>. </Pgraph><Pgraph>In a study by Anderson et al. (2014), 52&#37; of the participating physicians answered only two (or fewer) of four questions regarding statistical concepts correctly <TextLink reference="7"></TextLink>. This is in line with findings by Windish et al. (2007) reporting only 40&#37; of resident physicians demonstrating adequate understanding of biostatistical concepts <TextLink reference="20"></TextLink>. Similar results were found by Gigerenzer and Wegwarth (2008), showing that 33&#37; of gynecologists were not aware of the benefits of mammography screening, with 79&#37; being unable to interpret the positive predictive value <TextLink reference="21"></TextLink>. Gigerenzer et al. (2008) summarized various studies on the concept of the positive predictive value and its dependence on prevalence, finding that 50&#37; of participants were under the impression that false positive test results in HIV testing do not exist. They also found that only two of 20 urologists have sufficient knowledge about the reliability of a PSA-test. Thus, a lot of measurement tools for the assessment of SL exist <TextLink reference="18"></TextLink>, <TextLink reference="22"></TextLink>, <TextLink reference="23"></TextLink>, which focus commonly on one of the three levels of Watson (1997) or are designed in a certain context <TextLink reference="7"></TextLink>, <TextLink reference="22"></TextLink>. Overall, physicians&#8217; SL is not below-average <TextLink reference="7"></TextLink>. However, it can be considered comparable to other educated samples <TextLink reference="18"></TextLink>, <TextLink reference="24"></TextLink> and was found superior to that of residents in research training <TextLink reference="20"></TextLink> or medical students <TextLink reference="25"></TextLink>. The few studies that have assessed medical students&#8217; SL are supporting the findings of superiority of physicians <TextLink reference="26"></TextLink>. Berndt et al. (2021) compared medical students to those of social sciences and economics and found that medical students in their first years of study scored higher in comparison to social science students and comparable to economics students <TextLink reference="27"></TextLink>. This study not only assessed SL, but also the two aforementioned skills EE and DC. Further possible links between SL and SRA have been examined with the Medical Data Interpretation Test <TextLink reference="22"></TextLink> where participating physicians scored higher overall than participants with other postgraduate degrees (89 out of 100 score points). Johnson et al. (2014) assessed numeracy of medical students and residents and found students with poor numeracy being more likely to misjudge risks of different treatment alternatives and that the confidence in treatment recommendation increased during medical school <TextLink reference="25"></TextLink>. </Pgraph><Pgraph>In summary, SL and SRA seem to be underdeveloped in medical students and better developed in physicians. However, the development of SL and SRA may not necessarily happen within formal education and the question remains how, where, and when this development occurs. The present study should contribute to the discussion when and how to best foster SL and SRA skills in lifelong learning of physicians by applying a test instrument comprising various aspects of SL and SRA. It aimed at providing further insights into these skills in physicians and to identify demographic factors and learning opportunities that may be associated with the development of these skills. Our explorative research questions were:</Pgraph><Pgraph><Mark1>RQ1. Statistical literacy and SRA skills</Mark1></Pgraph><Pgraph><Indentation>a. To what extent are SL and SRA skills developed in physicians&#63; </Indentation></Pgraph><Pgraph><Indentation>b. To what extent does SL predict SRA skills of physicians&#63;</Indentation></Pgraph><Pgraph><Mark1>RQ2. Education and skills development</Mark1></Pgraph><Pgraph><Indentation>a. How, where, and when do physicians develop SL and SRA skills&#63; </Indentation></Pgraph><Pgraph><Indentation>b. Which demographic factors are related to the development of SL and SRA skills&#63;</Indentation></Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="1. Wissenschaftlicher Hintergrund">
      <MainHeadline>1. Wissenschaftlicher Hintergrund</MainHeadline><Pgraph>Wissenschaftliche Argumentationsf&#228;higkeiten gelten in Anlehnung an die moderne Definition evidenzbasierter Medizin nach Sackett et al. (1997) zusammen mit &#228;rztlichem Fachwissen als essenziell f&#252;r die bestm&#246;gliche Entscheidungsfindung im Interesse von PatientInnen <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>. F&#252;r die Beurteilung von Risiken und Wahrscheinlichkeiten und deren Anwendung f&#252;r PatientInnen ist ein grundlegendes Verst&#228;ndnis von Statistik und die F&#228;higkeit Evidenzen zu bewerten erforderlich. Bei Statistikverst&#228;ndnis (SV, engl. statistical literacy) handelt es sich nicht nur um die F&#228;higkeit statistische Informationen zu verstehen, sondern diese auch in die Entscheidungsfindung einflie&#223;en zu lassen <TextLink reference="4"></TextLink>. Hierzu geh&#246;rt, Statistiken als Evidenzgrundlage der wissenschaftlichen Argumentation kritisch reflektieren zu k&#246;nnen <TextLink reference="5"></TextLink>. Statistikverst&#228;ndnis basiert auf einem entsprechenden Zahlenverst&#228;ndnis und dem Beherrschen mathematischer Operationen <TextLink reference="6"></TextLink> und umfasst die F&#228;higkeit, statistische Zahlen im wissenschaftlichen Kontext zu verwenden und zu interpretieren <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>, sowie die F&#228;higkeit, statistische Zahlen zu erkl&#228;ren und kritisch zu bewerten <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink> (Arbeitsdefinition f&#252;r die vorliegende Studie). Zudem ist SV eng mit F&#228;higkeiten zum wissenschaftlichen Denken und Argumentieren (WDA, engl. scientific reasoning and argumentation) verbunden und schafft so die Grundlage f&#252;r eine evidenzbasierte Entscheidungsfindung <TextLink reference="12"></TextLink>, <TextLink reference="13"></TextLink>. </Pgraph><Pgraph>Ausgehend vom Rahmenkonzept von Fischer et al. (2014) kann WDA als die Kompetenz definiert werden, wissenschaftliche Arbeitsmethoden und die damit verbundenen Ergebnisse zu verstehen und bei der Probleml&#246;sung anzuwenden <TextLink reference="14"></TextLink>, <TextLink reference="15"></TextLink>. Wissenschaftliches Denken und Argumentieren kann anhand von acht epistemischen Aktivit&#228;ten beschrieben werden. Der Schwerpunkt dieser Studie liegt auf den beiden Aktivit&#228;ten Evidenzen bewerten (EB, engl. evidence evaluation) und Schlussfolgerungen ziehen (SZ, engl. drawing conclusions).</Pgraph><Pgraph>Verschiedene Studien legen nahe, dass WDA und SV eng miteinander verkn&#252;pft sind, wobei SV laut Anderson et al. (2013) zum Bewerten wissenschaftlicher Evidenz erforderlich ist <TextLink reference="16"></TextLink>. Gem&#228;&#223; Franklin et al. (2005) umfasst SV selbst auch WDA-F&#228;higkeiten <TextLink reference="17"></TextLink>. </Pgraph><Pgraph>Jedoch wurde bei &#196;rztInnen ein weit verbreitetes Defizit hinsichtlich statistischer Kenntnisse beobachtet <TextLink reference="4"></TextLink>, <TextLink reference="18"></TextLink>. In &#228;hnlicher Weise sind WDA-F&#228;higkeiten wie EB und SZ, die f&#252;r eine evidenzbasierte Praxis <TextLink reference="19"></TextLink> erforderlich sind <TextLink reference="4"></TextLink>, <TextLink reference="7"></TextLink>, unterentwickelt. </Pgraph><Pgraph>In einer Studie von Anderson et al. (2014) beantworteten 52 &#37; der teilnehmenden &#196;rztInnen nur zwei (oder weniger) von vier Fragen zu statistischen Konzepten richtig <TextLink reference="7"></TextLink>. Dies steht im Einklang mit den Ergebnissen von Windish et al. (2007), laut denen nur 40&#37; der Assistenz&#228;rztInnen biostatistische Konzepte angemessen verstehen <TextLink reference="20"></TextLink>. Zu &#228;hnlichen Ergebnissen kamen Gigerenzer und Wegwarth (2008), denen zufolge 33&#37; der Gyn&#228;kologInnen den Nutzen des Mammografie-Screenings nicht kannten und 79&#37; den positiven pr&#228;diktiven Wert nicht interpretieren konnten <TextLink reference="21"></TextLink>. Gigerenzer et al. (2008) fassten verschiedene Studien zum Konzept des positiven pr&#228;diktiven Werts und seiner Abh&#228;ngigkeit von der Pr&#228;valenz zusammen und fanden heraus, dass 50&#37; der Teilnehmenden nicht an die M&#246;glichkeit falsch positiver HIV-Testergebnisse glauben. Sie fanden au&#223;erdem heraus, dass nur zwei von 20 UrologInnen ausreichende Kenntnisse &#252;ber die Zuverl&#228;ssigkeit eines PSA-Tests haben. In der Folge existiert eine Vielzahl von Messinstrumenten zur Erhebung des SV <TextLink reference="18"></TextLink>, <TextLink reference="22"></TextLink>, <TextLink reference="23"></TextLink>, die sich in der Regel auf eine der drei Ebenen von Watson (1997) konzentrieren oder nur f&#252;r einen bestimmten Kontext konzipiert sind <TextLink reference="7"></TextLink>, <TextLink reference="22"></TextLink>. Insgesamt ist das SV von &#196;rztInnen nicht unterdurchschnittlich ausgepr&#228;gt <TextLink reference="7"></TextLink>. Es kann als vergleichbar mit anderen akademischen Stichproben <TextLink reference="18"></TextLink>, <TextLink reference="24"></TextLink> angesehen werden und war dem SV von Assistenz&#228;rztInnen in der Forschungsausbildung <TextLink reference="20"></TextLink> oder von Medizinstudierenden <TextLink reference="25"></TextLink> nachweislich &#252;berlegen. Die wenigen Studien, in denen das SV von Medizinstudierenden untersucht wurde, st&#252;tzen das Untersuchungsergebnis der diesbez&#252;glichen &#220;berlegenheit von &#196;rztInnen <TextLink reference="26"></TextLink>. Berndt et al. (2021) verglichen Medizinstudierende mit Studierenden der Sozial- und Wirtschaftswissenschaften und fanden heraus, dass Medizinstudierende in ihren ersten Studienjahren im Vergleich zu Studierenden der Sozialwissenschaften besser und auf vergleichbarem Niveau wie Studierende der Wirtschaftswissenschaften abschnitten <TextLink reference="27"></TextLink>. In dieser Studie wurde nicht nur SV erhoben, sondern auch die beiden oben genannten WDA-Aktivit&#228;ten EB und SZ. Weitere m&#246;gliche Zusammenh&#228;nge zwischen SV und WDA wurden mit dem Medical Data Interpretation Test <TextLink reference="22"></TextLink> untersucht, bei dem teilnehmende &#196;rztInnen insgesamt besser als Teilnehmende mit anderen postgradualen Abschl&#252;ssen abschnitten (89 von 100 Punkten). Johnson et al. (2014) untersuchten das Zahlenverst&#228;ndnis von Medizinstudierenden und Assistenz&#228;rztInnen und stellten fest, dass Studierende mit schlechtem Zahlenverst&#228;ndnis die Risiken verschiedener Behandlungsalternativen h&#228;ufiger falsch einsch&#228;tzen, wobei das Vertrauen in die eigene Behandlungsempfehlung w&#228;hrend des Medizinstudiums zunahm <TextLink reference="25"></TextLink>. </Pgraph><Pgraph>Zusammenfassend l&#228;sst sich sagen, dass SV und WDA bei Medizinstudierenden unterentwickelt, bei &#196;rztInnen jedoch besser entwickelt zu sein scheinen. Die Entwicklung von SV und WDA muss aber nicht unbedingt innerhalb der formalen Ausbildung erfolgen, und es stellt sich die Frage, wie, wo, und wann diese Entwicklung stattfindet. Die vorliegende Studie soll einen Beitrag zur Diskussion leisten, wann und wie SV und WDA im lebenslangen Lernen von &#196;rztInnen am besten gef&#246;rdert werden k&#246;nnen. Hierzu wurde ein Testinstrument eingesetzt, das verschiedene SV- und WDA-Aspekte umfasst. Ziel der Studie war es, weitere Erkenntnisse &#252;ber diese F&#228;higkeiten bei &#196;rztInnen zu gewinnen und demografische Faktoren und Lerngelegenheiten zu identifizieren, die m&#246;glicherweise mit der Entwicklung dieser F&#228;higkeiten in Zusammenhang stehen. Unsere explorativen Forschungsfragen lauteten: </Pgraph><Pgraph><Mark1>FF1. Statistikverst&#228;ndnis und WDA</Mark1></Pgraph><Pgraph><Indentation>a. In welchem Umfang sind SV und WDA bei &#196;rztInnen entwickelt&#63; </Indentation></Pgraph><Pgraph><Indentation>b. In welchem Ausma&#223; sagt der SV-Score die WDA-F&#228;higkeiten von &#196;rztInnen voraus&#63;</Indentation></Pgraph><Pgraph><Mark1>FF2. Entwicklung von SV und WDA</Mark1></Pgraph><Pgraph><Indentation>a. Wie, wo, und wann entwickeln &#196;rztInnen SV und WDA&#63; </Indentation></Pgraph><Pgraph><Indentation>b. Welche demografischen Faktoren stehen mit der Entwicklung von SV und WDA in Zusammenhang&#63;</Indentation></Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="2. Methods">
      <MainHeadline>2. Methods</MainHeadline><SubHeadline2>2.1. Design and sample</SubHeadline2><Pgraph>Our study followed a quasi-experimental, causal-comparative design with two dependent variables: SL and SRA. We included <Mark2>N</Mark2>&#61;71 German-speaking physicians (31 females, 34 males, 6 NA), from different work settings and locations in our study: hospital (<Mark2>n</Mark2>&#61;44), outpatient sector (<Mark2>n</Mark2>&#61;3), research (<Mark2>n</Mark2>&#61;8), study program (<Mark2>n</Mark2>&#61;2) and administration (<Mark2>n</Mark2>&#61;2), (<Mark2>n</Mark2>&#61;12 NA). A MD-thesis, a scientific work as optional part of the medical study program (not equivalent to a PhD thesis), was completed by 58 participants and 9 were currently working on it. Despite the modest sample size, we consider our sample representative with regard to scientific experience, as a MD-thesis is very common in Germany. The mean age of participants was 40 years (<Mark2>SD</Mark2>&#61;9.59, range&#61;26-65) (see table 1 <ImgLink imgNo="1" imgType="table"/>).</Pgraph><SubHeadline2>2.2. Test instrument</SubHeadline2><Pgraph>For the assessment of SL and SRA skills, we used an instrument previously developed in the context of a study by Berndt et al. (2021) who initiated the ongoing validation process with 217 economics, social sciences, and medical students from LMU Munich <TextLink reference="27"></TextLink>. The test instrument combines multiple choice items to assess SL with a decision scenario <TextLink reference="28"></TextLink> to assess the participants&#8217; skills in EE and DC. For this study, items on relevant demographic factors were added and piloted with ten medical students from LMU Munich.</Pgraph><SubHeadline3>2.2.1. Demography</SubHeadline3><Pgraph>Demographic and biographic parameters of the participants were assessed with a special interest in their working history and environment (hospital, out-patient care, research). Questions were adapted from a study by Epstein et al. <TextLink reference="29"></TextLink> and comprised multiple choice items, some with the opportunity to fill in additional free text; five items on the MD-thesis, three items on the professional career, two items on the publication record (type of authorship, number of publications), and three items on the current job description.  </Pgraph><SubHeadline3>2.2.2. Statistical literacy </SubHeadline3><Pgraph>Statistical literacy was measured with multiple choice items based on validated instruments <TextLink reference="7"></TextLink>, <TextLink reference="18"></TextLink>, <TextLink reference="23"></TextLink>, to assess a broad spectrum from basic numeracy to conditional probabilities and statistical concepts. Duplicates and factual knowledge questions were excluded, so that all three levels described by Watson (1997) were covered. Additionally, all items were weighted for difficulty <TextLink reference="11"></TextLink>. Internal consistency of the SL test was .82 (Cronbach&#8217;s &#945;) in our sample with a maximum score of 30 points. All items were framed in a medical context; however, no medical content knowledge was necessary to answer them correctly. </Pgraph><SubHeadline3>2.2.3. SRA skills </SubHeadline3><Pgraph>The assessment of SRA skills focused on the two epistemic activities EE and DC with a decision scenario in a medical context (general medicine, out-patient care) and provided two separate overall scores for EE and DC (Cronbach&#39;s &#945; for EE items .87; for DC items .74). For EE, participants had to evaluate four pieces of evidence <TextLink reference="30"></TextLink>, <TextLink reference="31"></TextLink>, <TextLink reference="32"></TextLink>, including one authentic pharmaceutical brochure that advertised herbal drugs, in terms of their scientific quality, evidence strength, and relevance for the present situation on a 6-point Likert scale based on the QUESTS criteria <TextLink reference="33"></TextLink>.</Pgraph><Pgraph>Then, the participants rated the persuasiveness (Likert 1-6) of 20 arguments, which were extracted from the presented evidence and assigned a level of argument strength from 1 (lowest) to 4 (highest). For 13 participants, the evaluation of 1 to 5 arguments out of 20 was missing. In order to avoid dropouts of these cases, the respective values were imputed from the average of the respective item. The participants&#8217; ratings for scientific quality were compared to the ratings of scientific quality by the authors, resulting in a measure of similarity for EE and DC. The range of these measures was from 0-10 (EE score) and 0-60 (DC score) with zero indicating no similarity. </Pgraph><SubHeadline2>2.3. Procedure</SubHeadline2><Pgraph>The study was completed by the participants either online with LamaPoll &#91;<Hyperlink href="https:&#47;&#47;www.lamapoll.de&#47;">https:&#47;&#47;www.lamapoll.de&#47;</Hyperlink>&#93;, a survey tool optimized for mobile applications, or as paper pencil (return rate 16.5&#37; online and 66.7&#37; paper pencil). Average duration was approximately 45 minutes. Participants were invited via mailing lists and personal contacts.</Pgraph><SubHeadline2>2.4. Statistical analyses</SubHeadline2><Pgraph>Statistical analyses were performed with IBM SPSS 25. Descriptive and frequency data were computed for primary analysis and Cronbach&#8217;s alpha for internal consistency. Extensive outlier analyses were conducted and all required prerequisites for statistical analyses, such as normal distribution and homoscedasticity, were tested. <Mark2>T</Mark2>-tests, one-factorial ANOVAs, and linear regression models were calculated to assess differences and the association of demographic factors with SL and SRA. Probability values less than .05 were considered significant. Data in natural verbal language (free text in demography section) underwent independent thematic analysis by two authors to extract common themes.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="2. Methoden">
      <MainHeadline>2. Methoden</MainHeadline><SubHeadline2>2.1. Design und Stichprobe</SubHeadline2><Pgraph>Unsere Studie folgte einem quasi-experimentellen, kausal-vergleichenden Design mit zwei abh&#228;ngigen Variablen: SV und WDA. Wir schlossen deutschsprachige &#196;rztInnen (<Mark2>N</Mark2>&#61;71; 31 Frauen, 34 M&#228;nner, 6 k.A.) aus verschiedenen Arbeitsumfeldern und Orten in unsere Studie ein: Klinik (<Mark2>n</Mark2>&#61;44), ambulante Versorgung (<Mark2>n</Mark2>&#61;3), Forschung (<Mark2>n</Mark2>&#61;8), Studienprogramm (<Mark2>n</Mark2>&#61;2) und Verwaltung (<Mark2>n</Mark2>&#61;2), (<Mark2>n</Mark2>&#61;12 k.A.). Eine medizinische Dissertation, eine wissenschaftliche Arbeit als optionaler Teil des Medizinstudiums (nicht &#228;quivalent mit einer PhD-Arbeit), wurde von 58 Teilnehmenden abgeschlossen und von 9 als aktuell laufend angegeben. Trotz unserer relativ kleinen Stichprobengr&#246;&#223;e sehen wir diese hinsichtlich der wissenschaftlichen Erfahrung f&#252;r repr&#228;sentativ, da medizinische Dissertationen in Deutschland sehr verbreitet sind. Das Durchschnittsalter der Teilnehmenden betrug 40 Jahre (<Mark2>SD</Mark2>&#61;9.59, Spannweite&#61;26&#8211;65) (siehe Tabelle 1 <ImgLink imgNo="1" imgType="table"/>).</Pgraph><SubHeadline2>2.2. Testinstrument</SubHeadline2><Pgraph>F&#252;r die Messung von SV und WDA haben wir ein Instrument verwendet, das zuvor im Rahmen einer Studie von Berndt et al. (2021) entwickelt wurde <TextLink reference="27"></TextLink>. Das Testinstrument kombiniert Multiple-Choice-Fragen zur Erhebung des SV mit einem Entscheidungsszenario <TextLink reference="28"></TextLink> zur Erhebung der WDA-Aktivit&#228;ten EB und SZ der Teilnehmenden. F&#252;r die vorliegende Studie wurden Items zu relevanten demografischen Faktoren hinzugef&#252;gt und mit zehn Medizinstudierenden der LMU M&#252;nchen pilotiert.</Pgraph><SubHeadline3>2.2.1. Demografie</SubHeadline3><Pgraph>Demografische und biografische Parameter der Teilnehmenden wurden mit besonderem Interesse an ihrem beruflichen Werdegang und ihrem Arbeitsumfeld (Klinik, ambulante Versorgung, Forschung) erfasst. Die aus einer Studie von Epstein et al. <TextLink reference="29"></TextLink> adaptierten Items waren Multiple-Choice-Fragen. Teilweise bestand hierbei die M&#246;glichkeit, zus&#228;tzlichen Freitext einzugeben. F&#252;nf Multiple-Choice-Fragen bezogen sich auf die medizinische Dissertation, drei Fragen auf den beruflichen Werdegang, zwei Fragen auf die bisherigen Ver&#246;ffentlichungen (Art der Autorenschaft, Anzahl der Ver&#246;ffentlichungen), und drei Fragen auf das aktuelle Stellenprofil.</Pgraph><SubHeadline3>2.2.2. Statistikverst&#228;ndnis </SubHeadline3><Pgraph>Das SV wurde mit Multiple-Choice-Items gemessen, die auf validierten Instrumenten <TextLink reference="7"></TextLink>, <TextLink reference="18"></TextLink>, <TextLink reference="23"></TextLink> basierten. Auf diese Weise konnte ein breites Spektrum ausgewertet werden, von grundlegenden Zahlenverst&#228;ndnis bis hin zum Rechnen mit bedingten Wahrscheinlichkeiten und dem Umgang mit statistischen Konzepten. Doppelte Items und reine Faktenwissensfragen wurden herausgenommen, sodass letztendlich alle drei von Watson (1997) beschriebenen Ebenen abgedeckt wurden. Zus&#228;tzlich wurden alle Items nach Schwierigkeit gewichtet <TextLink reference="11"></TextLink>. Die interne Konsistenz des SV-Tests betrug in unserer Stichprobe bei einer maximalen Punktzahl von 30 Punkten .82 (Cronbachs &#945;). Alle Items waren in einem medizinischen Kontext formuliert, wobei zur richtigen Beantwortung kein medizinisches Fachwissen erforderlich war. </Pgraph><SubHeadline3>2.2.3. Wissenschaftliches Denken und Argumentieren </SubHeadline3><Pgraph>Die Erhebung der WDA-F&#228;higkeiten konzentrierte sich auf die beiden epistemischen Aktivit&#228;ten EB und SZ in einem Entscheidungsszenario im medizinischen Kontext (Allgemeinmedizin, ambulante Versorgung). Hierbei gab es zwei separate Scores f&#252;r EB und SZ (Cronbachs &#945; betrug f&#252;r EB-Items .87 und f&#252;r SZ-Items .74). F&#252;r den EB-Score mussten die Teilnehmenden vier kurze Artikel (Evidenzen) <TextLink reference="30"></TextLink>, <TextLink reference="31"></TextLink>, <TextLink reference="32"></TextLink> auf einer sechs Punkte umfassenden Likert-Skala gem&#228;&#223; den QUEST-Kriterien <TextLink reference="33"></TextLink> hinsichtlich ihrer wissenschaftlichen Qualit&#228;t, Evidenzst&#228;rke, und Relevanz f&#252;r die vorliegende Situation bewerten, darunter eine authentische pharmazeutische Brosch&#252;re, in der f&#252;r ein pflanzliches Arzneimittel geworben wird. </Pgraph><Pgraph>Anschlie&#223;end bewerteten die Teilnehmenden die &#220;berzeugungskraft (Likert 1-6) von 20 Argumenten, die im Vorfeld von den Autoren aus den pr&#228;sentierten Evidenzen extrahiert wurden, und vergaben eine Einsch&#228;tzung der Argumentst&#228;rke von 1 (sehr schwach) bis 4 (sehr stark). Bei 13 Teilnehmenden fehlten bis zu f&#252;nf Bewertungen der insgesamt 20 Argumente. Um diese Datens&#228;tze weiterhin verwenden zu k&#246;nnen, wurden die Werte aus dem Durchschnitt der jeweiligen Bewertungen durch Imputation erg&#228;nzt. Aus den durch die Teilnehmenden vorgenommenen Bewertungen der wissenschaftlichen Qualit&#228;t wurde mit einer unabh&#228;ngigen Bewertung der wissenschaftlichen Qualit&#228;t seitens der Autoren ein &#220;bereinstimmungsma&#223; f&#252;r EB und SZ errechnet. Dieses bewegte sich f&#252;r EB zwischen 0&#8211;10 (EB-Score) und f&#252;r SZ zwischen 0&#8211;60 (SZ-Score), wobei Null auf keine &#220;bereinstimmung hinwies. </Pgraph><SubHeadline2>2.3. Ablauf</SubHeadline2><Pgraph>Die Studie wurde von den Teilnehmenden entweder online mit LamaPoll &#91;<Hyperlink href="https:&#47;&#47;www.lamapoll.de&#47;">https:&#47;&#47;www.lamapoll.de&#47;</Hyperlink>&#93;, einem f&#252;r Mobilger&#228;te optimierten Umfrage-Tools, oder auf Papierfrageb&#246;gen ausgef&#252;llt (R&#252;cklaufquote online 16.5&#37; und Papierfrageb&#246;gen 66.7&#37;). Die durchschnittliche Dauer betrug etwa 45 Minuten. Die Einladung der Teilnehmenden erfolgte &#252;ber Mailinglisten und pers&#246;nliche Kontakte.</Pgraph><SubHeadline2>2.4. Statistische Analysen</SubHeadline2><Pgraph>Statistische Analysen erfolgten mit IBM SPSS 25. F&#252;r die Prim&#228;ranalyse wurden deskriptive und H&#228;ufigkeitsdaten berechnet und f&#252;r die interne Konsistenz Cronbachs Alpha. Es erfolgten umfangreiche Ausrei&#223;eranalysen. Weiterhin wurden alle f&#252;r die statistischen Analysen erforderlichen Voraussetzungen wie Normalverteilung und Homoskedastizit&#228;t gepr&#252;ft. <Mark2>T</Mark2>-Tests, einfaktorielle Varianzanalysen, und lineare Regressionsmodelle wurden verwendet, um Unterschiede zu berechnen und den Zusammenhang zwischen demografischen Faktoren und SV und WDA zu beurteilen. Wahrscheinlichkeitswerte kleiner als .05 wurden als signifikant angesehen. In verbaler Sprache vorliegende Daten (Freitext im Abschnitt zur Demografie) wurden von zwei der Autoren einer separaten thematischen Analyse unterzogen, um h&#228;ufig vorkommende Themen zu extrahieren.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="3. Results">
      <MainHeadline>3. Results</MainHeadline><Pgraph>We included 71 completed questionnaires (see table 1 <ImgLink imgNo="1" imgType="table"/>). The entire data set was checked for univariate outliers. Skewness and kurtosis for all variables was within the &#177;2 range <TextLink reference="34"></TextLink>. The prerequisites for <Mark2>t</Mark2>-tests and ANOVA were fulfilled, unless indicated otherwise below.  </Pgraph><SubHeadline2>3.1. Statistical literacy and SRA skills </SubHeadline2><Pgraph>The 71 physicians&#39; average score in SL was <Mark2>M</Mark2>&#61;17.58, <Mark2>SD</Mark2>&#61;6.92, with a range of 5 to 30 out of 30 attainable points (59&#37;). On average, physicians evaluated the evidences concordantly with the authors&#39; evaluation, EE score: <Mark2>M</Mark2>&#61;7.75, <Mark2>SD</Mark2>&#61;1.85 (77&#37;). The ratings for argument quality were in accordance with the authors&#8217; rating, DC score: <Mark2>M</Mark2>&#61;37.20, <Mark2>SD</Mark2>&#61;5.35 (62&#37;). Statistical literacy and DC were significantly inversely correlated, <Mark2>r</Mark2>(71)&#61;-.272, <Mark2>p</Mark2>&#61;.022. However, no correlation was found between SL and EE, <Mark2>r</Mark2>(71)&#61;.198, <Mark2>p</Mark2>&#61;.098, nor EE and DC, <Mark2>r</Mark2>(71)&#61;.138, <Mark2>p</Mark2>&#61;.256.</Pgraph><SubHeadline2>3.2. Education and skills development  </SubHeadline2><Pgraph>We explored how, where, and when physicians developed scientific skills (see figure 1 <ImgLink imgNo="1" imgType="figure"/>). Significantly more participants indicated to have acquired scientific skills in an autodidactic manner (<Mark2>M</Mark2>&#61;4.78, <Mark2>SD</Mark2>&#61;1.13, Likert 1-6 scale) rather than during their study program (<Mark2>M</Mark2>&#61;2.31, <Mark2>SD</Mark2>&#61;1.46, Likert 1-6 scale),<Mark2> t</Mark2>(71)&#61;-9.915, <Mark2>p</Mark2>&#60;.001, or in extracurricular activities (<Mark2>M</Mark2>&#61;3.34, <Mark2>SD</Mark2>&#61;1.87, Likert 1-6 scale), <Mark2>t</Mark2>(71)&#61;4.673, <Mark2>p</Mark2>&#60;.001. In a free-text box, participants added various other learning opportunities, such as massive open online courses, higher education, workshops, and learning through peer reviews and feedback (see figure 2 <ImgLink imgNo="2" imgType="figure"/>). </Pgraph><Pgraph>Having completed or working on the MD-thesis showed no effects on SL, EE, or DC. However, these results have to be treated carefully, as the prerequisites for ANOVA were not fulfilled in our sample with only four participants without a MD-thesis. The fostering of critical scrutiny of study results presented by other researchers during the preparation of the MD-thesis was positively correlated with SL, <Mark2>r</Mark2>(71)&#61;.271, <Mark2>p</Mark2>&#61;.033. </Pgraph><Pgraph>Regarding the postgraduate phase, a one-factorial ANOVA showed a significant main effect of having worked in research on SL, <Mark2>F</Mark2>(1,70)&#61;12.737, <Mark2>p</Mark2>&#61;.001, partial &#951;<Superscript>2</Superscript>&#61;.156 and the type of authorship in publications, <Mark2>F</Mark2>(5,71)&#61;3.886, <Mark2>p</Mark2>&#61;.004, partial &#951;<Superscript>2</Superscript>&#61;.230. </Pgraph><Pgraph>Time spent in research was significantly associated with better SL, <Mark2>r</Mark2>(71)&#61;.28, <Mark2>p</Mark2>&#61;.018, as was the number of publications, <Mark2>r</Mark2>(71)&#61;.36, <Mark2>p</Mark2>&#61;.002.</Pgraph><Pgraph>Regarding SRA, linear regression models revealed that the corresponding score in EE increased by &#946;&#61;.314&#177;.150, <Mark2>p</Mark2>&#61;.041, when the Likert value of the MD-thesis supervisor&#8217;s content-related support was increased by one point. Additionally, the form of the MD-thesis (experimental, clinical, empirical, statistical, or literature review) was associated with EE, with experimental and clinical design being positively related to EE skills, &#946;&#61;-.380&#177;.154, <Mark2>p</Mark2>&#61;.016, <Mark2>R</Mark2><Superscript>2</Superscript>&#61;.187, <Mark2>F</Mark2>(1,59)&#61;4.353, <Mark2>p</Mark2>&#61;.041. DC was higher when participants indicated to have already worked in research, &#946;&#61;3.355&#177;1.229, <Mark2>p</Mark2>&#61;.008, <Mark2>R</Mark2><Superscript>2</Superscript>&#61;.314 <Mark2>F</Mark2>(1,68)&#61;7.448, <Mark2>p</Mark2>&#61;.008. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="3. Ergebnisse">
      <MainHeadline>3. Ergebnisse</MainHeadline><Pgraph>Wir schlossen 71 ausgef&#252;llte Frageb&#246;gen ein (siehe Tabelle 1 <ImgLink imgNo="1" imgType="table"/>). Der gesamte Datensatz wurde auf univariate Ausrei&#223;er gepr&#252;ft. Schiefe und W&#246;lbung lagen bei allen Variablen innerhalb der &#177;2 Spannweite &#91;34&#93;. Sofern folgend nicht anders angegeben, waren die Voraussetzungen f&#252;r <Mark2>t</Mark2>-Tests und Varianzanalysen erf&#252;llt.</Pgraph><SubHeadline2>3.1. Statistikverst&#228;ndnis und WDA </SubHeadline2><Pgraph>Der durchschnittliche SV-Score der 71 teilnehmenden &#196;rztInnen lag bei <Mark2>M</Mark2>&#61;17.58, <Mark2>SD</Mark2>&#61;6.92 (59&#37;), mit einer Spannweite von 5 bis 30 bei 30 erreichbaren Punkten. Die &#196;rztInnen bewerteten die vier Evidenzen im Durchschnitt &#252;bereinstimmend mit der Bewertung der Autoren, EB-Score: <Mark2>M</Mark2>&#61;7.75, <Mark2>SD</Mark2>&#61;1.85 (77&#37;). Die Bewertungen f&#252;r die Qualit&#228;t der Argumente entsprachen der jeweiligen Bewertung der Autoren, SZ-Score: <Mark2>M</Mark2>&#61;37.20, <Mark2>SD</Mark2>&#61;5.35 (62&#37;). Zwischen SV und SZ bestand eine signifikante, inverse Korrelation, <Mark2>r</Mark2>(71)&#61;-.272, <Mark2>p</Mark2>&#61;.022. Eine Korrelation zwischen SV und EB, <Mark2>r</Mark2>(71)&#61;.198, <Mark2>p</Mark2>&#61;.098 und zwischen EE und DC, <Mark2>r</Mark2>(71)&#61;.138, <Mark2>p</Mark2>&#61;.256 wurde jedoch nicht gefunden.</Pgraph><SubHeadline2>3.2. Entwicklung von F&#228;higkeiten</SubHeadline2><Pgraph>Wir untersuchten, wie, wo, und wann &#196;rztInnen wissenschaftliche F&#228;higkeiten entwickelten (siehe Abbildung 1 <ImgLink imgNo="1" imgType="figure"/>). Signifikant mehr Teilnehmende gaben an, wissenschaftliche F&#228;higkeiten autodidaktisch (<Mark2>M</Mark2>&#61;4.78, <Mark2>SD</Mark2>&#61;1.13, Likert-Skala von 1 bis 6) versus w&#228;hrend des Studiums (<Mark2>M</Mark2>&#61;2.31, <Mark2>SD</Mark2>&#61;1.46, Likert-Skala von 1 bis 6), <Mark2>t</Mark2>(71)&#61;-9.915, <Mark2>p</Mark2>&#60;.001 oder bei au&#223;ercurricul&#228;ren Aktivit&#228;ten (<Mark2>M</Mark2>&#61;3.34, <Mark2>SD</Mark2>&#61;1.87, Likert-Skala von 1 bis 6), <Mark2>t</Mark2>(71)&#61;4.673, <Mark2>p</Mark2>&#60;.001 erworben zu haben. In einem Freitextfeld erg&#228;nzten die Teilnehmenden verschiedene weitere Lerngelegenheiten, z. B. Massive Open Online Courses, Hochschulkurse, Seminare, und Lernen durch Peer-Reviews und Peer-Feedback (siehe Abbildung 2 <ImgLink imgNo="2" imgType="figure"/>). </Pgraph><Pgraph>Eine abgeschlossene oder in Arbeit befindliche medizinische Doktorarbeit zeigte keine Auswirkungen auf SV, EB, oder SZ. Diese Ergebnisse m&#252;ssen jedoch mit Vorsicht interpretiert werden, da in unserer Stichprobe, bei der nur vier Teilnehmende keine medizinische Dissertation vorzuweisen hatten, die Voraussetzungen f&#252;r eine Varianzanalyse nicht erf&#252;llt waren. Die F&#246;rderung des kritischen Hinterfragens von Studienergebnissen anderer Forscher bei der Vorbereitung der eigenen medizinischen Doktorarbeit zeigte eine positive Korrelation mit dem SV, <Mark2>r</Mark2>(71)&#61;.271, <Mark2>p</Mark2>&#61;.033. </Pgraph><Pgraph>Bez&#252;glich der postgradualen Phase zeigte eine einfaktorielle Varianzanalyse einen Haupteffekt der Forschungserfahrung, <Mark2>F</Mark2>(1,70)&#61;12.737, <Mark2>p</Mark2>&#61;.001, partielles &#951;<Superscript>2</Superscript>&#61;.156 und einen Haupteffekt der Art der Autorenschaft in Ver&#246;ffentlichungen, <Mark2>F</Mark2>(5,71)&#61;3.886, <Mark2>p</Mark2>&#61;.004, partielles &#951;<Superscript>2</Superscript>&#61;.230.</Pgraph><Pgraph>Die Zeit der T&#228;tigkeit in der Forschung korrelierte signifikant mit besserem SV, <Mark2>r</Mark2>(71)&#61;.28, <Mark2>p</Mark2>&#61;.018. Dasselbe galt f&#252;r die Anzahl der Ver&#246;ffentlichungen, <Mark2>r</Mark2>(71)&#61;.36, <Mark2>p</Mark2>&#61;.002.</Pgraph><Pgraph>Hinsichtlich des WDA ergaben lineare Regressionsmodelle, dass der entsprechende EB-Score um &#946;&#61;.314&#177;.150, <Mark2>p</Mark2>&#61;.041 anstieg, wenn der Likert-Wert der inhaltlichen Unterst&#252;tzung durch den Doktorvater bzw. die Doktormutter um einen Punkt anstieg. Zus&#228;tzlich korrelierte die Art der medizinischen Dissertation (experimentell, klinisch, empirisch, statistisch, oder Literaturstudie) mit dem EB-Score, wobei ein experimentelles und klinisches Design positiv mit dem EB-Score in Zusammenhang stand, &#946;&#61;-.380&#177;.154, <Mark2>p</Mark2>&#61;.016, <Mark2>R</Mark2><Superscript>2</Superscript>&#61;.187, <Mark2>F</Mark2>(1,59)&#61;4.353, <Mark2>p</Mark2>&#61;.041. Der SZ-Score war h&#246;her, wenn die Teilnehmenden angaben, bereits in der Forschung gearbeitet zu haben, &#946;&#61;3.355&#177;1.229, <Mark2>p</Mark2>&#61;.008, <Mark2>R</Mark2><Superscript>2</Superscript>&#61;.314, <Mark2>F</Mark2>(1,68)&#61;7.448, <Mark2>p</Mark2>&#61;.008. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="4. Discussion">
      <MainHeadline>4. Discussion</MainHeadline><SubHeadline2>4.1. Research question 1: Statistical literacy and SRA skills</SubHeadline2><Pgraph>We found average statistical literacy of physicians (59&#37;), a rather high-level EE score (77&#37;) and a medium-level DC score (62&#37;). SL did not predict the SRA skills of physicians.  </Pgraph><Pgraph>Due to the focus on SL rather than the combination of basic numeracy and SL <TextLink reference="27"></TextLink>, our test instrument discriminated well, and we did not find any ceiling effects as observed in other educated samples <TextLink reference="7"></TextLink>, <TextLink reference="35"></TextLink>. A comparison to other studies assessing SL of physicians is not easily done as every test covers a different range of SL. Schmidt et al. (2017) focused on knowledge of 18 different statistical tests among pathologists and observed a rather low level of SL <TextLink reference="36"></TextLink>. Anderson et al. (2014) did not create an overall score but distinguished between fact, concept, and relation questions and found altering levels of SL <TextLink reference="7"></TextLink>. A study with Greek residents also concentrated on knowledge questions and reported a rather low SL <TextLink reference="26"></TextLink>. The EE and DC scores of German medical students we had previously examined with a similar instrument <TextLink reference="27"></TextLink> were almost on the same level as the physicians&#8217; scores in the present study. Riegelman and Hoveland (2012) found that residents struggled when critical reflection upon research was required <TextLink reference="37"></TextLink>, whereas the physicians in our study showed medium to high levels of SRA skills. </Pgraph><Pgraph>EE and SL scores were not correlated. DC and SL were inversely correlated. In contextual frameworks, SL has been regarded as a prerequisite for SRA <TextLink reference="38"></TextLink> and in a Dutch community-based study, more numerate participants showed enhanced performance in SRA due to increased evaluation of pros and cons in decision-making and evaluation of judgments <TextLink reference="39"></TextLink>. As evidence has not been predominantly presented in numerical or statistical terms, the missing link of EE and SL was expected, but the antithetical relationship of DC and SL was not. Future research could incorporate statistical information in decision scenarios in order to further analyze this connection in practicing physicians. </Pgraph><SubHeadline2>4.2. Research question 2: Education and skills development</SubHeadline2><Pgraph>We explored how, where, and when physicians developed SL and SRA skills. They indicated to have acquired scientific skills mostly in an autodidactic manner, in higher education outside of their medical study program, or in extracurricular activities. </Pgraph><Pgraph>Better SL was associated with the fostering of critical scrutiny of study results during the time spent working on the MD-thesis, in research or having worked in research, the number of publications, and the type of authorship. Our findings are in line with Schmidt et al. (2017), who found that having an advanced degree other than MD or statistic courses were positively associated with SL. A study with physicians, residents, and final year medical students in Thailand showed &#8211; not surprisingly &#8211; that having recently completed a statistical workshop led to higher SL scores <TextLink reference="40"></TextLink>. However, additional courses are often hard to integrate in medical training. A study showed that 37&#37; of American Ob-Gyn residents do not receive formal training <TextLink reference="16"></TextLink>, while another study with neurology residents observed a lack of acceptance for interventions on SL <TextLink reference="41"></TextLink>. </Pgraph><Pgraph>In the present study, better EE was associated with having been responsible for a research project (e.g. the MD-thesis) with experimental or clinical design and having content-related support by the supervisor. These findings are in line with the subjective impression of German medical graduates with a MD-thesis who rated their scientific skills higher compared to those working on it <TextLink reference="29"></TextLink>. However, the participants in the study by Epstein et al. (2018) did not feel confident enough to conduct research on their own. This is particularly important because having already worked in research was associated with a higher SL and DC score in the present study and in Schmidt et al. (2017). Moreover, Epstein et al. (2018) found that medical graduates self-estimate their scientific skills after medical school as rather low. In the United States, only 68.1&#37; of medical students in their final year participated in research during medical school and only 42&#37; had (co-)authored a paper submitted for publication. It seems important that medical students become involved in research projects and the subsequent publication of findings during the completion of their MD-thesis, as this might enhance their SL and SRA skills in the long run. </Pgraph><SubHeadline2>4.3. Strengths and limitations </SubHeadline2><Pgraph>This study built upon an innovative approach by the authors to assess SL and SRA skills in university students <TextLink reference="27"></TextLink>. The inclusive approach of SL assessment allowed a better description of the actual skills. However, it comes with the disadvantage of limited comparability with prior research. As the participant group of practicing physicians is not easily recruited, we considered the sample size of <Mark2>N</Mark2>&#61;71 to be satisfactory. While generalizability is potentially limited, our sample seems representative for the German-speaking medical education system which produces large numbers of medical doctoral degrees. The addition of numerous demographic variables yielded insights on how, where, and when scientific skills were acquired and helped to identify potential associated factors. </Pgraph><Pgraph>Due to the broad age range in our sample, participants may have been exposed to different learning experiences in formal medical training and, depending on the place of study, may also have studied in reformed curricula. This could potentially have influenced their skills development and lead to further individual differences. In our study, we did not gather data on specific study programs, courses, and their descriptions, in which physicians might have acquired their skills. Already, the test instrument used in this study may be considered extensive and time consuming for physicians, as was indicated by 11 participants in their feedback. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="4. Diskussion">
      <MainHeadline>4. Diskussion</MainHeadline><SubHeadline2>4.1. Forschungsfrage 1: Statistikverst&#228;ndnis und WDA</SubHeadline2><Pgraph>Wir fanden bei &#196;rztInnen einen durchschnittlichen SV-Score (59&#37;), einen relativ hohen EB-Score (77&#37;) und einen mittleren SZ-Score (62&#37;). Der SV-Score gab keinen Aufschluss &#252;ber die WDA-F&#228;higkeiten von &#196;rztInnen.</Pgraph><Pgraph>Durch den Fokus auf SV und nicht auf die Kombination von grundlegenden Zahlenverst&#228;ndnis und SV <TextLink reference="27"></TextLink> differenzierte unser Testinstrument gut und es konnten keine Deckeneffekte, wie sie in anderen akademischen Stichproben beobachtet wurden <TextLink reference="7"></TextLink>, <TextLink reference="35"></TextLink>, nachgewiesen werden. Ein Vergleich mit anderen Studien, die das SV von &#196;rztInnen beurteilen, ist nicht einfach, da jeder Test einen unterschiedlichen SV-Bereich abdeckt. Schmidt et al. (2017) untersuchten bei PathologInnen das Wissen zu 18 verschiedenen statistischen Tests und fanden ein relativ niedriges SV <TextLink reference="36"></TextLink>. Anderson et al. (2014) erstellten keinen Gesamtscore, sondern unterschieden zwischen Fakten-, Konzept- und Relationsfragen und ermittelten unterschiedliche Niveaus von SV <TextLink reference="7"></TextLink>. Eine Studie mit Assistenz&#228;rztInnen in Griechenland konzentrierte sich ebenfalls auf Wissensfragen und berichtete ein relativ niedriges SV-Niveau <TextLink reference="26"></TextLink>. Die EB- und SZ-Scores der deutschen Medizinstudierenden, die wir zuvor mit einem &#228;hnlichen Instrument untersucht hatten <TextLink reference="27"></TextLink>, lagen fast auf dem gleichen Niveau wie die Scores der &#196;rztInnen in der vorliegenden Studie. Riegelman und Hoveland (2012) fanden heraus, dass Assistenz&#228;rztInnen Probleme hatten, wenn kritische Reflexion zu Forschungsinhalten erforderlich war <TextLink reference="37"></TextLink>, w&#228;hrend die &#196;rztInnen in unserer Studie mittlere bis hohe WDA-F&#228;higkeiten zeigten. </Pgraph><Pgraph>Zwischen EB- und SV-Scores bestand keine Korrelation. Zwischen SZ und SV fanden wir eine inverse Korrelation. In kontextuellen Rahmenmodellen wurde SV als Voraussetzung f&#252;r WDA angesehen <TextLink reference="38"></TextLink>. In einer niederl&#228;ndischen, auf die Allgemeinbev&#246;lkerung bezogenen Studie, zeigten die Teilnehmenden mit h&#246;herem Zahlenverst&#228;ndnis besseres WDA, das sich aus einer st&#228;rkeren Abw&#228;gung von Vor- und Nachteilen bei der Entscheidungsfindung und genaueren Bewertung der eigenen Einsch&#228;tzungen ergab <TextLink reference="39"></TextLink>. Da die Informationen der vier Evidenzen in unserer Studie nicht vorwiegend numerisch oder statistisch dargestellt wurden, war von der fehlenden Verkn&#252;pfung zwischen EB und SV auszugehen, jedoch nicht von der gegens&#228;tzlichen Beziehung von SZ und SV. K&#252;nftige Forschung k&#246;nnte statistische Informationen in Entscheidungsszenarien inkludieren, um diesen Zusammenhang bei praktizierenden &#196;rztInnen genauer zu analysieren.</Pgraph><SubHeadline2>4.2. Forschungsfrage 2: Entwicklung von SV und WDA</SubHeadline2><Pgraph>Wir untersuchten, wie, wo, und wann &#196;rztInnen SV und WDA-F&#228;higkeiten entwickelten. Sie gaben an, wissenschaftliche F&#228;higkeiten meist autodidaktisch, in Universit&#228;tsseminaren au&#223;erhalb des Medizinstudiums, oder in au&#223;ercurricul&#228;ren Aktivit&#228;ten erworben zu haben. </Pgraph><Pgraph>Besseres SV korrelierte mit der F&#246;rderung der kritischen Reflexion von Studienergebnissen w&#228;hrend der medizinischen Promotion, Arbeit in der Forschung oder mit fr&#252;herer Forschungserfahrung, sowie mit der Anzahl von Ver&#246;ffentlichungen und der Art der Autorenschaft. Unsere Ergebnisse stehen im Einklang mit den Ergebnissen von Schmidt et al. (2017), denen zufolge andere Weiterqualifikationen oder absolvierte Statistikkurse &#252;ber das Medizinstudium hinaus, positiv mit dem SV korrelierten. Eine Studie mit &#196;rztInnen, Assistenz&#228;rztInnen und Medizinstudierenden im Praktischen Jahr in Thailand zeigte wenig &#252;berraschend, dass ein k&#252;rzlich absolviertes Statistikseminar zu h&#246;heren SV-Scores f&#252;hrte <TextLink reference="40"></TextLink>. Zusatzkurse lassen sich allerdings oft nur schwer in die medizinische Ausbildung integrieren. Eine Studie zeigte, dass 37&#37; der amerikanischen Assistenz&#228;rztInnen im Bereich Gyn&#228;kologie und Geburtshilfe keine formale Statistikausbildung erhalten <TextLink reference="16"></TextLink>, w&#228;hrend eine andere Studie mit Assistenz&#228;rztInnen im Bereich Neurologie eine mangelnde Akzeptanz hinsichtlich statistikbezogener Fortbildungsma&#223;nahmen beobachtete <TextLink reference="41"></TextLink>. </Pgraph><Pgraph>In der vorliegenden Studie fand sich ein Zusammenhang zwischen besserem EB-Score und entsprechender Verantwortungserfahrung f&#252;r ein Forschungsprojekt (z.B. die medizinische Doktorarbeit) mit experimentellem oder klinischem Design sowie wenn eine gute inhaltliche Unterst&#252;tzung durch den Doktorvater bzw. die Doktormutter bestanden hatte. Diese Erkenntnis deckt sich mit dem subjektiven Eindruck deutscher promovierter Medizinabsolventen, die ihre wissenschaftlichen F&#228;higkeiten h&#246;her einsch&#228;tzen als noch an der Promotion arbeitende AbsolventInnen <TextLink reference="29"></TextLink>. Die Teilnehmenden der Studie von Epstein et al. (2018) f&#252;hlten sich jedoch f&#252;r eigene Forschungst&#228;tigkeiten nicht sicher genug. Dies erscheint besonders wichtig, da vorhandene Forschungserfahrung in der vorliegenden Studie und bei Schmidt et al. (2017) mit einem h&#246;heren SV und SZ-Score korrelierte. Dar&#252;ber hinaus fanden Epstein et al. (2018) heraus, dass Medizinabsolventen ihre wissenschaftlichen F&#228;higkeiten nach dem Medizinstudium selbst als relativ gering einstufen. In den USA waren nur 68,1&#37; der Medizinstudierenden in ihrem letzten Jahr w&#228;hrend des Medizinstudiums an Forschungsprojekten beteiligt, und nur 42&#37; waren Autoren bzw. Koautoren einer zur Ver&#246;ffentlichung eingereichten Arbeit. Es erscheint wichtig, dass Medizinstudierende w&#228;hrend der Promotion in weitere Forschungsprojekte und die anschlie&#223;ende Ver&#246;ffentlichung der Ergebnisse eingebunden werden, da dies langfristig ihr SV und WDA verbessern k&#246;nnte. </Pgraph><SubHeadline2>4.3. St&#228;rken und Grenzen </SubHeadline2><Pgraph>Diese Studie baute auf einem innovativen Ansatz der Autoren zur Messung von SV und WDA bei Universit&#228;tsstudierenden <TextLink reference="27"></TextLink> auf. Der integrative Ansatz der Messung des SV erlaubte eine bessere Beschreibung der realen F&#228;higkeiten. Allerdings besteht hier der Nachteil einer eingeschr&#228;nkten Vergleichbarkeit mit fr&#252;heren Forschungsarbeiten. Da die Teilnehmendengruppe der praktizierenden &#196;rztInnen nicht leicht zu rekrutieren war, hielten wir die Stichprobengr&#246;&#223;e von <Mark2>N</Mark2>&#61;71 f&#252;r zufriedenstellend. Obwohl die Generalisierbarkeit potenziell begrenzt ist, ist unsere Stichprobe repr&#228;sentativ f&#252;r den deutschsprachigen Raum, in dessen medizinischen Ausbildungssystem eine gro&#223;e Anzahl medizinischer Doktortitel erworben wird. Die zus&#228;tzliche Ber&#252;cksichtigung zahlreicher demografischer Variablen lieferte Aufschluss dar&#252;ber, wie, wo, und wann wissenschaftliche F&#228;higkeiten erworben wurden und erm&#246;glichte die Identifikation potenzieller einflussnehmender Faktoren.  </Pgraph><Pgraph>Aufgrund des breiten Altersspektrums unserer Stichprobe ist davon auszugehen, dass die Teilnehmenden unterschiedliche Lernerfahrungen in der formalen medizinischen Ausbildung gemacht haben und je nach Studienort auch in reformierten Medizinstudieng&#228;ngen studiert haben. Dies k&#246;nnte sich auf die Entwicklung der untersuchten F&#228;higkeiten ausgewirkt haben und weitere individuelle Unterschiede beg&#252;nstigen. In unserer Studie wurden keine Daten &#252;ber spezifische Studienprogramme, Seminare und die zugeh&#246;rigen Beschreibungen erhoben, in denen die &#196;rztInnen m&#246;glicherweise ihre F&#228;higkeiten erworben haben. Dies ist dem Umstand geschuldet, dass das in dieser Studie verwendete Testmaterial im Feedback von 11 teilnehmenden &#196;rztInnen bereits als sehr umfangreich und zeitaufwendig bewertet wurde.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="5. Conclusion">
      <MainHeadline>5. Conclusion</MainHeadline><Pgraph>We assessed SL and SRA skills in German-speaking physicians together with a thorough analysis of demographic variables. The active involvement in research apparently plays an important role in the development of these skills and might in consequence enhance evidence-based practice. As most participants indicated to have acquired these skills post-graduate and in an autodidactic manner, we argue to formalize and intensify the acquisition of these skills in medical study programs. Medical education curricula should include more statistical training and aim to get students involved in research more often, e.g. by offering inquiry-based learning <TextLink reference="42"></TextLink> where students conduct research projects independently and are fully responsible for all phases of the research process.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="5. Schlussfolgerung">
      <MainHeadline>5. Schlussfolgerung</MainHeadline><Pgraph>Wir untersuchten SV und WDA bei deutschsprachigen &#196;rztInnen und nahmen in diesem Zusammenhang eine eingehende Analyse demografischer Variablen vor. Die aktive Beteiligung an Forschung spielt offenbar eine wichtige Rolle bei der Entwicklung dieser F&#228;higkeiten und k&#246;nnte als Konsequenz eine Verbesserung der evidenzbasierten Praxis nach sich ziehen. Da die meisten Teilnehmenden angaben diese F&#228;higkeiten postgradual und autodidaktisch erworben zu haben, pl&#228;dieren wir daf&#252;r, den Erwerb dieser F&#228;higkeiten im Rahmen des Medizinstudiums zu formalisieren und zu intensivieren. Die Lehrpl&#228;ne der medizinischen Ausbildung sollten mehr statistisches Training beinhalten und darauf abzielen, Studierende h&#228;ufiger in aktive Forschung einzubeziehen, z. B. durch das Angebot von forschendem Lernen <TextLink reference="42"></TextLink>, bei dem die Studierenden eigenst&#228;ndig Forschungsprojekte durchf&#252;hren und f&#252;r alle Phasen des Forschungsprozesses in vollem Umfang verantwortlich sind.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Funding">
      <MainHeadline>Funding</MainHeadline><Pgraph>This work was supported by the German Federal Ministry of Education and Research (BMBF, grant no. 01PB14004C) and an intramural grant of the F&#246;rderverein WiFoMed of the Medical Faculty of LMU Munich. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="F&#246;rderung">
      <MainHeadline>F&#246;rderung</MainHeadline><Pgraph>Diese Arbeit wurde vom Bundesministerium f&#252;r Bildung und Forschung (BMBF, F&#246;rderkennzeichen 01PB14004C) und durch ein internes F&#246;rderprogramm des F&#246;rdervereins WiFoMed der Medizinischen Fakult&#228;t der LMU M&#252;nchen unterst&#252;tzt. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Acknowledgements">
      <MainHeadline>Acknowledgements</MainHeadline><Pgraph>The authors would also like to thank Wolfgang Gaissmaier for his valuable comments and suggestions to the present study.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Danksagung">
      <MainHeadline>Danksagung</MainHeadline><Pgraph>Die Autor&#42;innen bedanken sich au&#223;erdem bei Wolfgang Gaissmaier f&#252;r seine wertvollen Anmerkungen und Anregungen zur vorliegenden Studie.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Competing interests">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Interessenkonflikt">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autor&#42;innen erkl&#228;ren, dass sie keinen Interessenkonflikt im Zusammenhang mit diesem Artikel haben.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Reyna VF</RefAuthor>
        <RefAuthor>Nelson WL</RefAuthor>
        <RefAuthor>Han PK</RefAuthor>
        <RefAuthor>Dieckmann NF</RefAuthor>
        <RefTitle>How numeracy influences risk comprehension and medical decision making</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Psychol Bull</RefJournal>
        <RefPage>943-973</RefPage>
        <RefTotal>Reyna VF, Nelson WL, Han PK, Dieckmann NF. How numeracy influences risk comprehension and medical decision making. Psychol Bull. 2009;135(6):943-973. DOI: 10.1037&#47;a0017327</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1037&#47;a0017327</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Nelson W</RefAuthor>
        <RefAuthor>Reyna VF</RefAuthor>
        <RefAuthor>Fagerlin A</RefAuthor>
        <RefAuthor>Lipkus I</RefAuthor>
        <RefAuthor>Peters E</RefAuthor>
        <RefTitle>Clinical implications of numeracy: theory and practice</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Ann Behav Med</RefJournal>
        <RefPage>261-274</RefPage>
        <RefTotal>Nelson W, Reyna VF, Fagerlin A, Lipkus I, Peters E. Clinical implications of numeracy: theory and practice. Ann Behav Med. 2008;35(3):261-274. DOI: 10.1007&#47;s12160-008-9037-8</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s12160-008-9037-8</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Sackett DL</RefAuthor>
        <RefAuthor>Rosenberg WM</RefAuthor>
        <RefAuthor>Gray JA</RefAuthor>
        <RefAuthor>Haynes RB</RefAuthor>
        <RefAuthor>Richardson WS</RefAuthor>
        <RefTitle>Was ist Evidenz-basierte Medizin und was nicht&#63;</RefTitle>
        <RefYear>1997</RefYear>
        <RefJournal>M&#252;nch Med Wochenschr</RefJournal>
        <RefPage>28-29</RefPage>
        <RefTotal>Sackett DL, Rosenberg WM, Gray JA, Haynes RB, Richardson WS. Was ist Evidenz-basierte Medizin und was nicht&#63; M&#252;nch Med Wochenschr. 1997;139(44):28-29. DOI: 10.1055&#47;b-0036-140841</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1055&#47;b-0036-140841</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Gigerenzer G</RefAuthor>
        <RefAuthor>Gaissmaier W</RefAuthor>
        <RefAuthor>Kurz-Milcke E</RefAuthor>
        <RefAuthor>Schwartz LM</RefAuthor>
        <RefAuthor>Woloshin S</RefAuthor>
        <RefTitle>Helping Doctors and Patients Make Sense of Health Statistics</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Psychol Sci Public Interest</RefJournal>
        <RefPage>53-96</RefPage>
        <RefTotal>Gigerenzer G, Gaissmaier W, Kurz-Milcke E, Schwartz LM, Woloshin S. Helping Doctors and Patients Make Sense of Health Statistics. Psychol Sci Public Interest. 2008;8(2):53-96. DOI: 10.1111&#47;j.1539-6053.2008.00033.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1539-6053.2008.00033.x</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Shield M</RefAuthor>
        <RefTitle>Statistical literacy: thinking critically about statistics</RefTitle>
        <RefYear>1999</RefYear>
        <RefJournal>Significance</RefJournal>
        <RefPage>15-20</RefPage>
        <RefTotal>Shield M. Statistical literacy: thinking critically about statistics. Significance. 1999;1(1):15-20.</RefTotal>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Peters E</RefAuthor>
        <RefTitle>Beyond Comprehension: The Role of Numeracy in Judgments and Decisions</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Curr Dir Psychol Sci</RefJournal>
        <RefPage>31-35</RefPage>
        <RefTotal>Peters E. Beyond Comprehension: The Role of Numeracy in Judgments and Decisions. Curr Dir Psychol Sci. 2012;21(1):31-35. DOI: 10.1177&#47;0963721411429960</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1177&#47;0963721411429960</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Anderson BL</RefAuthor>
        <RefAuthor>Gigerenzer G</RefAuthor>
        <RefAuthor>Parker S</RefAuthor>
        <RefAuthor>Schulkin J</RefAuthor>
        <RefTitle>Statistical literacy in obstetricians and gynecologists</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>J Healthc Qual</RefJournal>
        <RefPage>5-17</RefPage>
        <RefTotal>Anderson BL, Gigerenzer G, Parker S, Schulkin J. Statistical literacy in obstetricians and gynecologists. J Healthc Qual. 2014;36(1):5-17. DOI: 10.1111&#47;j.1945-1474.2011.00194.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1945-1474.2011.00194.x</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Walker HM</RefAuthor>
        <RefTitle>Statistical literacy on the social science</RefTitle>
        <RefYear>1951</RefYear>
        <RefJournal>Am Stat</RefJournal>
        <RefPage>6-12</RefPage>
        <RefTotal>Walker HM. Statistical literacy on the social science. Am Stat. 1951;5(1):6-12. DOI: 10.1080&#47;00031305.1951.10481912</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;00031305.1951.10481912</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Wallman KK</RefAuthor>
        <RefTitle>Enhancing statistical literacy: enriching our society</RefTitle>
        <RefYear>1993</RefYear>
        <RefJournal>J Am Statl Ass</RefJournal>
        <RefPage>1-8</RefPage>
        <RefTotal>Wallman KK. Enhancing statistical literacy: enriching our society. J Am Statl Ass. 1993;88(421):1-8. DOI: 10.1080&#47;01621459.1993.10594283</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;01621459.1993.10594283</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Ben-Zvi D</RefAuthor>
        <RefAuthor>Garfield J</RefAuthor>
        <RefTitle>Statistical literacy, reasoning, and thinking: Goals, definitions, and challenges</RefTitle>
        <RefYear>2004</RefYear>
        <RefBookTitle>The challenge of developing statistical literacy, reasoning and thinking</RefBookTitle>
        <RefPage>3-25</RefPage>
        <RefTotal>Ben-Zvi D, Garfield J. Statistical literacy, reasoning, and thinking: Goals, definitions, and challenges. In: Ben-Zvi D, Garfield J, editors. The challenge of developing statistical literacy, reasoning and thinking. Dordrecht, The Netherlands: Kluwer; 2004. p.3-25. DOI: 10.1007&#47;1-4020-2278-6</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;1-4020-2278-6</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Watson JM</RefAuthor>
        <RefTitle>Assessing Statistical Thinking Using the Media</RefTitle>
        <RefYear>1997</RefYear>
        <RefBookTitle>The Assessment Challenge in Statistics Education</RefBookTitle>
        <RefPage>107-121</RefPage>
        <RefTotal>Watson JM. Assessing Statistical Thinking Using the Media. In: Gal I, Garfield JB, editors. The Assessment Challenge in Statistics Education. Amsterdam: IOS Press and The International Statistical Institute; 1997. p.107-121.</RefTotal>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Sedlmeier P</RefAuthor>
        <RefAuthor>Gigerenzer G</RefAuthor>
        <RefTitle>Teaching Bayesian Reasoning in Less Than Two Hours</RefTitle>
        <RefYear>2001</RefYear>
        <RefJournal>J Exp Psychol Gen</RefJournal>
        <RefPage>380-400</RefPage>
        <RefTotal>Sedlmeier P, Gigerenzer G. Teaching Bayesian Reasoning in Less Than Two Hours. J Exp Psychol Gen. 2001;130(3):380-400. DOI: 10.1037&#47;0096-3445.130.3.380</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1037&#47;0096-3445.130.3.380</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Fischer F</RefAuthor>
        <RefAuthor>Kollar I</RefAuthor>
        <RefAuthor>Ufer S</RefAuthor>
        <RefAuthor>Sodian B</RefAuthor>
        <RefAuthor>Hussmann H</RefAuthor>
        <RefAuthor>Pekrun R</RefAuthor>
        <RefAuthor>Neuhaus B</RefAuthor>
        <RefAuthor>Dorner B</RefAuthor>
        <RefAuthor>Pankofer S</RefAuthor>
        <RefAuthor>Fischer M</RefAuthor>
        <RefAuthor>Strijbos JW</RefAuthor>
        <RefAuthor>Heene M</RefAuthor>
        <RefAuthor>Eberle J</RefAuthor>
        <RefTitle>Scientific Reasoning and Argumentation: Advancing an Interdisciplinary Research Agenda in Education</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>Front Learn Res</RefJournal>
        <RefPage>28-45</RefPage>
        <RefTotal>Fischer F, Kollar I, Ufer S, Sodian B, Hussmann H, Pekrun R, Neuhaus B, Dorner B, Pankofer S, Fischer M, Strijbos JW, Heene M, Eberle J. Scientific Reasoning and Argumentation: Advancing an Interdisciplinary Research Agenda in Education. Front Learn Res. 2014;2(3):28-45. DOI: 10.14786&#47;flr.v2i2.96</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.14786&#47;flr.v2i2.96</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Hetmanek A</RefAuthor>
        <RefAuthor>Engelmann K</RefAuthor>
        <RefAuthor>Opitz A</RefAuthor>
        <RefAuthor>Fischer F</RefAuthor>
        <RefTitle>Beyond intelligence and domain knowledge: Scientific reasoning and argumentation as a set of cross-domain skills</RefTitle>
        <RefYear>2018</RefYear>
        <RefBookTitle>Scientific reasoning and argumentation: The roles of domain-specific and domain-general knowledge</RefBookTitle>
        <RefPage>203-226</RefPage>
        <RefTotal>Hetmanek A, Engelmann K, Opitz A, Fischer F. Beyond intelligence and domain knowledge: Scientific reasoning and argumentation as a set of cross-domain skills. In: Fischer F, Chinn CA, Engelmann K, Osborne J, editors. Scientific reasoning and argumentation: The roles of domain-specific and domain-general knowledge. New York: Routledge; 2018. p.203-226.</RefTotal>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>Rudolph JL</RefAuthor>
        <RefAuthor>Horibe S</RefAuthor>
        <RefTitle>What do we mean by science education for civic engagement&#63;</RefTitle>
        <RefYear>2016</RefYear>
        <RefJournal>J Res Sci Teach</RefJournal>
        <RefPage>805-820</RefPage>
        <RefTotal>Rudolph JL, Horibe S. What do we mean by science education for civic engagement&#63; J Res Sci Teach. 2016;53(6):805-820. DOI: 10.1002&#47;tea.21303</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1002&#47;tea.21303</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Anderson BL</RefAuthor>
        <RefAuthor>Williams S</RefAuthor>
        <RefAuthor>Schulkin J</RefAuthor>
        <RefTitle>Statistical literacy of obstetrics-gynecology residents</RefTitle>
        <RefYear>2013</RefYear>
        <RefJournal>J Grad Med Educ</RefJournal>
        <RefPage>272-275</RefPage>
        <RefTotal>Anderson BL, Williams S, Schulkin J. Statistical literacy of obstetrics-gynecology residents. J Grad Med Educ. 2013;5(2):272-275. DOI: 10.4300&#47;JGME-D-12-00161.1</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.4300&#47;JGME-D-12-00161.1</RefLink>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Franklin C</RefAuthor>
        <RefAuthor>Kader G</RefAuthor>
        <RefAuthor>Mewborn D</RefAuthor>
        <RefAuthor>Moreno J</RefAuthor>
        <RefAuthor>Peck</RefAuthor>
        <RefAuthor>R</RefAuthor>
        <RefAuthor>Perry M</RefAuthor>
        <RefAuthor>Schaeffler R</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2005</RefYear>
        <RefBookTitle>Guidelines for Assessment and Instruction in Statistics Education (GAISE) report: A Pre-K-12 curriculum framework</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Franklin C, Kader G, Mewborn D, Moreno J, Peck, R, Perry M, Schaeffler R. Guidelines for Assessment and Instruction in Statistics Education (GAISE) report: A Pre-K-12 curriculum framework. Alexandria: VA: American Statistical Association; 2005.</RefTotal>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Lipkus IM</RefAuthor>
        <RefAuthor>Samsa G</RefAuthor>
        <RefAuthor>Rimer BK</RefAuthor>
        <RefTitle>General performance on a numeracy scale among highly educated samples</RefTitle>
        <RefYear>2001</RefYear>
        <RefJournal>Med Decis Making</RefJournal>
        <RefPage>37-44</RefPage>
        <RefTotal>Lipkus IM, Samsa G, Rimer BK. General performance on a numeracy scale among highly educated samples. Med Decis Making. 2001;21(1):37-44. DOI: 10.1177&#47;0272989X0102100105</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1177&#47;0272989X0102100105</RefLink>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Monahan J</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2007</RefYear>
        <RefBookTitle>Statistical literacy: A prerequisite for evidence-based medicine</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Monahan J. Statistical literacy: A prerequisite for evidence-based medicine. Los Angeles, CA: SAGE Publications Sage; 2007.</RefTotal>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Windish DM</RefAuthor>
        <RefAuthor>Huot SJ</RefAuthor>
        <RefAuthor>Green ML</RefAuthor>
        <RefTitle>Medicine residents&#39; understanding of the biostatistics and results in the medical literature</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>JAMA</RefJournal>
        <RefPage>1010-1022</RefPage>
        <RefTotal>Windish DM, Huot SJ, Green ML. Medicine residents&#39; understanding of the biostatistics and results in the medical literature. JAMA. 2007;298(9):1010-1022. DOI: 10.1001&#47;jama.298.9.1010</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1001&#47;jama.298.9.1010</RefLink>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Gigerenzer G</RefAuthor>
        <RefAuthor>Wegwarth O</RefAuthor>
        <RefTitle>Risikoabsch&#228;tzung in der Medizin am Beispiel der Krebsfr&#252;herkennung</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Z Evid Fortbild Qual Gesundheitswes</RefJournal>
        <RefPage>513-519</RefPage>
        <RefTotal>Gigerenzer G, Wegwarth O. Risikoabsch&#228;tzung in der Medizin am Beispiel der Krebsfr&#252;herkennung. Z Evid Fortbild Qual Gesundheitswes. 2008;102(9):513-519. DOI: 10.1016&#47;j.zefq.2008.09.008</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;j.zefq.2008.09.008</RefLink>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Schwartz LM</RefAuthor>
        <RefAuthor>Woloshin S</RefAuthor>
        <RefAuthor>Welch HG</RefAuthor>
        <RefTitle>Can patients interpret health information&#63; An assessment of the medical data interpretation test</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Med Decis Making</RefJournal>
        <RefPage>290-300</RefPage>
        <RefTotal>Schwartz LM, Woloshin S, Welch HG. Can patients interpret health information&#63; An assessment of the medical data interpretation test. Med Decis Making. 2005;25(3):290-300. DOI: 10.1177&#47;0272989X05276860</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1177&#47;0272989X05276860</RefLink>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Cokely ET</RefAuthor>
        <RefAuthor>Galesic M</RefAuthor>
        <RefAuthor>Schulz E</RefAuthor>
        <RefAuthor>Ghazal S</RefAuthor>
        <RefAuthor>Garcia-Retamero R</RefAuthor>
        <RefTitle>Measuring Risk Literacy: The Berlin Numeracy Test</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Judgment Dec Making</RefJournal>
        <RefPage>25-47</RefPage>
        <RefTotal>Cokely ET, Galesic M, Schulz E, Ghazal S, Garcia-Retamero R. Measuring Risk Literacy: The Berlin Numeracy Test. Judgment Dec Making. 2012;7(1):25-47. DOI: 10.1037&#47;t45862-000</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1037&#47;t45862-000</RefLink>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>Okamoto M</RefAuthor>
        <RefAuthor>Kyutoku Y</RefAuthor>
        <RefAuthor>Sawada M</RefAuthor>
        <RefAuthor>Clowney L</RefAuthor>
        <RefAuthor>Watanabe E</RefAuthor>
        <RefAuthor>Dan I</RefAuthor>
        <RefAuthor>Kawamoto K</RefAuthor>
        <RefTitle>Health numeracy in Japan: measures of basic numeracy account for framing bias in a highly numerate population</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>BMC Med Inform Decis Mak</RefJournal>
        <RefPage>104</RefPage>
        <RefTotal>Okamoto M, Kyutoku Y, Sawada M, Clowney L, Watanabe E, Dan I, Kawamoto K. Health numeracy in Japan: measures of basic numeracy account for framing bias in a highly numerate population. BMC Med Inform Decis Mak. 2012;12:104. DOI: 10.1186&#47;1472-6947-12-104</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;1472-6947-12-104</RefLink>
      </Reference>
      <Reference refNo="25">
        <RefAuthor>Johnson TV</RefAuthor>
        <RefAuthor>Abbasi A</RefAuthor>
        <RefAuthor>Schoenberg ED</RefAuthor>
        <RefAuthor>Kellum R</RefAuthor>
        <RefAuthor>Speake LD</RefAuthor>
        <RefAuthor>Spiker C</RefAuthor>
        <RefAuthor>Foust A</RefAuthor>
        <RefAuthor>Kreps A</RefAuthor>
        <RefAuthor>Ritenour CW</RefAuthor>
        <RefAuthor>Brawleya OW</RefAuthor>
        <RefAuthor>Master VA</RefAuthor>
        <RefTitle>Numeracy among trainees: are we preparing physicians for evidence-based medicine&#63;</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>J Surg Educ</RefJournal>
        <RefPage>211-215</RefPage>
        <RefTotal>Johnson TV, Abbasi A, Schoenberg ED, Kellum R, Speake LD, Spiker C, Foust A, Kreps A, Ritenour CW, Brawleya OW, Master VA. Numeracy among trainees: are we preparing physicians for evidence-based medicine&#63; J Surg Educ. 2014;71(2):211-215. DOI: 10.1016&#47;j.jsurg.2013.07.013</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;j.jsurg.2013.07.013</RefLink>
      </Reference>
      <Reference refNo="26">
        <RefAuthor>Msaouel P</RefAuthor>
        <RefAuthor>Kappos T</RefAuthor>
        <RefAuthor>Tasoulis A</RefAuthor>
        <RefAuthor>Apostolopoulos AP</RefAuthor>
        <RefAuthor>Lekkas I</RefAuthor>
        <RefAuthor>Tripodaki ES</RefAuthor>
        <RefAuthor>Keramaris NC</RefAuthor>
        <RefTitle>Assessment of cognitive biases and biostatistics knowledge of medical residents: a multicenter, cross-sectional questionnaire study</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>Med Educ Online</RefJournal>
        <RefPage>23646</RefPage>
        <RefTotal>Msaouel P, Kappos T, Tasoulis A, Apostolopoulos AP, Lekkas I, Tripodaki ES, Keramaris NC. Assessment of cognitive biases and biostatistics knowledge of medical residents: a multicenter, cross-sectional questionnaire study. Med Educ Online. 2014;19:23646. DOI: 10.3402&#47;meo.v19.23646</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3402&#47;meo.v19.23646</RefLink>
      </Reference>
      <Reference refNo="27">
        <RefAuthor>Berndt M</RefAuthor>
        <RefAuthor>Schmidt FM</RefAuthor>
        <RefAuthor>Sailer M</RefAuthor>
        <RefAuthor>Fischer F</RefAuthor>
        <RefAuthor>Fischer MR</RefAuthor>
        <RefAuthor>Zottmann JM</RefAuthor>
        <RefTitle>Investigating Statistical Literacy and Scientific Reasoning &#38; Argumentation in Medical-, Social Sciences-, and Economics Students</RefTitle>
        <RefYear>2021</RefYear>
        <RefJournal>Lern Individual Diff</RefJournal>
        <RefPage>101963</RefPage>
        <RefTotal>Berndt M, Schmidt FM, Sailer M, Fischer F, Fischer MR, Zottmann JM. Investigating Statistical Literacy and Scientific Reasoning &#38; Argumentation in Medical-, Social Sciences-, and Economics Students. Lern Individual Diff. 2021;86:101963. DOI: 10.1016&#47;j.lindif.2020.101963</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;j.lindif.2020.101963</RefLink>
      </Reference>
      <Reference refNo="28">
        <RefAuthor>Trempler K</RefAuthor>
        <RefAuthor>Hetmanek A</RefAuthor>
        <RefAuthor>Wecker C</RefAuthor>
        <RefAuthor>Kiesewetter J</RefAuthor>
        <RefAuthor>Wermelt M</RefAuthor>
        <RefAuthor>Fischer F</RefAuthor>
        <RefAuthor>Fischer M</RefAuthor>
        <RefAuthor>Gr&#228;sel C</RefAuthor>
        <RefTitle>Nutzung von Evidenz im Bildungsbereich - Validierung eines Instruments zur Erfassung von Kompetenzen der Informationsauswahl und der Bewertung von Studien</RefTitle>
        <RefYear>2015</RefYear>
        <RefJournal>Z P&#228;dagogik</RefJournal>
        <RefPage>144-166</RefPage>
        <RefTotal>Trempler K, Hetmanek A, Wecker C, Kiesewetter J, Wermelt M, Fischer F, Fischer M, Gr&#228;sel C. Nutzung von Evidenz im Bildungsbereich - Validierung eines Instruments zur Erfassung von Kompetenzen der Informationsauswahl und der Bewertung von Studien. Z P&#228;dagogik. 2015;61:144-166.</RefTotal>
      </Reference>
      <Reference refNo="29">
        <RefAuthor>Epstein N</RefAuthor>
        <RefAuthor>Huber J</RefAuthor>
        <RefAuthor>Gartmeier M</RefAuthor>
        <RefAuthor>Berberat P</RefAuthor>
        <RefAuthor>Reimer M</RefAuthor>
        <RefAuthor>Fischer M</RefAuthor>
        <RefTitle>Investigating on the acquisition of scientific competencies during medical studies and the medical doctoral thesis</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>GMS J Med Educ</RefJournal>
        <RefPage>Doc20</RefPage>
        <RefTotal>Epstein N, Huber J, Gartmeier M, Berberat P, Reimer M, Fischer M. Investigating on the acquisition of scientific competencies during medical studies and the medical doctoral thesis. GMS J Med Educ. 2018;35(2):Doc20. DOI: 10.3205&#47;zma001167</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3205&#47;zma001167</RefLink>
      </Reference>
      <Reference refNo="30">
        <RefAuthor>Simon D</RefAuthor>
        <RefTitle>Chronische Herzinsuffizienz</RefTitle>
        <RefYear>2016</RefYear>
        <RefJournal>Apothek Umschau</RefJournal>
        <RefPage></RefPage>
        <RefTotal>Simon D. Chronische Herzinsuffizienz. Apothek Umschau. 2016. Zug&#228;nglich unter&#47;available from: http:&#47;&#47;www.apotheken.de&#47;gesundheit-heute-news&#47;article&#47;chronische-herzinsuffizienz&#47;</RefTotal>
        <RefLink>http:&#47;&#47;www.apotheken.de&#47;gesundheit-heute-news&#47;article&#47;chronische-herzinsuffizienz&#47;</RefLink>
      </Reference>
      <Reference refNo="31">
        <RefAuthor>Anonym</RefAuthor>
        <RefTitle>Neue Empfehlungen zum Einsatz von Wei&#223;dornpr&#228;paraten bei Herzinsuffizienz</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>&#196;rtzeblatt.de</RefJournal>
        <RefPage></RefPage>
        <RefTotal>Neue Empfehlungen zum Einsatz von Wei&#223;dornpr&#228;paraten bei Herzinsuffizienz. &#196;rzteblatt.de. 2017. Zug&#228;nglich unter&#47;available from: https:&#47;&#47;www.aerzteblatt.de&#47;fachgebiete&#47;kardiologie&#47;news&#63;nid&#61;72259</RefTotal>
        <RefLink>https:&#47;&#47;www.aerzteblatt.de&#47;fachgebiete&#47;kardiologie&#47;news&#63;nid&#61;72259</RefLink>
      </Reference>
      <Reference refNo="32">
        <RefAuthor>Meissner T</RefAuthor>
        <RefTitle>Wei&#223;dorn: Effekt auf das Endothel im Fokus</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>&#196;rzteZeitung</RefJournal>
        <RefPage></RefPage>
        <RefTotal>Meissner T. Wei&#223;dorn: Effekt auf das Endothel im Fokus. &#196;rzteZeitung. 2017.</RefTotal>
      </Reference>
      <Reference refNo="33">
        <RefAuthor>Harden M</RefAuthor>
        <RefAuthor>Grant J</RefAuthor>
        <RefAuthor>Buckley G</RefAuthor>
        <RefAuthor>Hart R</RefAuthor>
        <RefTitle>BEME guide no. 1: best evidence medical education</RefTitle>
        <RefYear>1999</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>553-526</RefPage>
        <RefTotal>Harden M, Grant J, Buckley G, Hart R. BEME guide no. 1: best evidence medical education. Med Teach. 1999;21(6):553-526. DOI: 10.1080&#47;01421599978960</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;01421599978960</RefLink>
      </Reference>
      <Reference refNo="34">
        <RefAuthor>Tabachnick BG</RefAuthor>
        <RefAuthor>Fidell LS</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2001</RefYear>
        <RefBookTitle>Using multivariate statistics</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Tabachnick BG, Fidell LS. Using multivariate statistics. 4th ed. Needham Heights, MA: Allyn &#38; Bacon; 2001.</RefTotal>
      </Reference>
      <Reference refNo="35">
        <RefAuthor>Hanoch Y</RefAuthor>
        <RefAuthor>Miron-Shatz T</RefAuthor>
        <RefAuthor>Cole H</RefAuthor>
        <RefAuthor>Himmelstein M</RefAuthor>
        <RefAuthor>Federman AD</RefAuthor>
        <RefTitle>Choice, numeracy and physician-in-training performance: The case of Medicare part D</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Health Psychol</RefJournal>
        <RefPage>454-459</RefPage>
        <RefTotal>Hanoch Y, Miron-Shatz T, Cole H, Himmelstein M, Federman AD. Choice, numeracy and physician-in-training performance: The case of Medicare part D. Health Psychol. 2010;29:454-459. DOI: 10.1037&#47;a0019881</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1037&#47;a0019881</RefLink>
      </Reference>
      <Reference refNo="36">
        <RefAuthor>Schmidt RL</RefAuthor>
        <RefAuthor>Chute DJ</RefAuthor>
        <RefAuthor>Colbert-Getz JM</RefAuthor>
        <RefAuthor>Firpo-Betancourt A</RefAuthor>
        <RefAuthor>James DS</RefAuthor>
        <RefAuthor>Karp JK</RefAuthor>
        <RefAuthor>Miller DC</RefAuthor>
        <RefAuthor>Milner DA Jr</RefAuthor>
        <RefAuthor>Smock KJ</RefAuthor>
        <RefAuthor>Sutton AT</RefAuthor>
        <RefAuthor>Walker BS</RefAuthor>
        <RefAuthor>White KL</RefAuthor>
        <RefAuthor>Wilson AR</RefAuthor>
        <RefAuthor>Wojcik EM</RefAuthor>
        <RefAuthor>Yared MA</RefAuthor>
        <RefAuthor>Factor RE</RefAuthor>
        <RefTitle>Statistical Literacy Among Academic Pathologists: A Survey Study to Gauge Knowledge of Frequently Used Statistical Tests Among Trainees and Faculty</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>Arch Pathol Lab Med</RefJournal>
        <RefPage>279-287</RefPage>
        <RefTotal>Schmidt RL, Chute DJ, Colbert-Getz JM, Firpo-Betancourt A, James DS, Karp JK, Miller DC, Milner DA Jr, Smock KJ, Sutton AT, Walker BS, White KL, Wilson AR, Wojcik EM, Yared MA, Factor RE. Statistical Literacy Among Academic Pathologists: A Survey Study to Gauge Knowledge of Frequently Used Statistical Tests Among Trainees and Faculty. Arch Pathol Lab Med. 2017;141(2):279-287. DOI: 10.5858&#47;arpa.2016-0200-OA</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.5858&#47;arpa.2016-0200-OA</RefLink>
      </Reference>
      <Reference refNo="37">
        <RefAuthor>Riegelman RK</RefAuthor>
        <RefAuthor>Hovland K</RefAuthor>
        <RefTitle>Scientific Thinking and Integrative Reasoning Skills (STIRS): Essential outcomes for medical education and for liberal education</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Peer Rev</RefJournal>
        <RefPage>10</RefPage>
        <RefTotal>Riegelman RK, Hovland K. Scientific Thinking and Integrative Reasoning Skills (STIRS): Essential outcomes for medical education and for liberal education. Peer Rev. 2012;14(4):10.</RefTotal>
      </Reference>
      <Reference refNo="38">
        <RefAuthor>Watson JM</RefAuthor>
        <RefAuthor>Callingham R</RefAuthor>
        <RefTitle>Statistical literacy: A complex hierarchical construct</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>Stat Educ Res J</RefJournal>
        <RefPage>3-46</RefPage>
        <RefTotal>Watson JM, Callingham R. Statistical literacy: A complex hierarchical construct. Stat Educ Res J. 2003;2(2):3-46.</RefTotal>
      </Reference>
      <Reference refNo="39">
        <RefAuthor>Ghazal S</RefAuthor>
        <RefAuthor>Cokely ET</RefAuthor>
        <RefAuthor>Garcia-Retamero R</RefAuthor>
        <RefTitle>Predicting biases in very highly educated samples: Numeracy and metacognition</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>Judgment Dec Making</RefJournal>
        <RefPage>15-34</RefPage>
        <RefTotal>Ghazal S, Cokely ET, Garcia-Retamero R. Predicting biases in very highly educated samples: Numeracy and metacognition. Judgment Dec Making. 2014;9(1):15-34.</RefTotal>
      </Reference>
      <Reference refNo="40">
        <RefAuthor>Laopaiboon M</RefAuthor>
        <RefAuthor>Lumbiganon P</RefAuthor>
        <RefAuthor>Walter SD</RefAuthor>
        <RefTitle>Doctors&#39; statistical literacy: a survey at Srinagarind Hospital, Khon Kaen University</RefTitle>
        <RefYear>1997</RefYear>
        <RefJournal>J Med Ass Thailand</RefJournal>
        <RefPage>130-137</RefPage>
        <RefTotal>Laopaiboon M, Lumbiganon P, Walter SD. Doctors&#39; statistical literacy: a survey at Srinagarind Hospital, Khon Kaen University. J Med Ass Thailand. 1997;80(2):130-137.</RefTotal>
      </Reference>
      <Reference refNo="41">
        <RefAuthor>Leira E</RefAuthor>
        <RefAuthor>Granner M</RefAuthor>
        <RefAuthor>Torner J</RefAuthor>
        <RefAuthor>Callison R</RefAuthor>
        <RefAuthor>Adams H</RefAuthor>
        <RefTitle>Education research: the challenge of incorporating formal research methodology training in a neurology residency</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Neurology</RefJournal>
        <RefPage>e79-e84</RefPage>
        <RefTotal>Leira E, Granner M, Torner J, Callison R, Adams H. Education research: the challenge of incorporating formal research methodology training in a neurology residency. Neurology. 2008;70(20):e79-e84. DOI: 10.1212&#47;01.wnl.0000312281.64033.36</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1212&#47;01.wnl.0000312281.64033.36</RefLink>
      </Reference>
      <Reference refNo="42">
        <RefAuthor>Mieg H</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2019</RefYear>
        <RefBookTitle>Inquiry-Based Learning - Undergraduate Research</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Mieg H, editor. Inquiry-Based Learning - Undergraduate Research. Cham: Springer Nature; 2019. DOI: 10.1007&#47;978-3-030-14223-0</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;978-3-030-14223-0</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 1: Description of study group (</Mark1><Mark1><Mark2>N</Mark2></Mark1><Mark1>&#61;71)</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 1: Beschreibung der Untersuchungsgruppe (</Mark1><Mark1><Mark2>N</Mark2></Mark1><Mark1>&#61;71)</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>1</NoOfTables>
      </Tables>
      <Figures>
        <Figure format="png" height="421" width="613">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 1: In which context have you acquired scientific skills&#63; (</Mark1><Mark1><Mark2>N</Mark2></Mark1><Mark1>&#61;71 physicians)</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 1: Wo haben Sie Ihrer Meinung nach Wissenschaftskompetenz erworben&#63; (</Mark1><Mark1><Mark2>N</Mark2></Mark1><Mark1>&#61;71 &#196;rztInnen)</Mark1></Pgraph></Caption>
        </Figure>
        <Figure format="png" height="346" width="487">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 2: In which context have you acquired scientific skills&#63; Free text analysis category Other (</Mark1><Mark1><Mark2>n</Mark2></Mark1><Mark1>&#61;28 physicians)</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 2: Wo haben Sie Ihrer Meinung nach Wissenschaftskompetenz erworben&#63; Freitextanalyse der Kategorie Sonstige (</Mark1><Mark1><Mark2>n</Mark2></Mark1><Mark1>&#61;28 &#196;rztInnen)</Mark1></Pgraph></Caption>
        </Figure>
        <NoOfPictures>2</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>