<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>

<GmsArticle>
  <MetaData>
    <Identifier>zma000444</Identifier>
    <ArticleType>Originalarbeit</ArticleType>
    <TitleGroup>
      <Title language="de">Offene Fragen vs. Multiple-Choice-Fragen im 1. Abschnitt des Medizinstudiums: Untersuchung am Beispiel von Topographischer Anatomie</Title>
      <TitleTranslated language="en">Open-answer questions vs. multiple-choice questions for undergraduate medical exams: a case study in topographical anatomy</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Oppitz</Lastname>
          <LastnameHeading>Oppitz</LastnameHeading>
          <Firstname>Matthias</Firstname>
          <Initials>M</Initials>
          <AcademicTitle>Dr. med.</AcademicTitle>
        </PersonNames>
        <Address>Universit&#228;t T&#252;bingen, Anatomisches Institut, Abteilung f&#252;r Experimentelle Embryologie, &#214;sterbergstra&#223;e 3, 72074 T&#252;bingen, Deutschland, Telefon: 07071&#47;297-3020<Affiliation>Universit&#228;t T&#252;bingen, Anatomisches Institut, Abteilung f&#252;r Experimentelle Embryologie, T&#252;bingen, Deutschland</Affiliation></Address>
        <Email>moppitz&#64;anatom.uni-tuebingen.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Schriek</Lastname>
          <LastnameHeading>Schriek</LastnameHeading>
          <Firstname>Gernot</Firstname>
          <Initials>G</Initials>
          <AcademicTitle>Dipl.-Psych.</AcademicTitle>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;t T&#252;bingen, Anatomisches Institut, Abteilung f&#252;r Experimentelle Embryologie, T&#252;bingen, Deutschland</Affiliation>
        </Address>
        <Email>gschriek&#64;web.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Busch</Lastname>
          <LastnameHeading>Busch</LastnameHeading>
          <Firstname>Christian</Firstname>
          <Initials>C</Initials>
          <AcademicTitle>Dr. med.</AcademicTitle>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;t T&#252;bingen, Anatomisches Institut, Abteilung f&#252;r Experimentelle Embryologie, T&#252;bingen, Deutschland</Affiliation>
        </Address>
        <Email>christian.busch&#64;med.uni-tuebingen.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Shiozawa</Lastname>
          <LastnameHeading>Shiozawa</LastnameHeading>
          <Firstname>Thomas</Firstname>
          <Initials>T</Initials>
          <AcademicTitle>Dr. med.</AcademicTitle>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;t T&#252;bingen, Anatomisches Institut, Abteilung f&#252;r Experimentelle Embryologie, T&#252;bingen, Deutschland</Affiliation>
        </Address>
        <Email>tshiozawa&#64;anatom.uni-tuebingen.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Drews</Lastname>
          <LastnameHeading>Drews</LastnameHeading>
          <Firstname>Ulrich</Firstname>
          <Initials>U</Initials>
          <AcademicTitle>Prof. Dr. med.</AcademicTitle>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;t T&#252;bingen, Anatomisches Institut, Abteilung f&#252;r Experimentelle Embryologie, T&#252;bingen, Deutschland</Affiliation>
        </Address>
        <Email>drews&#64;anatom.uni-tuebingen.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">Multiple choice questions</Keyword>
      <Keyword language="en">short essay questions</Keyword>
      <Keyword language="en">validity</Keyword>
      <Keyword language="en">strategies for learning</Keyword>
      <Keyword language="en">testing of successful learning process</Keyword>
      <Keyword language="de">Multiple-Choice Fragen</Keyword>
      <Keyword language="de">Fragen mit offenen Antworten</Keyword>
      <Keyword language="de">Validit&#228;t</Keyword>
      <Keyword language="de">Lernstrategien</Keyword>
      <Keyword language="de">Kontrolle des Lernerfolgs</Keyword>
      <SectionHeading language="de">Humanmedizin</SectionHeading>
    </SubjectGroup>
    <DateReceived>20070521</DateReceived>
    <DatePublishedList>
      <DatePublished>20070815</DatePublished>
      <DateRepublished>20070817</DateRepublished>
    </DatePublishedList>
    <Language>germ</Language>
    <SourceGroup>
      <Journal>
        <ISSN>1860-3572</ISSN>
        <Volume>24</Volume>
        <Issue>3</Issue>
        <JournalTitle>GMS Zeitschrift f&#252;r Medizinische Ausbildung</JournalTitle>
        <JournalTitleAbbr>GMS Z Med Ausbild</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>150</ArticleNo>
    <Correction><DateLastCorrection>20070817</DateLastCorrection>Satzzeichenkorrektur im Titel</Correction>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes">
      <Pgraph>Multiple-Choice (MC) Fragen sind seit 1970 die Grundlage der staatlichen &#196;rztlichen Pr&#252;fungen. In den vorklinischen F&#228;chern werden neben MC-Fragen auch Aufgaben mit offenen Fragen (OF) zur Pr&#252;fung verwendet. Der statistische Vergleich beider Fragentypen in der praktischen Anwendung sollte ihre Eignung zur kursbegleitenden Pr&#252;fung, als Anreiz zur Steuerung des Lernverhaltens, pr&#252;fen.</Pgraph>
      <Pgraph>In einer retrospektiven Studie wurden die Pr&#252;fungsergebnisse von 351 Studierenden der Wintersemester 2003&#47;04, 2004&#47;05 und 2005&#47;06 statistisch ausgewertet. Aus den gepaarten Daten der Pr&#252;fungsergebnisse von OF und MC-Fragen im gleichen Testatbogen wurden die Rang-Korrelationskoeffizienten nach Spearman und die F-Ratio berechnet. Zur Absch&#228;tzung der Reliabilit&#228;t der beiden Fragenformate wurden die Raten korrekter Antworten auf einzelne, in zwei aufeinanderfolgenden Semestern eingesetzte, MC-Fragen und offene Fragen vergleichend untersucht. Als Ma&#223; f&#252;r den Lernerfolg wurde die statistische Korrelation zwischen dem Ergebnis des Eingangstestats und sp&#228;terer, im Verlaufe des Kurses abgelegter Testate ermittelt. </Pgraph>
      <Pgraph>Die statistische Untersuchung der gepaarten Daten ergab in allen untersuchten Semestern einen signifikanten Unterschied zwischen einem Anteil (Anzahl richtig beantworteter Fragen&#47;Anzahl aller Testatfragen) von 0.84 richtig beantworteter OF und von 0.71 richtig beantworteter MC- Fragen. Studierende mit insgesamt schlechterem Abschneiden wiesen eine signifikant h&#246;here Fehlerrate bei der Beantwortung von MC-Fragen im Vergleich zu OF auf. Studierende mit einem unterdurchschnittlichen Ergebnis im Eingangstestat schnitten auch in sp&#228;teren Testaten signifikant schlechter ab. Andere Einflu&#223;gr&#246;&#223;en, die als Kontrolle in die Berechnung einbezogen wurden (Alter, Geschlecht und Deutsch als Zweitsprache), beeinflu&#223;ten das Ergebnis der Pr&#252;fung nicht.</Pgraph>
      <Pgraph>Offene Fragen mit einem niedrigen bis mittleren Schwierigkeitsgrad waren im Unterschied zu MC-Fragen geeignet, um Studierende mit befriedigendem Wissensniveau von Kursteilnehmern abzugrenzen, die die Kriterien zum Bestehen des Kurses nicht erf&#252;llten. Im praktischen Einsatz erwiesen sich MC-Fragen wegen ihres gr&#246;&#223;eren Aufwandes bei der Erstellung und ihrer eingeschr&#228;nkten Wiederverwendbarkeit als problematischer als OF. </Pgraph>
      <Pgraph>Nach unseren Erfahrungen ist eine vom Kursabschnitt abh&#228;ngige Kombination von OF und MC-Fragen empfehlenswert.</Pgraph>
    </Abstract>
    <Abstract language="en" linked="yes">
      <Pgraph>Multiple choice questions (MCQ) have become the basis of state medical examinations in Germany since 1970. Single answer questions (SAQ) have become a convenient alternative for undergraduate testing in medicine. Our aim was to study the best use of both types of questions by comparison of examination results.</Pgraph>
      <Pgraph>In a retrospective study, examination results of 351 second year students of medicine were selected from written exams that contained both MCQ and SAQ, and evaluated by statistical analysis. Rank correlation coefficients according to Spearman and F-ratio were calculated from the paired data of rates of correct answers from MCQ and SAQ. The reliability of selected exam questions was estimated by comparing results from answers to comparable questions from consecutive years. The effect of learning was evaluated by comparing results from exams before the start of the class with results obtained during the course.</Pgraph>
      <Pgraph>Statistical evaluation revealed that the mean rate of correct answers was 0.84 (ratio right answers &#47; total number) for SAQ, and significantly differed from the answer rate of 0.71 for MCQ. The difference was more pronounced in the subgroup of low performance students. The rate of correct answers of selected SAQ and MCQ were sufficiently reliable in consecutive examinations. There was a clear correlation between rate of successfully solved SAQ in entrance exams and in consecutive examination results. Parameters that were included in statistical calculation (Age, sex, language) as controls did not influence the difference between SAQ and MCQ.</Pgraph>
      <Pgraph>In conclusion, the results suggest that SAQ had the same level of discrimination when compared to MCQ, although their level of difficulty was lower than MCQ. They had a sufficient level of reliability, and were easier to modify for re-use in further examinations. Examinations that consist solely of MCQ are difficult to compose, and can hardly be re-used. </Pgraph>
      <Pgraph>The combination of SAQ and MCQ in exams helps to overcome this problem.</Pgraph>
    </Abstract>
    <TextBlock linked="yes" name="Einf&#252;hrung">
      <MainHeadline>Einf&#252;hrung</MainHeadline>
      <Pgraph>Nach dem Inkrafttreten der neuen Approbationsordnung f&#252;r &#196;rzte (AppO&#196;) <TextLink reference="1"></TextLink> von 2002 wurden neue Leistungskontrollen f&#252;r Studierende an Medizinischen Hochschulen in Deutschland eingef&#252;hrt. Durch die neue AppO&#196; erhalten Erfolgskontrollen in den F&#228;chern des vorklinischen und des klinischen Studienabschnittes im Vergleich zur alten AppO&#196; eine gr&#246;&#223;ere Bedeutung. Die f&#228;cherspezifischen Testate sind zudem als Grundlage f&#252;r eine Bewertung der Gesamtleistung wichtig geworden. Daher ist die Erstellung von reliablen, validen und objektiven Methoden zur Ermittlung des Lernerfolgs eine Herausforderung an die Lehrkr&#228;fte der vorklinischen und klinischen F&#228;cher. </Pgraph>
      <Pgraph>Seit 1970 wurden in der Bundesrepublik Deutschland Multiple Choice (MC)-Fragen des Institutes f&#252;r Medizinische und Pharmazeutische Pr&#252;fungsfragen (IMPP) in den zentral organisierten &#196;rztlichen Pr&#252;fungen eingesetzt. In den angels&#228;chsischen L&#228;ndern wurden von den Hochschulen in schriftlichen vorklinischen Pr&#252;fungen (undergraduate examinations) und klinischen Pr&#252;fungen (clinical examinations) neben MC-Fragen andere Fragentypen angewendet: Offene Fragen (OF) mit kurzem und langen Antwortm&#246;glichkeiten (short answer questions (SAQ), short essay questions (SEQ) <TextLink reference="2"></TextLink>, und modified essay questions (MEQ)), und schriftlich zu erg&#228;nzende Aussagen (extended matching questions (EMQ) <TextLink reference="3"></TextLink>). Neben MC-Fragen werden in unserem Bereich, der makroskopischen Anatomie, zunehmend OF zur Pr&#252;fung eingesetzt. In einem anderen Grundlagenfach, der Medizinischen Mikrobiologie, haben sich OF als ad&#228;quat einsetzbares, unkompliziert auf eine Aussage einstellbares Fragenformat bew&#228;hrt <TextLink reference="4"></TextLink>.</Pgraph>
      <Pgraph>Gute Kenntnisse in der topographischen Anatomie sind f&#252;r eine erfolgreiche Ausbildung in den operativen &#228;rztlichen Fachgebieten w&#228;hrend des Studiums und der sp&#228;teren fachbezogenen Ausbildung unverzichtbar. Diese Ansicht wird von retrospektiven Auswertungen von Facharztpr&#252;fungen unterst&#252;tzt <TextLink reference="5"></TextLink>. Auch f&#252;r das anatomische Fachgebiet besteht eine Verpflichtung zur Durchf&#252;hrung objektiver, reliabler und valider Pr&#252;fungen <TextLink reference="6"></TextLink>. Um den Anforderungen der neuen AppO&#196; zu entsprechen, wurden seit 2001 im Kurs der makroskopischen Anatomie in T&#252;bingen die fr&#252;her m&#252;ndlich gehaltenen Testate am Ende eines jeden Kursabschnittes durch eine 30-40 Fragen enthaltende, schriftliche Pr&#252;fung zur Leistungskontrolle erg&#228;nzt. Dazu wird der Unterricht nach dem beschriebenen multimedialen und interdisziplin&#228;ren Ausbildungskonzept <TextLink reference="7"></TextLink> durchgef&#252;hrt. Vor Beginn des Kurses wurde die Leistungsf&#228;higkeit mit einem Eingangstestat gepr&#252;ft, das OF und MC-Fragen enthielt. Dieses Testat pr&#252;fte das in den Vorlesungen (des vorangegangenen 1. und 2 Semesters) erworbene Wissen. Auch Inhalte des Kursus der Mikroskopischen Anatomie im 2. Semester, soweit sie f&#252;r das Verst&#228;ndnis der Makroskopischen Anatomie wichtig waren (Histologie, Osteologie), flossen in die Pr&#252;fung ein. Parallel zum eigentlichen Kurs mit der Pr&#228;parationsarbeit nahmen die Kursgruppen an topographisch-anatomischen Seminaren teil. Die Seminare sind folgenderma&#223;en aufgebaut: Ein Dozent demonstriert das zum jeweiligen Zeitpunkt pr&#228;parierte anatomische Gebiet, und anschlie&#223;end wird durch einen Vertreter eines klinischen Faches erg&#228;nzendes spezifisches Wissen vermittelt. Den Studenten stehen zum Selbststudium &#252;ber das Internet aufrufbare &#220;bungsmodule zum &#220;ben, Wiederholen und Vertiefen zur Verf&#252;gung, die das in den Seminaren behandelte Wissen durch einpr&#228;gsame Abbildungen, Texte und OF beinhalten. Zur Leistungskontrolle nahmen die Studierenden am Ende jedes Kursabschnittes an einer m&#252;ndlichen Pr&#252;fung teil, und erhielten anschlie&#223;end ein schriftliches Testat, das aus OF und MC-Fragen bestand. Seit der Einf&#252;hrung im Jahre 2001 hat sich bei den Studierenden und ihren Lehrenden in T&#252;bingen diese Art der Wissensvermittlung und Leistungskontrolle etabliert. In der vorgestellten Studie wird durch direkten Vergleich von OF und MC-Fragen in einem schriftlichen Testat gepr&#252;ft, wie weit beide Fragenformate zur Beurteilung des neben der praktischen Pr&#228;parationsarbeit erworbenen Wissens geeignet sind. Ein weiteres, hier untersuchtes, Merkmal war die Reproduzierbarkeit der Ergebnisse &#252;ber mehrere Semester hinweg.</Pgraph>
    </TextBlock>
    <TextBlock linked="yes" name="Material und Methoden">
      <MainHeadline>Material und Methoden</MainHeadline>
      <Pgraph>Die Daten wurden den Auswertungen der Antwortb&#246;gen der in den Wintersemestern 03&#47;04, 04&#47;05 und 05&#47;06 durchgef&#252;hrten schriftlichen Testate entnommen. Im folgenden Abschnitt soll die Durchf&#252;hrung der schriftlichen Testate kurz beschrieben werden. </Pgraph>
      <Pgraph>Die Studierenden wurden vor Beginn des Kurses einmal schriftlich gepr&#252;ft (&#8222;Eingangstestat&#8220;). W&#228;hrend des Kurses wurden wichtige anatomisch-topographische Einheiten vermittelt und am Ende jedes Kursabschnittes mit schriftlichen und m&#252;ndlichen Testaten gepr&#252;ft. Ein Testat bestand aus jeweils 25 bis 35 Pr&#252;fungsfragen. Davon waren bis zu 10 im MC-Fragenformat verfa&#223;t. F&#252;r jede Pr&#252;fungsfrage waren 90 Sekunden Zeit zur Beantwortung angesetzt. Die Pr&#252;fungen fanden unter Aufsicht von Dozenten statt. In jeder Pr&#252;fung wurden unterschiedliche Testat-Frageb&#246;gen eingesetzt. Durch den Einsatz von neu konzipierten oder modifizierten Fragen aus fr&#252;heren Pr&#252;fungen sollen Einfl&#252;sse durch Abschreiben, &#8222;Spickzettel&#8220; oder das unreflektierte Auswendiglernen von &#8222;Altfragen&#8220; weitgehend ausgeschlossen werden. Nach der Pr&#252;fung wurden die Antworten auf die Pr&#252;fungsfragen als &#8222;richtig&#8220; oder &#8222;falsch&#8220; klassifiziert. Zum Bestehen eines Testates mu&#223;ten mindestens 60&#37; der Fragen richtig beantwortet werden. Die Teilnehmer wurden entsprechend ihres Pr&#252;fungsergebnisses eingeteilt: mit weniger als 60&#37; richtig beantworteter Fragen wurde ihr Leistungsniveau als niedrig, zwischen 60-80&#37; als mittel und ab 80&#37; als hoch klassifiziert.</Pgraph>
      <Pgraph>F&#252;r einzelne Fragen in einem Testatbogen wurde die Trennsch&#228;rfe nach einschl&#228;gigen Empfehlungen <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink> ermittelt. Dazu wurden die Ergebnisse der Teilnehmer den oben genannten Kategorien (niedrig, mittel, hoch) zugeordnet. Die Fragen der Eingangstestate wurden von unabh&#228;ngigen Fachanatomen auf Verst&#228;ndlichkeit, Schwierigkeit und Vergleichbarkeit &#252;berpr&#252;ft, um die Validit&#228;t der unterschiedlichen Testatfragen &#252;ber die Semester zu gew&#228;hrleisten. Die Daten der Studierenden wurden anonymisiert (verschl&#252;sselt durch eine aus der Matrikel-Nummer abgeleitete Personenkennzahl) den entsprechenden Pr&#252;fungsergebnissen zugeordnet. Als Kontrolle wurden m&#246;gliche Einflu&#223;gr&#246;&#223;en auf die Pr&#252;fungsergebnisse untersucht, indem aus der gesamten Stichprobe Untergruppen gebildet wurden. Die Kriterien f&#252;r die Gruppenbildung waren: </Pgraph>
      <Pgraph>
        <OrderedList>
          <ListItem level="1" levelPosition="1" numString="1.">das Alter der Studierenden, </ListItem>
          <ListItem level="1" levelPosition="2" numString="2.">ihr Geschlecht, und </ListItem>
          <ListItem level="1" levelPosition="3" numString="3.">ihre sprachliche Zugeh&#246;rigkeit (Deutsch als Zweitsprache). </ListItem>
        </OrderedList>
      </Pgraph>
      <Pgraph>Die Korrelation zwischen den gepaarten Daten wurde in Form der Rangkorrelations-Koeffizienten nach Spearman f&#252;r die gesamte Stichprobe, die 3 Semesterkohorten und die Untergruppen berechnet. </Pgraph>
      <Pgraph>Da es aus praktischen Gr&#252;nden im Kurs nicht m&#246;glich war, den Studierenden eine Pr&#252;fungsfrage innerhalb des Semesters ein zweites Mal vorzulegen, wurden bei jeweils 5 ausgew&#228;hlten MC-Fragen oder OF, die in aufeinander folgenden Semestern unver&#228;ndert eingesetzt worden waren, die Quoten richtiger Antworten zwischen beiden Semesterkollektiven miteinander verglichen. Die erzielten Notenkombinationen wurden bei Annahme einer Normalverteilung miteinander korreliert und der errechnete Wert r<Subscript>s</Subscript> als Ma&#223; f&#252;r die Reliabilit&#228;t eingesetzt. </Pgraph>
    </TextBlock>
    <TextBlock linked="yes" name="Ergebnisse">
      <MainHeadline>Ergebnisse</MainHeadline>
      <Pgraph>Die Pr&#252;fungsergebnisse von 351 Studierenden wurden in die Auswertung einbezogen (Wintersemester 2003&#47;04, n &#61; 138, Wintersemester 2004&#47;05, n&#61;72, Wintersemester 2005&#47;06, n&#61;141). Die Auswahl von nur 72 Studierenden im Wintersemester 2004&#47;05 kam dadurch zustande, da&#223; in diesem Semester zwei Eingangstestate zum Einsatz kamen, von denen nur eines beide Fragetypen enthielt. Nur Teilnehmer im letzteren Testat wurden in die Semesterkohorte aufgenommen. Damit wurde das Ergebnis der statistischen Auswertung m&#246;glicherweise beeinflu&#223;t. </Pgraph>
      <Pgraph>Der Anteil korrekt beantworteter Fragen an der Gesamtzahl der Fragen lag in allen Testaten zwischen 0.42 und 1.00. Der letztere Wert entsprach der maximal erreichbaren Punktezahl. </Pgraph>
      <Pgraph>Die Trennsch&#228;rfe der in allen Testaten eingesetzten Fragen lag bei den OF im Bereich von 0.07 bis 0.54 und bei den MC-Fragen im Bereich von 0.10 bis 0.64. </Pgraph>
      <Pgraph>Der Vergleich der Ergebnisse der Eingangstestate mit dem Mittelwert der sp&#228;teren Testate zeigte eine ohne Ber&#252;cksichtigung des Fragentyps eine Korrelation von 0.2&#60;r<Subscript>s</Subscript>&#60;0.6. Hervorzuheben ist hier das Wintersemester 2003&#47;04. In diesem Zeitraum erzielten 44 Studierende mit einem unterdurchschnittlichen Abschneiden im Eingangstestat in den sp&#228;teren Testaten Ergebnisse, die mit ihren Punktzahlen im Eingangstestat einen deutlichen statistischen Zusammenhang aufwiesen (r<Subscript>s</Subscript>&#61;0.56) (siehe Abbildung 1 b<ImgLink imgNo="1" imgType="figure"/>). Innerhalb des gesamten Semester-Kollektivs lag der Korrelationskoeffizient bei r<Subscript>s</Subscript>&#61;0.31 (siehe Abbildung 1 a<ImgLink imgNo="1" imgType="figure"/>). Bei Ber&#252;cksichtigung der Leistungsgruppen wird die Abweichung von der Mittellinie bei den Teilnehmern mit durchschnittlichen und unterdurchschnittlichen Leistungen in allen Semesterkohorten erkennbar (siehe Abbildung 2 a, c, d<ImgLink imgNo="2" imgType="figure"/>). Im Wintersemester 2004&#47;05 war der Korrelationskoeffizient niedriger (r<Subscript>s</Subscript>&#61;0.29) als im Semester davor, und wies mit p &#62; 0.02 eine geringere Signifikanz auf (siehe Abbildung 2 c<ImgLink imgNo="2" imgType="figure"/>). Im Wintersemester 2005&#47;06 betrug die Korrelation r<Subscript>s</Subscript> zwischen richtig beantworteten Fragen des Eingangstestats und den sp&#228;teren Testaten 0.31 (p&#60;0.0005), was dem Wert des Wintersemesters 2003&#47;04 entsprach.</Pgraph>
      <Pgraph>Die Reliabilit&#228;t von einzelnen Fragen, die in mehreren Semestern eingesetzt wurden, wurde nach den empfohlenen Modellen <TextLink reference="9"></TextLink> abgesch&#228;tzt. Bei der Absch&#228;tzung der Retest-Reliabilit&#228;t von jeweils 5 ausgew&#228;hlten OF und 5 inhaltlich vergleichbaren MC-Fragen, die in zwei aufeinander folgenden Semestern gestellt worden waren, stellte sich heraus, da&#223; die Retest-Reliabilit&#228;t von OF mit einer Wahrscheinlichkeit von r &#61; 0.65 durchgehend h&#246;her als die von MC-Fragen (r&#61;0.60) war. </Pgraph>
      <Pgraph>Die Korrelationen zwischen OF und MC-Fragen wurden f&#252;r die Semesterkohorten (siehe Abbildung 1 a, b und c<ImgLink imgNo="1" imgType="figure"/>) und die gesamte Stichprobe (siehe Abbildung 1 d<ImgLink imgNo="1" imgType="figure"/>) errechnet. </Pgraph>
      <Pgraph>Die statistische Auswertung der miteinander verbundenen Daten (Studierende und Anteile richtig beantworteter Fragen bei den verschiedenen Fragentypen) zeigte, da&#223; die OF von den Studierenden in 2 Wintersemestern mit einer h&#246;heren Erfolgsquote (t-Test, p&#60;0.001) beantwortet wurden als MC-Fragen (2003&#47;04: <ImgLink imgNo="1" imgType="inlineFigure"/> &#61;0.84 vs. 0.75; 2005&#47;06: <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.83 vs. 0.68). Die Ergebnisse der ausgew&#228;hlten 72 Testate mit vollst&#228;ndigem Eingangstestat aus der Semesterkohorte 2004&#47;05 wichen davon ab: Hier lagen die Ergebnisse von MC-Fragen im Mittelwert h&#246;her als bei OF (0.94 vs. 0.88). Allerdings waren innerhalb der gesamten Kohorte 2004&#47;05, in die auch die Ergebnisse von Teilnehmern ohne vollst&#228;ndiges Eingangstestat einbezogen worden waren (n&#61;139), keine deutlichen Unterschiede zwischen den Ergebnissen nachweisbar (<ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.90 f&#252;r MC vs. 0.87 f&#252;r OF). </Pgraph>
      <Pgraph>Die varianzanalytische Auswertung der Beziehung zwischen MC-Fragen und OF &#252;ber alle drei Semester (n&#61;351) ergab eine F-Ratio von 2,5456 bei einem Signifikanzniveau von p&#60; 0.001.  Es kann daher mit einer hohen Wahrscheinlichkeit davon ausgegangen werden, da&#223; die Pr&#252;fungsergebnisse von beiden Frageformen in den Semestergruppen unterschiedlich waren.</Pgraph>
      <Pgraph>Innerhalb der oben genannten, zur Kontrolle gebildeten Untergruppen (Alter, Geschlecht, Sprache) aus allen 3 Semestern war kein Einflu&#223; der Zugeh&#246;rigkeit auf das Pr&#252;fungsergebnis (t-Test der Rangkorrelationen) erkennbar (nicht abgebildet). In allen Gruppen wurden OF h&#228;ufiger richtig beantwortet als MC-Fragen. Die Mittelwerte der Raten von richtig gel&#246;sten Antworten auf OF innerhalb der Untergruppen von &#8222;j&#252;ngeren&#8220; und &#8222;&#228;lteren&#8220; Studierenden (<ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.83 vs. 0.84, mittlere Differenz &#8710;<ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0,16 vs. 0.09) sowie Frauen und M&#228;nnern (<ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.84 vs. 0.85, mittlere Differenz &#8710;<ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0,14 vs. 0.14) unterschieden sich nicht wesentlich. Die Korrelationskoeffizienten zwischen OF und MC-Fragen innerhalb der Untergruppen der gesamten Kohorte aus den Semestern 2003&#47;04, 2004&#47;06 und 2005&#47;06 betrugen r<Subscript>s</Subscript>&#61;0.27 f&#252;r die Untergruppe &#8222;weiblich&#8220; (n&#61;211) und r<Subscript>s</Subscript>&#61;0.40 f&#252;r m&#228;nnlich (n&#61;140). </Pgraph>
      <Pgraph>Eine Besonderheit stellte eine kleine Kohorte von Studierenden dar, die Deutsch als Zweitsprache erlernt hatten. Sie schnitten mit ihrem Anteil von richtigen Antworten auf offene Fragen im Mittelwert mit <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.78 niedriger ab als die Ergebnisse der gesamten Stichprobe (2003&#47;04: <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.86, 2004&#47;05: <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.88 und 2005&#47;06: <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.83). Der Mittelwert bei MC-Fragen wich mit <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.70 ebenfalls eindeutig von den entsprechenden Werten der gesamten Stichprobe ab (2003&#47;04: <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.68, 2004&#47;05: <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.93 und 2005&#47;06: <ImgLink imgNo="1" imgType="inlineFigure"/>&#61;0.76). Es bestand in dieser Stichprobe eine deutliche Korrelation zwischen MC-Fragen und OF (r<Subscript>s</Subscript>&#61;0.58). Aufgrund der geringen Anzahl von Teilnehmern in der Gruppe (n&#61;23) und der Inhomogenit&#228;t der Stichprobe (z.B. wurde keine Unterscheidung bezogen auf die Deutschkenntnisse vorgenommen)  ist es nicht m&#246;glich, auf ein erh&#246;htes Schwierigkeitsniveau von offenen Fragen oder MC-Fragen f&#252;r Studierende in dieser Gruppe zu schlie&#223;en. </Pgraph>
      <Pgraph>Die unterschiedliche Bewertung des aktiven Wissens im Vergleich zwischen OF und MC-Fragen soll an 2 Beispielen verdeutlicht werden. </Pgraph>
      <Pgraph><Mark3>Beispiel 1:</Mark3> Der Schichtenbau der Muskulatur des Beckenbodens ist ein f&#252;r die sp&#228;tere klinische T&#228;tigkeit relevantes Thema, das am besten bei der Pr&#228;paration des Beckens erfa&#223;t werden kann. Das Verst&#228;ndnis f&#252;r die Anordnung der Schichten erfordert ein hohes Ma&#223; an Abstraktion, und wird nach unserer Erfahrung erst nach eingehender Besch&#228;ftigung mit dem Pr&#228;parat und Abbildungen erworben. Mit einer offenen Frage konnte das erworbene topographische Wissen gezielt abgefragt werden, und wurde von 54&#37; der Studierenden mit gutem Abschneiden im gesamten Testat richtig beantwortet (siehe Abbildung 3 <ImgLink imgNo="3" imgType="figure"/>). Da die topographisch-anatomischen Verh&#228;ltnisse im Beckenboden mit einfachen MC-Fragen nur sehr eingeschr&#228;nkt zu pr&#252;fen sind, kann man auf diese Art und Weise das Verst&#228;ndnis der r&#228;umlichen Verh&#228;ltnisse im Pr&#228;parat nur mit gro&#223;em Aufwand abfragen, z.B. mit Hilfe von Photographien mit nummerierten Pfeilen. Die photographische Abbildung stellt das Pr&#228;parat zweidimensional dar, deshalb ist der Transfer schwieriger und stellt eine h&#246;here Anforderung an den Lernenden dar. Oft kann die photographische Abbildung das Pr&#228;parat meistens nur unzureichend erfassen. Das f&#252;r die L&#246;sung der MC-Frage notwendige Wissen kann durch Lernen am Pr&#228;parat nicht erworben werden, sondern verlangt zum Verst&#228;ndnis ein eingehendes Studium der Literatur. In den von Studierenden in der knappen Zeit gerne eingesetzten, kurzen Lerntexten wird die in dieser MC-Frage erwartete Antwort schlagwortartig abgehandelt. Als Folge beantworten 100&#37; der Teilnehmer in der hohen Leistungsgruppe und 50&#37; der mittleren die MC-Frage richtig, ohne notwendigerweise ein eingehendes topographisches Wissen zu besitzen. </Pgraph>
      <Pgraph><Mark3>Beispiel 2:</Mark3> Eine Frage aus dem letzten Abschnitt des Wintersemesters 2003&#47;04 betraf eine die f&#252;r die Pr&#228;paration wichtige Struktur im Gehirn, den Fornix cerebri (siehe Abbildung 4 <ImgLink imgNo="4" imgType="figure"/>). Mit der offenen Frageform war die Struktur eindeutig abfragbar, und wurde von allen Studierenden richtig beantwortet, die im Testat gut abgeschnitten hatten. Um den Sachverhalt mit einer MC-Frage zu pr&#252;fen, sind aufwendige Distraktoren notwendig, die die Zielrichtung der Frage schlie&#223;lich &#228;ndern, und das Wissen &#252;ber das Konzept des Papez-Leitungsbogens erforderlich machen. Die Auswertung der Anteile der richtigen Antworten zeigt, da&#223; bei beiden Fragentypen der Anteil der Teilnehmer mit richtigen Antworten mit steigender Leistung zunimmt. Anderseits ist die L&#246;sungsquote f&#252;r die MC-Frage in allen Gruppen niedriger. In der &#8222;hohen&#8220; Leistungsgruppe lag der Anteil von Studierenden mit richtig beantworteten MC-Fragen bei 0.56, w&#228;hrend alle Teilnehmer dieser Gruppe die entsprechende OF richtig beantworteten. Diese Beobachtung d&#252;rfte im durch die Distraktoren bedingten, h&#246;heren Schwierigkeitsgrad der MC-Frage begr&#252;ndet sein.</Pgraph>
      <Pgraph>Die Praktikabilit&#228;t des Pr&#252;fverfahrens wurde abschlie&#223;end durch pers&#246;nliche Einsch&#228;tzung der Dozenten beurteilt. Die Antworten auf die OF waren nach einer kurzen Einarbeitungszeit f&#252;r die Kursdozenten genauso unproblematisch auswertbar wie MC-Fragen. Antworten, die nicht in das vorgegebene Antwortschema pa&#223;ten, wurden durch erfahrene Dozenten schnell und zuverl&#228;ssig als richtige oder falsche Antwort klassifiziert. In einer nachtr&#228;glichen gemeinsamen Auswertung konnten eventuell abweichende Bewertungen der Ergebnisse einander angeglichen werden. </Pgraph>
    </TextBlock>
    <TextBlock linked="yes" name="Diskussion">
      <MainHeadline>Diskussion</MainHeadline>
      <Pgraph>Der Kursus der Makroskopischen Anatomie vermittelt durch seine Kombination aus praktischen Fertigkeiten und theoretischer Wissensvermittlung ein f&#252;r die sp&#228;tere &#228;rztliche T&#228;tigkeit essentielles r&#228;umliches Grundlagenwissen &#252;ber den K&#246;rperbau. Zur Evaluierung des Lernerfolgs sind Vergleiche des Vorwissens mit dem im Kurs erworbenen Wissen sinnvoll <TextLink reference="10"></TextLink>. </Pgraph>
      <Pgraph>Im Rahmen des T&#252;binger Kurses hatten Eingangstestate die Funktion, Studierende zum Erwerb des f&#252;r eine sinnvolle Mitarbeit im Pr&#228;parierkurs notwendigen Wissens anzuleiten. Es zeigte sich, da&#223; sogar Studierende mit einem hohen Leistungsniveau im Eingangstestat schlechter abschnitten als in sp&#228;teren Testaten, da sie noch &#252;ber geringe Erfahrungen in der Testatvorbereitung verf&#252;gten. Deshalb war innerhalb der gesamten Stichprobe keine deutliche statistische Korrelation zwischen den Ergebnissen der Eingangstestate und denen von sp&#228;teren Pr&#252;fungen nachweisbar. Die Besch&#228;ftigung mit dem f&#252;r den Kurs erforderlichen Stoffkatalog spiegelte sich in den im Durchschnitt guten Ergebnissen des Eingangstestats wieder. Das zum Anfang der Wintersemester teilweise schlechte Abschneiden der Pr&#252;fungsteilnehmer beim L&#246;sen der MC-Fragen kann darauf zur&#252;ckgef&#252;hrt werden, da&#223; die Mehrheit der Studenten zu diesem Zeitpunkt noch geringe Erfahrungen mit dieser Frageform hatten.</Pgraph>
      <Pgraph>Im sp&#228;teren Verlauf des Kurses glichen sich die Anteile richtiger Antworten auf MC-Fragen und OF an. Tendenziell wurden jedoch OF in ihrer Fragestellung von den Studenten besser erfa&#223;t und daher korrekt beantwortet, wie der Vergleich beider Frageformen in den Semesterkohorten von 2003&#47;04 und 2005&#47;06 zeigt. F&#252;r viele grundlegende Fragestellungen war die Erstellung von MC-Fragen, die ein den OF ad&#228;quates Schwierigkeitsniveau aufwiesen, zu aufwendig oder nicht machbar.</Pgraph>
      <Pgraph>Lernschwache Studenten konnten aufgrund ihres Abschneidens in den Testaten unterhalb der Bestehensgrenze identifiziert werden. Nach erneuten Lernanstrengungen in m&#252;ndlichen Nachpr&#252;fungen wurde ein f&#252;r die Fortsetzung des Studiums erforderliches Wissen testiert. </Pgraph>
      <Pgraph>In einer weiteren Betrachtung sollen die Praktikabilit&#228;tskriterien f&#252;r offene Fragen und MC-Fragen miteinander verglichen werden. Ihr alleiniger Einsatz in kursbegleitenden Pr&#252;fungen des vorklinischen Abschnitts, die ein noch nicht gefestigtes Wissen pr&#252;fen, wird nach vergleichenden Untersuchungen in Pr&#252;fungen der Medizinischen Mikrobiologie in Frage gestellt &#91;3&#93;. Auch neuere Untersuchungen stimmen darin &#252;berein, da&#223; der Pr&#252;fungserfolg in MC-Fragen im urspr&#252;nglichen &#8222;richtig-falsch&#8220;-Schema zu einem wesentlichen Teil durch das Fragenformat und dem damit verbunden Entscheidungszwang f&#252;r eine richtige L&#246;sung bedingt ist, was die Reliabilit&#228;t der Frage oft ung&#252;nstig beeinflu&#223;t <TextLink reference="11"></TextLink>. &#220;ber die Eindeutigkeit einer Frage und den Schwierigkeitsgrad entscheidet die G&#252;te der als Distraktoren eingesetzten Auswahlantworten. Die hohen Anforderungen an Distraktoren - sie sollen verst&#228;ndlich sein, als richtige Antwort in Frage kommen, sich eindeutig von der &#8222;richtigen&#8220; Antwort unterscheiden, aber nicht die beste L&#246;sung f&#252;r einen Fall darstellen - machen die Erstellung von MC-Fragen im Grundlagenfach der Makroskopischen Anatomie schwierig. Die Untersuchung der Antwortmuster auf MC-Fragen in klinischen F&#228;chern hat gezeigt, da&#223; bei einem &#252;berwiegenden Teil der Fragen die richtige Antwort zu offensichtlich ist und gefunden wird. Damit erhalten MC-Fragen ein insgesamt &#228;hnliches Schwierigkeitsniveau wie offene Fragen. Anderseits sind Fragen mit niedrigem Schwierigkeitsgrad ohne Distraktorfunktion, gerade dann sinnvoll, wenn grundlegende Fakten abgefragt werden sollen <TextLink reference="12"></TextLink>. Ein Beispiel daf&#252;r ist die Frage nach den Bestandteilen des Sternums (als richtige Antwort wurde in diesem Fall die Sequenz &#8222;Manubrium sterni, Corpus sterni, Processsus xiphoideus&#8220; gewertet). </Pgraph>
      <Pgraph>Selbstverst&#228;ndlich f&#252;hrt die Anwendung von offenen Fragen nicht automatisch zu einer eindeutigen Fragestellung. In der Erfahrung der Autoren konnte manchmal eine offene Frage nicht mit letzter Eindeutigkeit formuliert werden, ohne die Antwort mit der Fragestellung zu verraten. Dennoch zeigte die Auswertung, da&#223; von den Studierenden &#252;berwiegend die vorgesehene korrekte Antwort (ein Wort oder kurzer Satz) gegeben wurde. Nicht vorgesehene alternative richtige Antworten wurden von den Auswertenden rasch erfa&#223;t und bewertet, und st&#246;rten die Auswertung nicht. Deshalb erforderte die direkte Auswertung der Pr&#252;fungsb&#246;gen mit offenen Fragen nicht mehr Zeit als mit MC-Fragen. Insgesamt gesehen, ist der Aufwand f&#252;r die Erstellung von MC-Fragen, f&#252;r eventuell erforderliche Modifikationen und f&#252;r die Auswertung h&#246;her anzusetzen als beim offenen Fragentyp. Nur bei der maschinellen Auswertung von Antwortb&#246;gen, wie sie bei den zentralen &#228;rztlichen Pr&#252;fungen eingesetzt werden, sind MC-Fragen anderen Frageformen &#252;berlegen, da die Auswertung offener Fragen mit automatisierten Lese- und Pr&#252;fsystemen noch immer Probleme bei der Erkennung von Antworten und der Bewertung von eventuell richtigen Alternativen aufweist. Der f&#252;r eine automatisierte Auswertung erforderliche technische Aufwand (maschinenlesbare Antwortb&#246;gen f&#252;r jedes Testat, PC mit Bogenleser, Auswertesoftware) f&#252;r die Erfolgskontrolle eines Kurses mit 200 - 300 Teilnehmern ist f&#252;r die Mehrzahl der betroffenen Institute oder Kliniken nicht vertretbar. Denkbar ist die Anschaffung eines geeigneten Systems in einem gr&#246;&#223;eren Rahmen, z.B. als Teil eines fakult&#228;tseigenen Pr&#252;fsystems, das einen Fragenpool f&#252;r die Pr&#252;fungen aller Kurse und Fachgebiete in mehreren Semestern einsetzt. In einem kleinen, auf ein Institut oder eine Klinik begrenzten Rahmen, kann eine automatisierte Pr&#252;fung mit offenen Fragen oder MC-Fragen am PC eine Alternative sein. Dazu sind eine nicht von au&#223;en beeinflu&#223;bare Identifikation der einzelnen Teilnehmer und ein wirksamer Schutz vor T&#228;uschungsversuchen (z.B. durch Aufsicht) erforderlich. </Pgraph>
      <Pgraph>Das Interesse der Medizinischen Fakult&#228;ten und der zust&#228;ndigen Landesministerien richtet sich auf die Referenzgruppe derjenigen Studierenden, die nach der Regelstudienzeit zur Pr&#252;fung antreten. Eine objektive Bewertung des Ausbildungserfolgs ist nur m&#246;glich, wenn ein hoher Anteil der Studierenden an einer Fakult&#228;t effizient auf die Anforderungen der Pr&#252;fung vorbereitet wird <TextLink reference="13"></TextLink>. Unabh&#228;ngig vom technischen Aufwand ist bei der Vorbereitung von Studierenden auf die 1. &#196;rztliche Pr&#252;fung im vorklinischen Kurs ein ad&#228;quates Wissensniveau sicherzustellen. M&#252;ndliche Pr&#252;fungen durch erfahrene Lehrkr&#228;fte sind aufgrund ihres Lehreffektes sinnvoll f&#252;r eine gr&#252;ndliche Ausbildung. Leider k&#246;nnen sie bei einer nach unseren Erfahrungen abnehmenden Betreuungsrelation zwischen Lehrkr&#228;ften und Studierenden, kurzen Pr&#252;fungszeiten und begrenzter Kapazit&#228;t der Pr&#252;fer ihre Vorteile kaum ausspielen. Schriftliche Pr&#252;fungen, in denen die unterschiedlichen Fragentypen &#252;berlegt eingesetzt werden, stellen einen zeitsparenden und gut dokumentierbaren Ersatz dar. Wie beschrieben, sind nach der Meinung der Autoren OF zum Pr&#252;fen von Grundbegriffen der im Makroskopie-Kurs vermittelten r&#228;umlichen Orientierung die bessere Wahl. Bei Pr&#252;fungen im fortgeschrittenen Stadium des Kurses, die funktionelle Zusammenh&#228;nge und eventuelle klinische Fragestellung zum Inhalt haben, k&#246;nnen auch MC-Fragen zum Einsatz kommen. Sie spielen in diesem fortgeschrittenen Kursabschnitt auch die Rolle einer methodischen Einf&#252;hrung f&#252;r die 6 Monate sp&#228;ter folgende 1. &#228;rztliche Pr&#252;fung.  </Pgraph>
    </TextBlock>
    <TextBlock linked="yes" name="Danksagung">
      <MainHeadline>Danksagung</MainHeadline>
      <Pgraph>Wir danken Herrn Prof. Dr. Hans-Joachim Selbmann, Institut f&#252;r Medizinische Statistik der Universit&#228;t T&#252;bingen, f&#252;r die Beratung und wertvolle Anregungen, Frau Doris Gu&#233;non f&#252;r die statistische Auswertung der Daten, und Frau Gertrud Fischer f&#252;r ihre engagierte Mitarbeit bei der Datenerhebung.</Pgraph>
    </TextBlock>
    <References linked="yes">
      <Reference refNo="2">
        <RefAuthor>Knox JD</RefAuthor>
        <RefTitle>What is ... a modified essay question&#63;</RefTitle>
        <RefYear>1989</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>51-57</RefPage>
        <RefTotal>Knox JD. What is ... a modified essay question&#63; Med Teach 1989;11(1):51-57.</RefTotal>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Case SM</RefAuthor>
        <RefAuthor>Swanson DB</RefAuthor>
        <RefTitle>Extended matching items: a practical alternative to free response questions</RefTitle>
        <RefYear>1993</RefYear>
        <RefJournal>Teach Learn Med</RefJournal>
        <RefPage>107-115</RefPage>
        <RefTotal>Case SM, Swanson DB. Extended matching items: a practical alternative to free response questions. Teach Learn Med. 1993;5;107-115.</RefTotal>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Schulze J</RefAuthor>
        <RefAuthor>Drolshagen S</RefAuthor>
        <RefAuthor>N&#252;rnberger F</RefAuthor>
        <RefAuthor>Ochsendorf F</RefAuthor>
        <RefAuthor>Sch&#228;fer V</RefAuthor>
        <RefAuthor>Brandt C</RefAuthor>
        <RefTitle>Einfluss des Fragenformates in Multiple-Choice (MC)-Pr&#252;fungen auf die Antwortwahrscheinlichkeit: eine Untersuchung am Beispiel mikrobiologischer Fragen</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>GMS Z Med Ausb</RefJournal>
        <RefPage>Doc 218</RefPage>
        <RefTotal>Schulze J, Drolshagen S, N&#252;rnberger F, Ochsendorf F, Sch&#228;fer V, Brandt C. Einfluss des Fragenformates in Multiple-Choice (MC)-Pr&#252;fungen auf die Antwortwahrscheinlichkeit: eine Untersuchung am Beispiel mikrobiologischer Fragen. GMS Z Med Ausb. 2005;22(4):Doc 218.</RefTotal>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Hofer M</RefAuthor>
        <RefAuthor>Jansen M</RefAuthor>
        <RefAuthor>Soboll S</RefAuthor>
        <RefTitle>Verbesserungspotenzial des Medizinstudiums aus retrospektiver Sicht von Facharztpr&#252;flingen</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Dtsch Med Wochenschr</RefJournal>
        <RefPage>373-378</RefPage>
        <RefTotal>Hofer M, Jansen M, Soboll S. Verbesserungspotenzial des Medizinstudiums aus retrospektiver Sicht von Facharztpr&#252;flingen. Dtsch Med Wochenschr. 2006;131(8):373-378.</RefTotal>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Schulze J</RefAuthor>
        <RefAuthor>Drolshagen S</RefAuthor>
        <RefAuthor>N&#252;rnberger F</RefAuthor>
        <RefAuthor>Siegers S-P</RefAuthor>
        <RefAuthor>Sayed Ali S</RefAuthor>
        <RefTitle>Pr&#252;fen und Pr&#252;fungen im Rahmen der neuen Approbationsordnung - Grunds&#228;tze und Rahmenbedingungen.</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Med Ausbild</RefJournal>
        <RefPage>30-34</RefPage>
        <RefTotal>Schulze J, Drolshagen S, N&#252;rnberger F, Siegers S-P, Sayed Ali S. Pr&#252;fen und Pr&#252;fungen im Rahmen der neuen Approbationsordnung - Grunds&#228;tze und Rahmenbedingungen. Med Ausbild. 2004;21:30-34.</RefTotal>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Drews U</RefAuthor>
        <RefAuthor>Oppitz M</RefAuthor>
        <RefTitle>Computerunterst&#252;tzung f&#252;r eine &#34;just in time&#34;-Anatomie im neuen Lehrgeb&#228;ude auf dem &#214;sterberg</RefTitle>
        <RefYear>2001</RefYear>
        <RefBookTitle>Multimediales Lernen in der medizinischen Ausbildung</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Drews U, Oppitz M. Computerunterst&#252;tzung f&#252;r eine &#34;just in time&#34;-Anatomie im neuen Lehrgeb&#228;ude auf dem &#214;sterberg. In: Bichler KH, Mattauch W (Hrsg.) Multimediales Lernen in der medizinischen Ausbildung. Berlin, Heidelberg, New York: Springer-Verlag; 2001.</RefTotal>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>IAWF Institut f&#252;r Aus-</RefAuthor>
        <RefAuthor>Weiter- und Fortbildung Medizinische Fakult&#228;t Universit&#228;t Bern</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1999</RefYear>
        <RefBookTitle>Kompetent pr&#252;fen. Handbuch zur Planung, Durchf&#252;hrung und Auswertung von Facharztpr&#252;fungen</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>IAWF Institut f&#252;r Aus-, Weiter- und Fortbildung Medizinische Fakult&#228;t Universit&#228;t Bern (Hrsg.). Kompetent pr&#252;fen. Handbuch zur Planung, Durchf&#252;hrung und Auswertung von Facharztpr&#252;fungen. Im Auftrag der: Verbindung der Schweizer &#196;rzte FMH und der &#214;sterreichischen &#196;rztekammer &#214;&#196;K. Bern, Wien: &#214;AK; 1999.</RefTotal>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>M&#246;ltner A</RefAuthor>
        <RefAuthor>Schellberg D</RefAuthor>
        <RefAuthor>J&#252;nger J</RefAuthor>
        <RefTitle>Grundlegende quantitative Analyse medizinischer Pr&#252;fungen</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>GMS Z Med Ausb</RefJournal>
        <RefPage>Doc53</RefPage>
        <RefTotal>M&#246;ltner A, Schellberg D, J&#252;nger J. Grundlegende quantitative Analyse medizinischer Pr&#252;fungen. GMS Z Med Ausb. 2006;23(3):Doc53.</RefTotal>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Winkelmann A</RefAuthor>
        <RefTitle>Anatomical dissection as a teaching method in medial school. A review of the evidence</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>15-22</RefPage>
        <RefTotal>Winkelmann A. Anatomical dissection as a teaching method in medial school. A review of the evidence. Med Teach. 2007;41(1):15-22.</RefTotal>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Moss E</RefAuthor>
        <RefTitle>Multiple choice questions: their value as an assessment too</RefTitle>
        <RefYear>2001</RefYear>
        <RefJournal>Curr Opin Anaestesiol</RefJournal>
        <RefPage>661-666</RefPage>
        <RefTotal>Moss E. Multiple choice questions: their value as an assessment too. Curr Opin Anaestesiol. 2001;14(6):661-666.</RefTotal>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Bhakta B</RefAuthor>
        <RefAuthor>Tennant A</RefAuthor>
        <RefAuthor>Horton M</RefAuthor>
        <RefAuthor>Lawton G</RefAuthor>
        <RefAuthor>Andrich D</RefAuthor>
        <RefTitle>Using response theory to explore the psychometric properties of extended matching questions examination in undergraduate medical examination</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>BMC Med Edu</RefJournal>
        <RefPage>9-22</RefPage>
        <RefTotal>Bhakta B, Tennant A, Horton M, Lawton G, Andrich D. Using response theory to explore the psychometric properties of extended matching questions examination in undergraduate medical examination. BMC Med Edu. 2005;5(1):9-22.</RefTotal>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Br&#228;hler E</RefAuthor>
        <RefAuthor>Wittig U</RefAuthor>
        <RefAuthor>Beckert C</RefAuthor>
        <RefTitle>Der Studienerfolg an Medizinischen Fakult&#228;ten- wie viele Studienanf&#228;nger bestehen nach vier Semestern die &#228;rztliche schriftliche Vorpr&#252;fung&#63;</RefTitle>
        <RefYear>1998</RefYear>
        <RefJournal>Gesundheitswesen</RefJournal>
        <RefPage>317-321</RefPage>
        <RefTotal>Br&#228;hler E, Wittig U, Beckert C. Der Studienerfolg an Medizinischen Fakult&#228;ten- wie viele Studienanf&#228;nger bestehen nach vier Semestern die &#228;rztliche schriftliche Vorpr&#252;fung&#63; Gesundheitswesen. 1998;60(5):317-321.</RefTotal>
      </Reference>
      <Reference refNo="1">
        <RefAuthor>Bundesministerium f&#252;r Gesundheit</RefAuthor>
        <RefTitle>Approbationsordnung f&#252;r &#196;rzte vom 27. Juni 2002</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Bundesgesetzbl</RefJournal>
        <RefPage>2405-2435</RefPage>
        <RefTotal>Bundesministerium f&#252;r Gesundheit. Approbationsordnung f&#252;r &#196;rzte vom 27. Juni 2002. Bundesgesetzbl. 2004; 44:2405-2435.</RefTotal>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <Figure format="png" height="1083" width="1788">
          <MediaNo>2</MediaNo>
          <MediaID>2</MediaID>
          <Caption>
            <Pgraph>
              <Mark1>Abbildung 2: Korrelation zwischen den Pr&#252;fungsergebnissen in offenen Fragen (OF) und Mutiple-Choice (MC)-Fragen f&#252;r das Wintersemester 2003&#47;04 (A), 2004&#47;05 (B) und 2005&#47;06 (C). Der Mittelwert der richtig beantworteten offenen Fragen (OF) im Wintersemester 2003&#47;04 liegt mit x&#61;0.85 (s&#61;0.084) h&#246;her als der der MC-Fragen mit 0.75 (s&#61;0.096). Die Werte im Wintersemester 2005&#47;06 liegen im entsprechenden Bereich: Bei den offenen Fragen wurden im Mittel 0.83 (s&#61;0.098) und bei den MC-Fragen 0.68 (s&#61;0.14) richtig beantwortet. In der graphischen Darstellung der letzteren Ergebnisse ist die Tendenz zur h&#228;ufigeren richtigen Beantwortung der offenen Fragen noch deutlicher zu erkennen. Der Korrelationskoeffizient zwischen OF und MC-Fragen nach Spearman (r</Mark1>
              <Mark1>
                <Subscript>s</Subscript>
              </Mark1>
              <Mark1>) betr&#228;gt bei (A) 0.6792, bei (B) 0.33085 und bei (C) 0.2933. </Mark1>
            </Pgraph>
            <Pgraph>
              <Mark1>(D) Der entsprechende Wert f&#252;r die gesamte Stichprobe liegt mit r</Mark1>
              <Mark1>
                <Subscript>s</Subscript>
              </Mark1>
              <Mark1>&#61;0.45300 in der Mitte. Die Punktewolke der Ergebnisse liegen in allen Diagrammen tendenziell auf der auf der Seite der offenen Fragen. Eine Ausnahme stellen die Ergebnisse des Wintersemesters 2004&#47;05 dar (siehe Diskussion).</Mark1>
            </Pgraph>
          </Caption>
        </Figure>
        <Figure format="png" height="1681" width="1434">
          <MediaNo>1</MediaNo>
          <MediaID>1</MediaID>
          <Caption>
            <Pgraph>
              <Mark1>Abbildung 1: Korrelation der Pr&#252;fungsergebnissen der offenen Fragen (OF) des Eingangstestates mit den Mittelwerten der sp&#228;teren Testate in den Wintersemestern 2003&#47;04 (A) und in einem ausgew&#228;hlten Kollektiv des Wintersemesters 2004&#47;2005 (B). Au&#223;erdem werden die Korrelationen in der Semesterkohorte von 2005&#47;06 (C) und in der gesamten Stichprobe (D) gezeigt. Die in die Diagramme eingezeichneten K&#228;sten umrei&#223;en die Leistungsgruppen der Teilnehmer in der Stichprobe. </Mark1>
            </Pgraph>
          </Caption>
        </Figure>
        <Figure format="png" height="1824" width="1294">
          <MediaNo>3</MediaNo>
          <MediaID>3</MediaID>
          <Caption>
            <Pgraph>
              <Mark1>Abbildung 3</Mark1>
            </Pgraph>
          </Caption>
        </Figure>
        <Figure format="png" height="1863" width="1294">
          <MediaNo>4</MediaNo>
          <MediaID>4</MediaID>
          <Caption>
            <Pgraph>
              <Mark1>Abbildung 4</Mark1>
            </Pgraph>
          </Caption>
        </Figure>
        <NoOfPictures>4</NoOfPictures>
      </Figures>
      <InlineFigures>
        <Figure format="png" height="24" width="24">
          <MediaNo>1</MediaNo>
          <MediaID>1</MediaID>
          <AltText>Formel 1</AltText>
        </Figure>
        <NoOfPictures>1</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>
