<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>zma000985</Identifier>
    <IdentifierDoi>10.3205/zma000985</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0009859</IdentifierUrn>
    <ArticleType language="en">commentary</ArticleType>
    <ArticleType language="de">Kommentar</ArticleType>
    <TitleGroup>
      <Title language="en">Overcome the 60&#37; passing score and improve the quality of assessment</Title>
      <TitleTranslated language="de">Die 60&#37; Bestehensgrenze &#252;berwinden und die Qualit&#228;t der Pr&#252;fungen verbessern</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Tekian</Lastname>
          <LastnameHeading>Tekian</LastnameHeading>
          <Firstname>Ara</Firstname>
          <Initials>A</Initials>
          <AcademicTitleSuffix>PhD, MHPE</AcademicTitleSuffix>
        </PersonNames>
        <Address>University of Illinois, College of Medicine at Chicago, 808 South Wood Street (MC-783) , Chicago, IL 60612-7302, USA<Affiliation>University of Illinois, College of Medicine at Chicago, Chicago, USA</Affiliation></Address>
        <Email>tekian&#64;uic.edu</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Norcini</Lastname>
          <LastnameHeading>Norcini</LastnameHeading>
          <Firstname>John</Firstname>
          <Initials>J</Initials>
          <AcademicTitle>Dr.</AcademicTitle>
          <AcademicTitleSuffix>Ph.D</AcademicTitleSuffix>
        </PersonNames>
        <Address>Foundation for Advancement of International Medical Education and Research, 3624 Market Street Philadelphia, PA 19104-2685 USA<Affiliation>Foundation for Advancement of International Medical Education and Research , Philadelphia, USA</Affiliation></Address>
        <Email>JNorcini&#64;Faimer.org</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <SectionHeading language="en">Assessment</SectionHeading>
      <SectionHeading language="de">Pr&#252;fungen</SectionHeading>
    </SubjectGroup>
    <DateReceived>20140114</DateReceived>
    <DateRevised>20140114</DateRevised>
    <DateAccepted>20140526</DateAccepted>
    <DatePublishedList>
      
    <DatePublished>20151015</DatePublished></DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>1860-3572</ISSN>
        <Volume>32</Volume>
        <Issue>4</Issue>
        <JournalTitle>GMS Zeitschrift f&#252;r Medizinische Ausbildung</JournalTitle>
        <JournalTitleAbbr>GMS Z Med Ausbild</JournalTitleAbbr>
        <IssueTitle>Pr&#252;fungen</IssueTitle>
      </Journal>
    </SourceGroup>
    <ArticleNo>43</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph>Es ist weltweit h&#228;ufig &#252;blich, formale Bestehensgrenzen (z. B. 60&#37;) f&#252;r alle Pr&#252;fungen festzulegen. Dies f&#252;hrt zu Problemen bei der Entwicklung von Pr&#252;fungen, da der gesamte Inhalt der Pr&#252;fung im Hinblick auf diesen festgelegten Standard abzustimmen ist. Infolgedessen kann die Validit&#228;t der Entscheidungen, die auf diesen Pr&#252;fungen fu&#223;en, nachteilig beeinflusst werden und den Nutzen f&#252;r ihren beabsichtigten Verwendungszweck einschr&#228;nken.</Pgraph><Pgraph>Im Laufe der letzten Jahrzehnte begegneten viele Institute diesem Problem durch die Verwendung von Verfahren des &#8222;Standard-Settings&#8220;, also Festlegungen der Bestehensgrenzen, die vertretbar, akzeptabel und zuverl&#228;ssig sind <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>. Hierzu steht eine Vielzahl an Methoden zur Verf&#252;gung und die Hauptgr&#252;nde, diese zu nutzen, bestehen darin, sicherzustellen, dass der Testinhalt ad&#228;quat ausgew&#228;hlt und so fair wie m&#246;glich gegen&#252;ber den Studierenden und anderen Testanwendern ist <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>.</Pgraph><Pgraph>Ein Hindernis f&#252;r die breitere Anwendung dieser Verfahren ist, dass vielerorts die Tatsache beanstandet wird, dass dabei die formal festgesetzte Bestehensgrenze (z. B. 60&#37;) nicht eingehalten wird. Es ist jedoch m&#246;glich, durch Umskalierungen die Bestehensgrenze neu zu definieren, so dass diese dem festgelegten Standard entspricht und dieselbe Skalierung auf alle Testergebnisse anwendet. Dies stellt sicher, dass die institutionellen Richtlinien nicht verletzt werden und erm&#246;glicht die Anwendung der anerkannten Verfahren des Standard-Settings. Im Gegenzug gestattet die Anwendung dieser Verfahren die Auswahl der Pr&#252;fungsinhalte ohne Ber&#252;cksichtigung des festgelegten Standards, was die Validit&#228;t der getroffenen Entscheidungen erh&#246;ht und eine gerechtere und genauere Pr&#252;fung der Studierenden erm&#246;glich.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph>It is not unusual for institutions around the world to have fixed standards (e.g., 60&#37;) for all of their examinations. This creates problems in the creation of examinations, since all of the content has to be chosen with an eye toward this fixed standard. As a result, the validity of the decisions based on these examinations can be adversely influenced, making them less useful for their intended purposes.  </Pgraph><Pgraph>Over the past several decades, many institutions have addressed this problem by using standard setting methods which are defensible, acceptable, and credible <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>. Many methods are available and the major reasons to use them is to ensure that test content is appropriately selected and to be as fair to the students and other test users as possible <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>.  </Pgraph><Pgraph>One barrier to the wider use of these methods is that some institutions object to the fact that the fixed standard (e.g., 60&#37;) has not been applied. However, it is possible to rescale the passing score so that it is equal to the fixed standard, and then apply that same rescaling calculation to all of the test scores. This ensures that the institutional guidelines are not violated and allows the application of accepted methods of standard-setting. In turn, the application of these methods allow the content of the test to be selected without regard to a fixed standard, increases the validity of the decisions being made, and ensures a fairer and more accurate test of students.</Pgraph></Abstract>
    <TextBlock language="en" linked="yes" name="Commentary">
      <MainHeadline>Commentary</MainHeadline><Pgraph>Over the past several decades, many authors have advocated for setting standards for passing a test which are defensible, acceptable, and credible <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>. Many methods are available and the major reasons to use them is to ensure that test content is appropriately selected and to be as fair to the students as possible <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>.  </Pgraph><Pgraph>The implementation of a standard setting method moves the passing standard away from a fixed number (i.e., 60&#37;) to a cut score which can vary depending on the difficulty of the test. For example, when two forms of an exam are administered, where Form A is slightly more difficult than Form B, setting the same passing standard for both will give an unfair advantage to students taking Form B &#8211; this threatens the validity of the test, by passing candidates who may not be qualified simply because of the test characteristics (difficulty) of the exam. Setting a relative passing standard (e.g., mean &#8211; 2 x standard deviation) does not overcome this problem, because the ability of students can change from year to year. Application of an absolute standard-setting method that relies on the judgments of a panel of expert is preferred.</Pgraph><Pgraph>Examinations may be administered for formative and summative purposes. Formative assessment is focused on providing feedback to the students. However, summative examinations which are focused on making decisions about students&#8217; competence might have a significant impact on a student&#8217;s career pathway. </Pgraph><Pgraph>In all of the health professions, including medicine, the undergraduate students need to be judged on their mastery of their professional content. They need to be competent in terms of knowledge and performance, and therefore, need to be assessed against a set of criteria or standards. The standard setting processes utilized for such purposes generate absolute standards, in contrast to relative standards where students are judged against each other.  These standards are considered absolute, because they are expressed in terms of how much content the students need to know and thus theoretically all could pass or fail. Therefore, the success rate for any examination might vary depending on the passing score established by content experts.   </Pgraph><Pgraph>There are various methods of setting absolute standards, and the judgments might be focused on either the items, know as item-based (Angoff, Ebel <TextLink reference="4"></TextLink>, <TextLink reference="5"></TextLink>), or on the examinee, that is examinee-based (Borderline or Contrasting group methods <TextLink reference="6"></TextLink>). There are also compromise methods of setting standards, for example the Hofstee method, where judgments about how much needs to be known are combined with the relative performance of the students, also popularly known as the relative-absolute compromise method <TextLink reference="7"></TextLink>. The passing scores might vary depending on the choice of method <TextLink reference="2"></TextLink>, <TextLink reference="8"></TextLink>.  </Pgraph><Pgraph>In some methods, the judgments underlying standard setting are based on the definition of a hypothetical borderline student who would have a 50&#37;-50&#37; probability of passing the exam. The description of the borderline student is based on a consensus definition in the content areas represented by the blueprint and generated by the expert panel. This definition is based on a hypothetical candidate who on a given day would pass the exam and on a different day, fail the exam; the competency demonstrated by this candidate should represent uncertainty about the qualifications and attributes required for a passing candidate; it could also include descriptions of &#8220;forgivable&#8221; qualities that the candidate may not yet have, but over the course of his or her training, continue to master.     </Pgraph><Pgraph>Although the Angoff method for standard setting is a very popular method used in many medical schools, attention must be paid to the selection of judges, since their level of expertise, and the ability to answer the exam items correctly may affect the passing score <TextLink reference="9"></TextLink>. Choice of credible judges and their calibration are equally important in standard setting, particularly during discussions of the borderline-examinee, and during training sessions&#47; exercises where the probability of a borderline-examinee answering or performing a checklist item correctly is being estimated <TextLink reference="2"></TextLink>.</Pgraph><Pgraph>Some institutions have started using the Angoff or other methods to set the passing score for OSCE examinations.  They have adopted this strategy for OSCE examinations because the institution will not notice or object that the 60&#37; passing score is not applied, or they have manipulated the difficulty of the OSCE examination in such a way as to have a passing score of 60&#37; without any adjustments. However, the results of a standard setting exercise can also be rescaled to the passing score determined by the university, such as 60&#37;. This can be achieved, without violating the institutional guidelines, by converting the raw passing score of an exam, determined through standard setting into a rescaled passing standard of 60&#37; <TextLink reference="10"></TextLink>. The scores of students are then rescaled as well.  For example, if the passing score using the Angoff method for an MCQ examination was calculated to be 54&#37;, that score is rescaled to 60&#37; and then the examination is rescaled as well, so that the students and passing score are consistent with the &#8216;60&#37;&#8217; policy. Therefore, following a standard setting method will overcome the capricious nature of assigning a passing score of 60&#37;, by simply transposing the true passing score to the institutionally required cut-off score.  </Pgraph><Pgraph>There is no &#8220;gold standard&#8221; for setting passing scores <TextLink reference="11"></TextLink>, <TextLink reference="2"></TextLink>. Usually the choice of the standard setting method is based on the available resources and the practical realities of the educational environment.  As such, it is critical to document all procedures used in establishing the passing standard, especially in a language the school is willing to make public. Every effort should be exerted to use one of the standard setting approaches described in the literature so as to make the passing scores defensible and meaningful. To accomplish this, there needs to be intensive faculty development, so that everyone understands the importance and consequences of setting standards, and are trained and calibrated to set passing scores.  Moreover, faculty selected to participate in the standard setting process need to be representative and acceptable to the stakeholders. This may also require institutional change and one way to accomplish this is to hold meaningful discussions with institutional leaders about the rationale for standard-setting and evidence behind it. Using standard setting procedures necessitates changing the institutional assessment culture and promoting fairness and justice in measuring the competence of the students.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Kommentar">
      <MainHeadline>Kommentar</MainHeadline><Pgraph>Im Laufe der letzten Jahrzehnte wurde von vielen Autoren vorgeschlagen, Standards f&#252;r das Bestehen einer Pr&#252;fung zu setzen, die vertretbar, akzeptabel und zuverl&#228;ssig sind <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>. Hierzu stehen viele Verfahren zur Verf&#252;gung und die Hauptgr&#252;nde, diese anzuwenden, ist es, sicher zu stellen, dass die Pr&#252;fungsinhalte ad&#228;quat ausgew&#228;hlt werden und so fair wie m&#246;glich gegen&#252;ber den Studierenden sind <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>.</Pgraph><Pgraph>Die Implementierung eines Standard-Setting-Verfahrens bewegt die Bestehensgrenze weg von einer festgelegten Zahl (z. B. 60&#37;) hin zu variablen Notengrenzen, die von der Testschwierigkeit abh&#228;ngig sind. Bespiel: Wenn zwei Varianten einer Pr&#252;fung verwendet werden, von welcher Pr&#252;fung A geringf&#252;gig schwieriger ist als Pr&#252;fung B, ergibt sich daraus, sofern dieselbe Bestehensgrenze f&#252;r beide Pr&#252;fungen angewendet wird, ein unfairer Vorteil f&#252;r Studierende mit Pr&#252;fung B. Dies gef&#228;hrdet die Validit&#228;t der Pr&#252;fung, da nicht qualifizierten Kandidaten aufgrund der Testcharakteristika (Schwierigkeit) der Pr&#252;fung bestehen. Das Setzen einer relativen Bestehensgrenze (z. B. Mittelwert &#8211; 2 Standardabweichungen) l&#246;st dieses Problem nicht, da sich das K&#246;nnen der Studierenden von Jahr zu Jahr &#228;ndern kann. Die Anwendung eines absoluten Standard-Setting-Verfahrens, das auf dem Urteil eines Expertengremiums beruht, ist zu bevorzugen.</Pgraph><Pgraph>Pr&#252;fungen k&#246;nnen f&#252;r formative und summative Zwecke eingesetzt werden. Formative Pr&#252;fungen konzentrieren sich darauf, den Studierenden Feedback zu geben. Summative Pr&#252;fungen, die auf Entscheidungen &#252;ber das Vorhandensein erforderlicher Kompetenzen fokussiert sind, k&#246;nnen einen entscheidenden Einfluss auf den Karriereweg von Studierenden haben.</Pgraph><Pgraph>In allen Gesundheitsberufen, die Medizin eingeschlossen, m&#252;ssen die Studierenden auf der Grundlage ihres beruflichen K&#246;nnens und Wissens beurteilt werden. Sie m&#252;ssen in Bezug auf Wissen und Leistung kompetent sein und deshalb anhand einer Menge von Kriterien oder Standards gepr&#252;ft werden. Das f&#252;r diesen Zweck genutzte Standard-Setting-Verfahren generiert absolute Standards im Gegensatz zu relativen (normorientierten) Standards, die Studierende miteinander vergleichen. Diese Standards werden als &#8222;absolut&#8220; bezeichnet, weil sie als Bedingungen formuliert werden, welche Inhalte die Studierenden wissen m&#252;ssen und in der Theorie folglich jeder &#8222;bestehen&#8220; oder &#8222;nicht bestehen&#8220; kann. Daher kann die Erfolgsrate f&#252;r jede Pr&#252;fung variieren, abh&#228;ngig von der Bestehensgrenze, die von einem Expertengremium festgesetzt wurde.</Pgraph><Pgraph>Es gibt eine Vielzahl von Verfahren zur Festsetzung absoluter Standards, diese k&#246;nnen auf die Testaufgaben (testzentriert: Angoff, Ebel <TextLink reference="4"></TextLink>, <TextLink reference="5"></TextLink>) oder auf den Pr&#252;fling (pr&#252;flingszentriert: Borderline-Methode oder Kontrast-Gruppen-Methode) fokussiert sein <TextLink reference="6"></TextLink>. Es existieren auch Standard-Setting-Verfahren, die einen Kompromiss zwischen diesen darstellen, z. B. die Hofstee-Methode (&#8222;relative-absolute compromise method&#8220;). Dabei werden Festlegungen, welche Inhalte gewusst werden m&#252;ssen mit der relativen Leistung der Studierenden kombiniert. <TextLink reference="7"></TextLink>. Abh&#228;ngig vom gew&#228;hlten Verfahren k&#246;nnen die Bestehensgrenzen variieren <TextLink reference="2"></TextLink>, <TextLink reference="8"></TextLink>.</Pgraph><Pgraph>Bei einigen Verfahren basieren die Beurteilungen der zugrunde liegenden Standard-Settings auf der Definition eines hypothetischen Borderline-Pr&#252;fungskandidaten, der mit einer 50&#37;-igen Wahrscheinlichkeit die Pr&#252;fung besteht. Die Beschreibung des Borderline-Pr&#252;fungskandidaten basiert auf einer Konsensentscheidung bez&#252;glich der Inhaltsbereiche, die durch einen Blueprint repr&#228;sentiert und von einem Expertengremium getroffen wurden. Diese Definition basiert auf einem hypothetischen Pr&#252;fungskandidaten, der an einem bestimmten Tag die Pr&#252;fung bestehen w&#252;rde und sie an einem anderen Tag nicht bestehen w&#252;rde; die Kompetenz, die von einem solchen Pr&#252;fungskandidaten gezeigt wird, soll die Unsicherheit &#252;ber die zum Bestehen erforderlichen Qualifikationen und Eigenschaften repr&#228;sentieren; sie k&#246;nnen auch Beschreibungen von &#8222;verzeihlichen&#8220; Qualit&#228;ten&#47; Eigenschaften umfassen, die der Kandidat zwar noch nicht hat, aber im Laufe seiner Ausbildung noch erlangen kann.</Pgraph><Pgraph>Obwohl die Angoff-Methode als Standard-Setting an vielen Medizinischen Fakult&#228;ten eine sehr beliebte Methode ist, muss die Aufmerksamkeit auf die Auswahl der Experten gerichtet werden, da ihre Expertise und ihre F&#228;higkeit, die Pr&#252;fungsfragen korrekt zu beantworten, die Bestehensgrenze beeinflussen kann <TextLink reference="9"></TextLink>. Die Wahl zuverl&#228;ssiger Experten und ihrer Kalibrierung sind gleicherma&#223;en f&#252;r das Standard-Setting wichtig. Dies gilt besonders f&#252;r die Diskussion des Borderline-Pr&#252;fungskandidaten und im Verlauf von Probedurchg&#228;ngen, in denen die Wahrscheinlichkeit eines Borderline-Kandidaten, ein Checklistenitem zu beantworten oder korrekt auszuf&#252;hren, abgesch&#228;tzt wird <TextLink reference="2"></TextLink>. </Pgraph><Pgraph>An einigen Institutionen wurde begonnen, die Angoff-Methode oder andere Verfahren zu verwenden, um die Bestehensgrenze f&#252;r OSCE-Pr&#252;fungen festzulegen. Sie haben diese Strategie f&#252;r OSCE-Pr&#252;fungen gew&#228;hlt, weil nicht bemerkt oder nichts dagegen eingewandt wurde, von der 60&#37;-Bestehensgrenze abzuweichen, oder aber es wurde die Schwierigkeit der OSCE-Pr&#252;fung so beeinflusst, dass eine Bestehensgrenze von 60&#37; ohne Anpassungen verwendet werden kann. Es kann jedoch auch das Ergebnis eines Standard-Settings auf die durch die Universit&#228;t festgelegte Bestehensgrenze, wie etwa 60&#37;, reskaliert werden: Dies kann ohne Verletzung der Institutsrichtlinien durch die Umwandlung der Rohwert-Bestehensgrenze einer Pr&#252;fung, die durch ein Standard-Setting festgelegt wurde, in eine neuskalierte Bestehensgrenze von 60&#37; erreicht werden <TextLink reference="10"></TextLink>. Die erreichten Punktzahlen der Studierenden werden gleicherma&#223;en neu skaliert. Beispiel: Wurde die Bestehensgrenze f&#252;r eine MCQ-Pr&#252;fung auf 54&#37; mittels der Angoff-Methode ermittelt, wird dieser Wert der Bestehensgrenze auf 60&#37; neuskaliert. Ebenso wird die Pr&#252;fung neuskaliert, so dass die Punkte der Studierenden und die Bestehensgrenze mit der &#8218;60&#37;&#8216;-Regel konsistent sind. Damit kann nach einem Standard-Setting-Verfahrens die willk&#252;rliche Natur einer festen Bestehensgrenze von 60&#37; durch eine einfache Neuskalierung der urspr&#252;nglichen Bestehensgrenze an die institutionell geforderte &#252;berwunden werden.</Pgraph><Pgraph>F&#252;r die Festlegung der Bestehensgrenze gibt es keinen &#8222;Goldstandard&#8220; <TextLink reference="11"></TextLink>, <TextLink reference="2"></TextLink>. &#220;blicherweise basiert die Wahl des Standard-Setting-Verfahrens auf den verf&#252;gbaren Ressourcen und der Ausstattung f&#252;r die Ausbildung. Es ist entscheidend, alle angewandten Verfahren zur Festlegung der Bestehensgrenze zu dokumentieren und dies in der f&#252;r die Fakult&#228;t &#252;blichen Form publik zu machen. Es sollte jede Anstrengung unternommen werden, um eines, der in der Literatur beschrieben Standard-Setting-Verfahren einzusetzen, um so die Bestehensgrenze vertretbar und bedeutsam zu machen. Um dies zu erreichen, ist eine intensive Fakult&#228;tsentwicklung erforderlich, damit jeder die Wichtigkeit und die Konsequenzen der Festsetzung von Standards versteht, trainiert und bef&#228;higt ist, Bestehensgrenzen festzulegen. Dar&#252;ber hinaus m&#252;ssen die Dozenten, die am Prozess des Standard-Settings teilnehmen, f&#252;r die Beteiligten repr&#228;sentativ sein und von ihnen akzeptiert werden. Dies k&#246;nnte auch einen institutionellen Wandel verlangen. Ein Weg, dies zu erreichen, ist es Diskussionen mit der Fakult&#228;tsleitung &#252;ber das Rational des Standard-Settings und die dahinterstehende Evidenz zu f&#252;hren. Die Verwendung von Standard-Setting-Verfahren verlangt eine &#196;nderung der Pr&#252;fungskultur der Institutionen sowie die Forderung nach Fairness und Gerechtigkeit bei der Kompetenzmessung der Studierenden.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Competing interests">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Interessenkonflikt">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autoren erkl&#228;ren, dass sie keine Interessenkonflikte im Zusammenhang mit diesem Artikel haben. </Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Norcini JJ</RefAuthor>
        <RefTitle>Setting standards on educational tests</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>464-946</RefPage>
        <RefTotal>Norcini JJ. Setting standards on educational tests. Med Educ. 2003;37(5):464-946. DOI: 10.1046&#47;j.1365-2923.2003.01495.x</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1046&#47;j.1365-2923.2003.01495.x</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Downing SM</RefAuthor>
        <RefAuthor>Tekian A</RefAuthor>
        <RefAuthor>Yudkowsky R</RefAuthor>
        <RefTitle>Procedures for establishing defensible absolute passing scores on performance examinations in health professions education</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Teach Learn Med</RefJournal>
        <RefPage>50-57</RefPage>
        <RefTotal>Downing SM, Tekian A, Yudkowsky R. Procedures for establishing defensible absolute passing scores on performance examinations in health professions education. Teach Learn Med. 2006;18(1):50-57. DOI: 10.1207&#47;s15328015tlm1801&#95;11</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1207&#47;s15328015tlm1801&#95;11</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Yudkowsky R</RefAuthor>
        <RefAuthor>Downing SM</RefAuthor>
        <RefAuthor>Tekian A</RefAuthor>
        <RefTitle>Standard setting</RefTitle>
        <RefYear>2009</RefYear>
        <RefBookTitle>Assessment in health professions education</RefBookTitle>
        <RefPage>119-148</RefPage>
        <RefTotal>Yudkowsky R, Downing SM, Tekian A. Standard setting. In: Downing SM, Yudkowsky R (Hrsg). Assessment in health professions education. New York&#47;London: Routledge; 2009. S.119-148.</RefTotal>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Angoff WH</RefAuthor>
        <RefTitle>Scales, norms, and equivalent scores</RefTitle>
        <RefYear>1971</RefYear>
        <RefBookTitle>Educational measurement</RefBookTitle>
        <RefPage>508-600</RefPage>
        <RefTotal>Angoff WH. Scales, norms, and equivalent scores. In: Thorndike RL (Hrsg). Educational measurement. 2nd ed. Washington, DC: American Council on Education; 1971. S.508-600.</RefTotal>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Ebel RL</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1972</RefYear>
        <RefBookTitle>Essentials of educational measurement</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Ebel RL. Essentials of educational measurement. 2nd ed. Englewood Cliffs, NJ: Prentice Hall; 1972.</RefTotal>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Livingston SA</RefAuthor>
        <RefAuthor>Zieky MJ</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1982</RefYear>
        <RefBookTitle>Passing scores: A manual for setting standards of performance on educational and occupational tests</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Livingston SA, Zieky MJ. Passing scores: A manual for setting standards of performance on educational and occupational tests. Princeton, NJ: Educational Testing Service; 1982.</RefTotal>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Hofstee WK</RefAuthor>
        <RefTitle>The case for compromise in educational selection and grading</RefTitle>
        <RefYear>1983</RefYear>
        <RefBookTitle>On educational testing</RefBookTitle>
        <RefPage>107-127</RefPage>
        <RefTotal>Hofstee WK. The case for compromise in educational selection and grading. In: Anderson SB, Helmick JS (Hrsg). On educational testing. San Francisco: Jossey-Bass, 1983. S.107-127.</RefTotal>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Bouriscot K</RefAuthor>
        <RefAuthor>Roberts T</RefAuthor>
        <RefAuthor>Pell G</RefAuthor>
        <RefTitle>Standard setting for clinical competence at graduation from medical school: A comparison of passing scores across five medical schools</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Adv Health Sci Educ Theory Pract</RefJournal>
        <RefPage>173-183</RefPage>
        <RefTotal>Bouriscot K, Roberts T, Pell G. Standard setting for clinical competence at graduation from medical school: A comparison of passing scores across five medical schools. Adv Health Sci Educ Theory Pract. 2006;11(2):173-183. DOI: 10.1007&#47;s10459-005-5291-8</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;s10459-005-5291-8</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Verheggen MM</RefAuthor>
        <RefAuthor>Muijtjens AM</RefAuthor>
        <RefAuthor>Van Os J</RefAuthor>
        <RefAuthor>Schuwirth LW</RefAuthor>
        <RefTitle>Is an Angoff standard an indication of minimal competence of examinees or of judges&#63;</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Adv Health Sci Educ Theory Pract</RefJournal>
        <RefPage>203-211</RefPage>
        <RefTotal>Verheggen MM, Muijtjens AM, Van Os J, Schuwirth LW. Is an Angoff standard an indication of minimal competence of examinees or of judges&#63; Adv Health Sci Educ Theory Pract. 2008;13(2):203-211. DOI: 10.1007&#47;s10459-006-9035-1</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;s10459-006-9035-1</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Kolen MJ</RefAuthor>
        <RefAuthor>Brennan R L</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2004</RefYear>
        <RefBookTitle>Test equating, scaling, and linking: Methods and practices</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Kolen MJ, Brennan R L. Test equating, scaling, and linking: Methods and practices. 2nd Edition. New York: Springer-Verlag; 2004. DOI: 10.1007&#47;978-1-4757-4310-4</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;978-1-4757-4310-4</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Friedman M</RefAuthor>
        <RefTitle>AMEE Guide No. 18: Standard setting in student assessment</RefTitle>
        <RefYear>2000</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>120-130</RefPage>
        <RefTotal>Friedman M. AMEE Guide No. 18: Standard setting in student assessment. Med Teach. 2000;22(2):120-130. DOI: 10.1080&#47;01421590078526</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1080&#47;01421590078526</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>