<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>zma001791</Identifier>
    <IdentifierDoi>10.3205/zma001791</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0017919</IdentifierUrn>
    <ArticleType language="en">research article</ArticleType>
    <ArticleType language="de">Forschungsarbeit</ArticleType>
    <TitleGroup>
      <Title language="en">Multisource feedback in residency training: A quantitative study to investigate the feedback conversation</Title>
      <TitleTranslated language="de">Multisource-Feedback in der &#228;rztlichen Weiterbildung: Eine quantitative Studie zur Untersuchung des Feedbackgespr&#228;chs</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Hennel</Lastname>
          <LastnameHeading>Hennel</LastnameHeading>
          <Firstname>Eva K.</Firstname>
          <Initials>EK</Initials>
        </PersonNames>
        <Address language="en">Universit&#228;t Bern, Institut f&#252;r Medizinische Lehre, Department for Assessment and Evaluation (AAE), Mittelstrasse 43, CH-3012 Bern, Switzerland<Affiliation>University of Bern, Institute for Medical Education, Department for Assessment and Evaluation (AAE), Bern, Switzerland</Affiliation><Affiliation>Schweizerisches Institut f&#252;r &#228;rztliche Weiter- und Fortbildung SIWF, Bern, Switzerland</Affiliation></Address>
        <Address language="de">Universit&#228;t Bern, Institut f&#252;r Medizinische Lehre, Abteilung f&#252;r Assessment und Evaluation (AAE), Mittelstr. 43, CH-3012 Bern, Schweiz<Affiliation>Universit&#228;t Bern, Institut f&#252;r Medizinische Lehre, Abteilung f&#252;r Assessment und Evaluation (AAE), Bern, Schweiz</Affiliation><Affiliation>Schweizerisches Institut f&#252;r &#228;rztliche Weiter- und Fortbildung SIWF, Bern, Schweiz</Affiliation></Address>
        <Email>eva.hennel&#64;faculty.unibe.ch</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Lahner</Lastname>
          <LastnameHeading>Lahner</LastnameHeading>
          <Firstname>Felicitas-M.</Firstname>
          <Initials>FM</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>University of Bern, Institute for Medical Education, Department for Assessment and Evaluation (AAE), Bern, Switzerland</Affiliation>
          <Affiliation>University of Applied Sciences, Department of Health Professions, Bern, Switzerland</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t Bern, Institut f&#252;r Medizinische Lehre, Abteilung f&#252;r Assessment und Evaluation (AAE), Bern, Schweiz</Affiliation>
          <Affiliation>Berner Fachhochschule, Departement Gesundheit, Bern, Schweiz</Affiliation>
        </Address>
        <Email>felicitas-maria.lahner&#64;bfh.ch</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Zweifel</Lastname>
          <LastnameHeading>Zweifel</LastnameHeading>
          <Firstname>Noemi</Firstname>
          <Initials>N</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>University Children&#8217;s Hospital Z&#252;rich, Department of Surgery, Z&#252;rich, Switzerland</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;tskinderspital Z&#252;rich, Chirurgische Klinik, Z&#252;rich, Schweiz</Affiliation>
        </Address>
        <Email>noemi.zweifel&#64;kispi.uzh.ch</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Harendza</Lastname>
          <LastnameHeading>Harendza</LastnameHeading>
          <Firstname>Sigrid</Firstname>
          <Initials>S</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>University Medical Centre Hamburg-Eppendorf, III. Department of Internal Medicine, Hamburg, Germany</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf, III. Medizinische Klinik, Hamburg, Deutschland</Affiliation>
        </Address>
        <Email>harendza&#64;uke.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Neuhaus</Lastname>
          <LastnameHeading>Neuhaus</LastnameHeading>
          <Firstname>Kathrin</Firstname>
          <Initials>K</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>University Children&#8217;s Hospital Z&#252;rich, Department of Surgery, Z&#252;rich, Switzerland</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;tskinderspital Z&#252;rich, Chirurgische Klinik, Z&#252;rich, Schweiz</Affiliation>
        </Address>
        <Email>kathrin.neuhaus&#64;kispi.uzh.ch</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Huwendiek</Lastname>
          <LastnameHeading>Huwendiek</LastnameHeading>
          <Firstname>S&#246;ren</Firstname>
          <Initials>S</Initials>
        </PersonNames>
        <Address language="en">
          <Affiliation>University of Bern, Institute for Medical Education, Department for Assessment and Evaluation (AAE), Bern, Switzerland</Affiliation>
        </Address>
        <Address language="de">
          <Affiliation>Universit&#228;t Bern, Institut f&#252;r Medizinische Lehre, Abteilung f&#252;r Assessment und Evaluation (AAE), Bern, Schweiz</Affiliation>
        </Address>
        <Email>soeren.huwendiek&#64;unibe.ch</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">professional identity formation</Keyword>
      <Keyword language="en">formative assessment</Keyword>
      <Keyword language="en">multisource feedback</Keyword>
      <Keyword language="en">residency training</Keyword>
      <Keyword language="en">workplace-based assessment</Keyword>
      <Keyword language="de">Entwicklung der professionellen Identit&#228;t</Keyword>
      <Keyword language="de">formatives Pr&#252;fen</Keyword>
      <Keyword language="de">Multisource Feedback</Keyword>
      <Keyword language="de">&#228;rztliche Weiterbildung</Keyword>
      <Keyword language="de">arbeitsplatzbasiertes Assessment</Keyword>
      <SectionHeading language="en">feedback</SectionHeading>
      <SectionHeading language="de">Feedback</SectionHeading>
    </SubjectGroup>
    <DateReceived>20241112</DateReceived>
    <DateRevised>20250610</DateRevised>
    <DateAccepted>20250728</DateAccepted>
    <DatePublishedList>
      <DatePublished>20251117</DatePublished>
    </DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>2366-5017</ISSN>
        <Volume>42</Volume>
        <Issue>5</Issue>
        <JournalTitle>GMS Journal for Medical Education</JournalTitle>
        <JournalTitleAbbr>GMS J Med Educ</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>67</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph><Mark1>Einleitung: </Mark1>Multisource Feedback (MSF) ist ein Bewertungsformat in der medizinischen Aus- und Weiterbildung. Es liefert individuelles Feedback auf Grundlage mehrerer Bewertungen, das dann in einem Feedbackgespr&#228;ch zwischen der Supervisionsperson und der Person in Weiterbildung zur Entwicklung von Lernzielen verwendet werden kann. Wir haben diese Studie durchgef&#252;hrt, um zu untersuchen, wie Weiterzubildende und Supervisionspersonen die Lernziele festlegen und worauf sich diese Lernziele beziehen.</Pgraph><Pgraph><Mark1>Methoden: </Mark1>Die Studie umfasste 75 MSF-Datens&#228;tze, die pro Person in Weiterbildung aus 12 bis 15 externen Bewertungen und einer Selbstbewertung bestanden. Die Daten umfassten insgesamt 1015 externe Bewertungen und 75 Selbstbewertungen. Da zehn Datens&#228;tze keine Lernziele enthielten, konnten nur 65 MSF-Datens&#228;tze analysiert werden. Die Datens&#228;tze enthielten schriftliches MSF-Feedback, einschliesslich skalenbasierter Bewertungen und narrativer Kommentare sowie strukturierte Protokolle der Feedbackgespr&#228;che mit den daraus resultierenden Lernzielen, die nach Themen sortiert wurden. Wir verwendeten multiple lineare Regressionen, um die Zusammenh&#228;nge zwischen Feedbackdaten, Gespr&#228;chsthemen und Lernzielen zu ermitteln.</Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Themen wurden in den Feedbackgespr&#228;chen eher als St&#228;rken diskutiert, wenn die skalenbasierten Bewertungen hoch waren und es viele positive Kommentare zu einem Item gab. Themen wurden eher als Bereiche zur Verbesserung diskutiert, wenn die Anzahl der negativen Kommentare hoch war. Themen mit vielen (positiven und negativen) Kommentaren und Themen, die als verbesserungsw&#252;rdig diskutiert wurden, f&#252;hrten eher zu Lernzielen. Wir fanden eine Reihe von Lernzielen, die &#252;ber die Kompetenzen des MSF-Fragebogens hinausgehen und im Zusammenhang mit der Entwicklung der professionellen Identit&#228;t gesehen werden k&#246;nnen.</Pgraph><Pgraph><Mark1>Fazit: </Mark1>Da das Feedback und die Lernziele &#252;ber die im MSF-Fragebogen aufgelisteten Kompetenzen hinausgingen, scheint es uns notwendig, diese umfassenderen Themen, die die Entwicklung der Weiterzubildenden betreffen, anzusprechen. Daher empfehlen wir Supervisionspersonen und Weiterzubildenden, Aspekte der Entwicklung der professionellen Identit&#228;t wie Karrierepl&#228;ne, Engagement in der Forschung oder pers&#246;nliche Haltungen ausdr&#252;cklich in regelm&#228;ssige Bewertungen und Feedbackgespr&#228;che einzubeziehen. Auf diese Weise k&#246;nnte MSF ein geeignetes Instrument sein, um die Entwicklung der professionellen Identit&#228;t zu unterst&#252;tzen.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph><Mark1>Introduction:</Mark1> Multisource Feedback (MSF) is one form of assessment in medical training. It provides individual feedback based on multiple ratings, which can then be used to develop learning goals during a feedback conversation between supervisor and resident. We conducted this study to investigate how the resident and supervisor set the learning goals and what the learning goals refer to.</Pgraph><Pgraph><Mark1>Methods: </Mark1>The study comprised 75 sets of MSF, each consisting of 12-15 external ratings per resident and one self-rating per resident. Data included 1015 external ratings and 75 self-ratings. As ten sets missed learning goals, only 65 sets of MSF could be analysed. Data comprised written MSF feedback, including scale-based ratings and narrative comments, structured minutes from the feedback conversations and the resulting learning goals, which were sorted into themes. We used multiple linear regressions to determine the associations between feedback data, conversation topics and learning goals.</Pgraph><Pgraph><Mark1>Results: </Mark1>Topics were more likely to be discussed as strengths during the feedback conversation if scale-based ratings were high and there were many favourable comments on an item. Topics were more likely to be discussed as areas for improvement if the number of unfavourable comments was high. Topics with many (favourable and unfavourable) comments and topics discussed as an area for improvement were more likely to result in learning goals. We found a number of learning goals beyond the competences on the MSF-questionnaire, that can be understood as connected to Professional Identity Formation.</Pgraph><Pgraph><Mark1>Conclusion: </Mark1>As the feedback and learning goals clearly exceeded the expected competences from the MSF questionnaire, we see the need for addressing these broader topics of residents&#8217; development. Hence, we encourage supervisors and residents to explicitly include Professional Identity Formation topics such as career plans, engagement in research or personal attitudes into regular assessments and feedback conversations. Thus, MSF might be a fitting tool to support professional identity development. </Pgraph></Abstract>
    <TextBlock name="1. Introduction" linked="yes" language="en">
      <MainHeadline>1. Introduction</MainHeadline><Pgraph>Multisource Feedback (MSF), or 360&#176; assessment, is used to obtain specific feedback to support medical training, mainly the development of skills and competences <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>, <TextLink reference="4"></TextLink>. In this article we argue how MSF might also be used to support Professional Identity Formation as described by Jarvis-Selinger <TextLink reference="5"></TextLink>. Unlike other workplace-based assessments, MSF includes several perspectives on a resident&#8217;s performance in various situations over time. In some settings of MSF, a supervisor summarises and &#8220;transmits&#8221; the feedback, including all scale-based ratings and written narrative comments, to the resident. During this feedback conversation, they compare the feedback to the resident&#8217;s self-assessment and define the resident&#8217;s learning goals, guiding each resident individually.</Pgraph><Pgraph>Most studies on MSF focused on consultants and specialists as recipients of the feedback and investigated factors that influence the effectiveness and outcomes of MSF <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>. Despite recommendations for feedback conversations to guide emotional responses <TextLink reference="11"></TextLink> and reflection <TextLink reference="9"></TextLink>, few studies have investigated factors influencing MSF in settings where these conversations actually occurred <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="11"></TextLink>. Some studies based the need for feedback conversations on participant expectations rather than experiences <TextLink reference="8"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="12"></TextLink>. No study analysed the content or process of these conversations, or observed the facilitators and residents interacting. We thus lack understanding of how facilitators filter and summarize MSF ratings or use them to create learning goals. In non-medical settings, where feedback was given without a conversation, the learning goals were shaped by the number of narrative comments, the polarity of comments (favourable or unfavourable), and the focus of comments (task-focused versus trait-focused) <TextLink reference="13"></TextLink>.</Pgraph><Pgraph>A better knowledge on the content of the feedback conversation between supervisor and resident is needed to understand how learning goals are set and what they refer to. In this study, we investigate how MSF ratings influenced the feedback conversation and how both shaped the number and content of the resident&#8217;s learning goals. We aim to better inform the training of supervisors and residents to improve the targeted use of MSF.</Pgraph></TextBlock>
    <TextBlock name="1. Einleitung" linked="yes" language="de">
      <MainHeadline>1. Einleitung</MainHeadline><Pgraph>Multisource Feedback (MSF) oder 360&#176; Feedback wird verwendet, um die medizinische Aus- und Weiterbildung zu unterst&#252;tzen, insbesondere die Entwicklung von F&#228;higkeiten und Kompetenzen <TextLink reference="1"></TextLink>, <TextLink reference="2"></TextLink>, <TextLink reference="3"></TextLink>, <TextLink reference="4"></TextLink> . In diesem Artikel stellen wir dar, wie MSF auch die Entwicklung der professionellen Identit&#228;t unterst&#252;tzen kann, wie sie von Jarvis-Selinger beschrieben ist <TextLink reference="5"></TextLink>. Im Gegensatz zu anderen arbeitsplatzbasierten Bewertungen umfasst MSF mehrere Perspektiven auf die Leistung einer Person in Weiterbildung in verschiedenen Situationen und &#252;ber einen l&#228;ngeren Zeitraum. H&#228;ufig fasst beim MSF eine Supervisionsperson das Feedback zusammen und &#8222;&#252;bermittelt&#8221; es der Person in Weiterbildung, einschliesslich aller skalenbasierter Bewertungen und schriftlicher Kommentare. W&#228;hrend dieses Feedbackgespr&#228;chs wird das Feedback mit der Selbsteinsch&#228;tzung der Person in Weiterbildung verglichen und Lernziele definiert, um die Person in Weiterbildung individuell zu begleiten.</Pgraph><Pgraph>Die meisten Studien zu MSF konzentrierten sich auf Feedback , das an Fach- und Ober&#228;rzt&#42;innen gegeben wird und untersuchten Faktoren, die die Wirksamkeit und die Ergebnisse von MSF beeinflussen <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="8"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="11"></TextLink>. Obgleich es Empfehlungen gibt, wie in Feedbackgespr&#228;chen die emotionalen Reaktionen gesteuert <TextLink reference="11"></TextLink> und die Reflexion gef&#246;rdert werden k&#246;nnen <TextLink reference="9"></TextLink>, haben nur wenige Studien Faktoren in den realen Umgebungen untersucht, in denen diese Gespr&#228;che tats&#228;chlich stattfanden <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="11"></TextLink>. Einige Studien begr&#252;ndeten die Notwendigkeit von Feedbackgespr&#228;chen eher mit den Erwartungen von Teilnehmenden als mit ihren Erfahrungen <TextLink reference="8"></TextLink>, <TextLink reference="10"></TextLink>, <TextLink reference="12"></TextLink>. Keine Studie analysierte den Inhalt oder den Ablauf dieser Gespr&#228;che oder beobachtete die Interaktion zwischen Supervidierenden und Weiterzubildenden. Daher ist unbekannt, wie Supervisionspersonen die MSF-Bewertungen filtern und zusammenfassen oder diese zur Erstellung von Lernzielen verwenden. In nicht-medizinischen Bereichen, in denen Feedback schriftlich ohne Gespr&#228;ch gegeben wurde, wurden die Lernziele durch die Anzahl der narrativen Kommentare, die Polarit&#228;t der Kommentare (positiv oder negativ) und den Fokus der Kommentare (aufgabenorientiert versus eigenschaftsorientiert) gepr&#228;gt <TextLink reference="13"></TextLink>.</Pgraph><Pgraph>Um zu verstehen, wie Lernziele in der Weiterbildung festgelegt werden und worauf sie sich beziehen, sind bessere Kenntnisse &#252;ber den Inhalt der Feedbackgespr&#228;che zwischen der Supervisionsperson und der Person in Weiterbildung erforderlich. In dieser Studie untersuchen wir, wie MSF-Bewertungen die Feedbackgespr&#228;che beeinflusst haben und wie beide, die Bewertungen und die Gespr&#228;che, die Anzahl und den Inhalt der Lernziele der Weiterzubildenden gepr&#228;gt haben. Unser Ziel ist es, die Schulung von Supervisionspersonen und Weiterzubildenden anhand dieser Erkenntnisse zu verbessern, um den gezielten Einsatz von MSF zu erm&#246;glichen.</Pgraph></TextBlock>
    <TextBlock name="2. Methods" linked="yes" language="en">
      <MainHeadline>2. Methods</MainHeadline><SubHeadline>2.1. Ethics</SubHeadline><Pgraph>The local committee of the Association of Swiss Ethics Committees deemed the study exempt from further approval. All participants gave written informed consent to participate and publish their anonymised data.</Pgraph><SubHeadline>2.2. Setting </SubHeadline><Pgraph>MSF was conducted at the Department of Surgery of the University Children&#8217;s Hospital Zurich, Switzerland, where it is a mandatory part of residency training with a formative purpose. Implemented in 2015, based on best-practice literature <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="14"></TextLink>, <TextLink reference="15"></TextLink>, <TextLink reference="16"></TextLink>, <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>, <TextLink reference="19"></TextLink>, <TextLink reference="20"></TextLink>, all participants (residents, raters and supervisors) were taught the objectives, content, and the MSF questionnaire, including the rating scale and feedback rules. Supervisors learned to give specific feedback while preserving rater anonymity. The MSF questionnaire, was based on the Can-MEDS roles <TextLink reference="21"></TextLink> and previously described in detail <TextLink reference="22"></TextLink>.</Pgraph><Pgraph>The MSF process in this study involved up to 15 raters from predefined groups of co-workers providing feedback twice a year. Raters completed the MSF questionnaire online with feedback later presented anonymously as part of a summary with other raters&#8217; feedback. During the feedback conversation the supervisor shared the means of the scale-based ratings with the resident and summarised anonymised narrative comments they felt were important. The supervisor and the resident decided which items on the MSF questionnaire to discuss, set the topics of the feedback conversation, and decided of the number and content of learning goals. They documented MSF ratings, strengths or areas for improvement, and the learning goals on a structured form. </Pgraph><SubHeadline>2.3. Study design and data collection</SubHeadline><Pgraph>To address the specific literature gap around the feedback conversation, we deliberately decided for a quantitative study design. To trace the way of data during the turn of the conversation as exactly as possible, we disassembled the conversation into three smaller steps, each of which containing documented, quantifiable data. </Pgraph><Pgraph>This study comprised 75 sets of MSF for residents, each consisting of 12-15 external ratings per residents and one self-rating per resident. Data included 1015 external ratings and 75 self-ratings. As ten sets missed learning goals, only 65 sets of MSF could be analysed. More detailed information and an overview on the three components of the feedback conversation are shown in table 1 <ImgLink imgNo="1" imgType="table" />.</Pgraph><SubHeadline>2.4. Definition and calculation of narrative comments, learning goals, and influencing factors</SubHeadline><Pgraph>Data coding was based on <TextLink reference="13"></TextLink> and <TextLink reference="23"></TextLink>.</Pgraph><SubHeadline2>2.4.1. Polarity of narrative comments</SubHeadline2><Pgraph>Narrative comments that clearly praised or reinforced were coded &#8220;favourable&#8221;. Corrections and critical comments, including those made in a critical tone (&#8220;sometimes too motivated&#8221;, &#8220;not sure, if knowledge is enough&#8221;) were coded &#8220;unfavourable&#8221;. Comments that could not clearly be sorted were coded &#8220;cannot be allocated&#8221;.</Pgraph><SubHeadline2>2.4.2. Quality of narrative comments</SubHeadline2><Pgraph>Narrative comments were also coded as task-focused or trait-focused. Comments that clearly described the way a certain task had been or should be conducted, were coded &#8220;task-focused&#8221;. Comments that directly commented on the person or their attitudes were coded &#8220;trait-focused&#8221;. Comments that could not clearly be sorted were coded &#8220;cannot be allocated&#8221;.</Pgraph><SubHeadline2>2.4.3. Number of learning goals</SubHeadline2><Pgraph>We defined and counted learning goals based on their content. We had access to 75 sets of minutes from feedback conversations but excluded 13 of them from the analysis of learning goals because they contained no notes on learning goals (these residents were at the end of their training at the department). Notes from two other conversations were lost, so our data set included the text of 60 of the 75 sets of minutes.</Pgraph><SubHeadline2>2.4.4. Content of learning goals</SubHeadline2><Pgraph>We checked to see if each documented learning goal could be assigned to one or more items on the MSF questionnaire. Goals associated with more than one item (e.g., &#8220;acquisition of knowledge&#8221;) or goals that did not seem to be connected to the MSF questionnaire were analysed qualitatively and counted separately. We then assigned all learning goals to CanMEDS roles (see table 2 <ImgLink imgNo="2" imgType="table" />).</Pgraph><SubHeadline2>2.4.5. Influencing factors</SubHeadline2><Pgraph>We calculated influencing factors based on 1015 scale-based external ratings and 75 scale-based self-ratings. All 16 items of the MSF questionnaire were rated on a 5-point scale, from &#8220;below my expectations&#8221; (1) to &#8220;far above my expectations&#8221; (5), or alternatively &#8220;unable to comment&#8221; with space provided for narrative comments directly after each item.</Pgraph><SubHeadline>2.5. Regression analyses</SubHeadline><Pgraph>We used multiple linear regression analyses to determine the influence of scale-based external ratings, the number of comments, the number of favourable comments, the number of unfavourable comments and the gap between external ratings and self-ratings. To check that the assumptions for multiple linear regressions were met, we used the Breusch-Pagan test for analysing homoscedasticity, the VIF value for analysing multicollinearity, and the Shapiro-Wilk test for normal distribution of residuals. As all three models showed a significant Breusch-Pagan test indicating heteroscedasticity we used heteroscedasticity consistent standard errors. In all three models VIF values were below 10, indicating no multicollinearity. According to the Shapiro-Wilk test residuals were normally distributed. Results of the statistical analysis can be found in table 2 <ImgLink imgNo="2" imgType="table" />.</Pgraph><Pgraph>We displayed the unstandardized beta (&#914;), the standard error for the unstandardized beta (SE(&#914;)), the standardized beta (&#946;), the t-test statistic (t), and the probability value (p). Our regression analyses first investigated the influence of those variables on the discussion of strengths, and, second, on the discussion of areas of improvement, and third, on learning goals set during the feedback conversation. As an index of effect size, we report R<Superscript>2</Superscript>. The level of significance was set at p&#60;0.05. All analyses were conducted using R (version 3.2.0) <TextLink reference="24"></TextLink>.</Pgraph></TextBlock>
    <TextBlock name="2. Methoden" linked="yes" language="de">
      <MainHeadline>2. Methoden</MainHeadline><SubHeadline>2.1. Ethik</SubHeadline><Pgraph>Die lokale Ethikkommission der Schweizerischen Vereinigung der Forschungsethikkommissionen beurteilte die Studie als nicht bewilligungspflichtig. Alle Teilnehmenden gaben ihre schriftliche Einwilligung zur Teilnahme und zur Ver&#246;ffentlichung ihrer anonymisierten Daten.</Pgraph><SubHeadline>2.2. Setting </SubHeadline><Pgraph>Die Studie wurde an der Abteilung f&#252;r Chirurgie des Universit&#228;tskinderspitals Z&#252;rich, Schweiz, durchgef&#252;hrt. MSF wird dort als obligatorischer Bestandteil der fach&#228;rztlichen Ausbildung mit formativem Zweck eingesetzt und wurde 2015 auf der Grundlage von Best-Practice-Literatur <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="14"></TextLink>, <TextLink reference="15"></TextLink>, <TextLink reference="16"></TextLink>, <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>, <TextLink reference="19"></TextLink>, <TextLink reference="20"></TextLink> eingef&#252;hrt. Alle Teilnehmenden (Weiterzubildende, Bewertende und Supervisionspersonen) wurden &#252;ber die Ziele, Inhalte und den MSF-Fragebogen einschliesslich der Bewertungsskala und der Feedbackregeln informiert. Die Supervisionspersonen lernten, spezifisches Feedback zu geben und dabei die Anonymit&#228;t der Bewertenden zu wahren. Der MSF-Fragebogen basierte auf den Can-MEDS-Rollen <TextLink reference="21"></TextLink> und wurde bereits ausf&#252;hrlich beschrieben <TextLink reference="22"></TextLink>.</Pgraph><Pgraph>Der MSF-Prozess in dieser Studie umfasste bis zu 15 externe Bewertende aus vordefinierten Gruppen von Mitarbeitenden, die zweimal j&#228;hrlich Feedbacks gaben. Die Bewertenden f&#252;llten den MSF-Fragebogen online aus, ihr Feedback wurde sp&#228;ter anonymisiert und zusammengefasst verwendet. W&#228;hrend des Feedbackgespr&#228;chs teilte die Supervisionsperson den Mittelwert der skalenbasierten Bewertungen mit und fasste narrative Kommentare zusammen, die ihr wichtig erschienen. Die Supervisionspersonen und die Weiterzubildenden entschieden jeweils gemeinsam, welche Items des MSF-Fragebogens besprochen werden sollten, legten die Themen f&#252;r das Feedbackgespr&#228;ch fest und bestimmten die Anzahl und den Inhalt der Lernziele. Sie dokumentierten die MSF-Bewertungen, St&#228;rken oder Bereiche der Verbesserung, sowie die Lernziele in einem strukturierten Formular. </Pgraph><SubHeadline>2.3. Studiendesign und Datenerhebung</SubHeadline><Pgraph>Entsprechend der einleitend beschriebenen spezifischen Literaturl&#252;cke zum Feedbackgespr&#228;ch haben wir uns bewusst f&#252;r ein quantitatives Studiendesign entschieden. Um den Weg der Daten w&#228;hrend des Gespr&#228;chs so genau wie m&#246;glich nachzuvollziehen, haben wir das Gespr&#228;ch in drei kleinere Teile aufgetrennt, die jeweils dokumentierte, quantifizierbare Daten enthalten. </Pgraph><Pgraph>Die Studie umfasste 75 MSF-Datens&#228;tze, die pro Person in Weiterbildung aus 12-15 externen Bewertungen und einer Selbstbewertung bestanden. Die Daten umfassten insgesamt 1015 externe Bewertungen und 75 Selbstbewertungen. Da in zehn Datens&#228;tzen die Lernziele fehlten, konnten nur 65 MSF-Datens&#228;tze analysiert werden. Detailliertere Informationen und eine &#220;bersicht &#252;ber die drei Teile des Feedbackgespr&#228;chs sind in Tabelle 1 <ImgLink imgNo="1" imgType="table" /> dargestellt.</Pgraph><SubHeadline>2.4. Definition und Berechnung von narrativen Kommentaren, Lernzielen und Einflussfaktoren</SubHeadline><Pgraph>Die Datenkodierung orientierte sich an <TextLink reference="13"></TextLink> und <TextLink reference="23"></TextLink>.</Pgraph><SubHeadline2>2.4.1. Polarit&#228;t der narrativen Kommentare</SubHeadline2><Pgraph>Narrative Kommentare, die eindeutig lobend oder best&#228;tigend waren, wurden als &#8222;positiv&#8220; kodiert. Korrekturen und kritische Kommentare, einschliesslich solcher in kritischem Ton (&#8222;manchmal zu motiviert&#8220;, &#8222;nicht sicher, ob das Wissen ausreicht&#8220;), wurden als &#8222;negativ&#8220; kodiert. Kommentare, die nicht eindeutig zugeordnet werden konnten, wurden als &#8222;nicht zuzuordnen&#8220; kodiert.</Pgraph><SubHeadline2>2.4.2. Qualit&#228;t der narrativen Kommentare</SubHeadline2><Pgraph>Narrative Kommentare wurden ausserdem als <Mark2>aufgabenorientier</Mark2>t oder <Mark2>eigenschaftsorientiert </Mark2>kodiert. Kommentare, die eindeutig beschrieben, wie eine bestimmte Aufgabe durchgef&#252;hrt wurde oder durchgef&#252;hrt werden sollte, wurden als &#8222;aufgabenorientiert&#8220; kodiert. Kommentare, die sich direkt auf die Person oder ihre Haltungen bezogen, wurden als &#8222;eigenschaftsorientiert&#8220; kodiert. Kommentare, die nicht eindeutig zugeordnet werden konnten, wurden als &#8222;nicht zuzuordnen &#8220; kodiert.</Pgraph><SubHeadline2>2.4.3. Anzahl der Lernziele</SubHeadline2><Pgraph>Wir haben die Lernziele anhand ihres Inhalts definiert und gez&#228;hlt. Wir hatten Zugang zu 75 Protokollen von Feedbackgespr&#228;chen, haben jedoch 13 davon aus der Analyse der Lernziele ausgeschlossen, da sie keine Notizen zu Lernzielen enthielten (diese Weiterzubildenden befanden sich am Ende ihrer Ausbildung auf der Abteilung). Die Notizen aus zwei weiteren Gespr&#228;chen waren verloren, sodass unser Datensatz den Text von 60 der 75 Protokolle umfasste.</Pgraph><SubHeadline2>2.4.4. Inhalt der Lernziele</SubHeadline2><Pgraph>Wir &#252;berpr&#252;ften, ob jedes dokumentierte Lernziel sich einem oder mehreren Items des MSF-Fragebogens zuordnen l&#228;sst. Ziele, die mit mehr als einem Item verbunden waren (z. B. &#8222;Erwerb von Wissen&#8220;) oder Ziele, die keinen Bezug zum MSF-Fragebogen zu haben schienen, wurden qualitativ analysiert und separat gez&#228;hlt. Anschliessend haben wir alle Lernziele den CanMEDS-Rollen zugeordnet (siehe Tabelle 2 <ImgLink imgNo="2" imgType="table" />).</Pgraph><SubHeadline2>2.4.5. Einflussfaktoren</SubHeadline2><Pgraph>Wir haben Einflussfaktoren auf der Grundlage von 1015 skalenbasierten externen Bewertungen und 75 skalenbasierten Selbstbewertungen berechnet. Alle 16 Items des MSF-Fragebogens wurden auf einer 5-Punkte-Skala bewertet, von &#8222;unter meinen Erwartungen&#8220; (1) bis &#8222;weit &#252;ber meinen Erwartungen&#8220; (5) oder alternativ mit &#8222;keine Angabe&#8220; mit Platz f&#252;r narrative Kommentare direkt nach jedem Punkt.</Pgraph><SubHeadline>2.5. Regressionsanalysen</SubHeadline><Pgraph>Wir verwendeten multiple lineare Regressionen, um den Einfluss der skalenbasierten externen Bewertungen, der Anzahl der Kommentare, der Anzahl der positiven Kommentare, der Anzahl der negativen Kommentare und der Diskrepanz zwischen externen Bewertungen und Selbstbewertungen zu ermitteln. Um zu &#252;berpr&#252;fen, ob die Annahmen f&#252;r multiple lineare Regressionen erf&#252;llt waren, verwendeten wir den Breusch-Pagan-Test zur Analyse der Homoskedastizit&#228;t, den VIF-Wert zur Analyse der Multikollinearit&#228;t und den Shapiro-Wilk-Test zur Pr&#252;fung der Normalverteilung der Residuen. Da alle drei Modelle einen signifikanten Breusch-Pagan-Test auf Heteroskedazit&#228;t zeigten, haben wir heteroskedazit&#228;tskonsistente Standardfehler verwendet. In allen drei Modellen lagen die VIF-Werte unter 10, was auf keine Multikollinearit&#228;t hindeutet. Nach dem Shapiro-Wilk-Test waren die Residuen normalverteilt. Die Ergebnisse der statistischen Analyse sind in Tabelle 2 <ImgLink imgNo="2" imgType="table" /> zu finden.</Pgraph><Pgraph>Wir haben das unstandardisierte Beta (&#914;), den Standardfehler f&#252;r das unstandardisierte Beta (SE(&#914;)), das standardisierte Beta (&#946;), die t-Teststatistik (t) und den Wahrscheinlichkeitswert (p) dargestellt. Die Regressionsanalysen untersuchten zun&#228;chst den Einfluss dieser Variablen auf die Diskussion der St&#228;rken, dann auf die Diskussion der Bereiche zur Verbesserung und schliesslich auf die w&#228;hrend des Feedbackgespr&#228;chs festgelegten Lernziele. Als Index f&#252;r die Effektgr&#246;sse wurde R<Superscript>2</Superscript> verwendet. Das Signifikanzniveau wurde auf p&#60;0,05 festgelegt. Alle Analysen wurden mit R (Version 3.2.0) <TextLink reference="24"></TextLink> durchgef&#252;hrt.</Pgraph></TextBlock>
    <TextBlock name="3. Results" linked="yes" language="en">
      <MainHeadline>3. Results</MainHeadline><SubHeadline>3.1. Narrative comments</SubHeadline><Pgraph>MSF data included 3024 narrative comments, averaging 2.63 comments per item per resident (between 0 and 12, SD&#61;1.90) and 39.51 comments in sum per resident (between 15 and 66, SD&#61;12.09). Of the narrative comments, 77&#37; were favourable, 15&#37; were unfavourable, 7&#37; could not be allocated; 95&#37; of narrative comments were task-focused, 0,9&#37; trait-focused, and 3,5&#37; could not be allocated. </Pgraph><SubHeadline>3.2. Learning goals</SubHeadline><SubHeadline2>3.2.1. Number of learning goals</SubHeadline2><Pgraph>In total, we analysed 132 separate learning goals, averaging 2.13 (between 0 and 4) learning goals per resident per feedback conversation.</Pgraph><SubHeadline2>3.2.2. Content of learning goals</SubHeadline2><Pgraph>Of these 132 goals, 68 could be matched directly to single items on the questionnaire, 64 matched multiple items or referred to topics not mentioned in the MSF questionnaire. These 64 goals were of different quality compared to the competence-based items of the questionnaire and addressed broader concepts that can be understood as referring to Professional Identity Formation. They concerned career planning (n&#61;24), gaining knowledge (n&#61;15), scientific work (n&#61;9), appearing self-confident (n&#61;7), working independently (n&#61;3), and other topics (e.g. language skills, showing presence, dealing with stress; n&#61;6). To integrate as many goals as possible into the calculations, we collated them, despite three overall goals and 24 goals on career planning, to the related CanMEDS roles, see table 3 <ImgLink imgNo="3" imgType="table" /> and figure 1 <ImgLink imgNo="1" imgType="figure" />.</Pgraph><SubHeadline>3.3. Influencing factors</SubHeadline><Pgraph>Our findings are summarised in figure 2 <ImgLink imgNo="2" imgType="figure" />.</Pgraph><Pgraph>When we analysed influencing factors, we found significant regression equations (F(5&#47;1116)&#61;48.3, p&#60;0.05) with an R<Superscript>2</Superscript> of 0.17 for topics discussed as strengths (F(5&#47;1116)&#61;27.5, p&#60;0.05), an R<Superscript>2</Superscript> of 0.11 for topics discussed as areas for improvement (F(7&#47;352)&#61;7.8, p&#60;0.05), and an R<Superscript>2</Superscript> of 0.11 for learning goals, see table 3 <ImgLink imgNo="3" imgType="table" />, table 4 <ImgLink imgNo="4" imgType="table" /> and table 5 <ImgLink imgNo="5" imgType="table" /> for regression coefficients.</Pgraph><SubHeadline2>3.3.1. Number of task-focused or trait-focused comments</SubHeadline2><Pgraph>Of the narrative comments, 95.5&#37; were task-focused; 1&#37; were trait-focused, and 3,5&#37; could not be allocated. Because of this distribution we decided not to add calculations about the differences between the number of task-focused or trait-focused comments to our calculations of the overall number of comments.</Pgraph><SubHeadline>3.4. Influences of MSF ratings (part i) on strengths discussed during feedback conversations (part ii)</SubHeadline><SubHeadline2>3.4.1. Scale-based external ratings</SubHeadline2><Pgraph>Higher scale-based external ratings per item (&#914;&#61;0.39, &#946;&#61;0.30, p&#60;0.05) significantly increased the likelihood the topic would be addressed as a strength.</Pgraph><SubHeadline2>3.4.2. Favourable comments</SubHeadline2><Pgraph>A higher number of favourable comments per item (&#914;&#61;0.05, &#946;&#61;0.18, p&#60;0.05) significantly increased the likelihood the topic would be discussed as a strength.</Pgraph><Pgraph>The numbers of overall comments (&#914;&#61;0.00, &#946;&#61;0.00, p&#61;1.00), the number of unfavourable comments (&#914;&#61;0.00, &#946;&#61;0.01, p&#61;0.90), and the gap between external ratings and self-rating (&#914;&#61;0.03, &#946;&#61;0.04, p&#61;0.11) did not have significant influence on whether a topic was discussed as a strength (see table 4 <ImgLink imgNo="4" imgType="table" />).</Pgraph><SubHeadline>3.5. Influence of MSF ratings (part i) on topics discussed as areas for improvement during the feedback conversation (part ii)</SubHeadline><SubHeadline2>3.5.1. Unfavourable comments</SubHeadline2><Pgraph>A higher number of unfavourable comments per item (&#914;&#61;0.06. &#946;&#61;0.23. p&#60;0.05) significantly increased the likelihood the topic would be discussed as an area for improvement. Scale-based external ratings (&#914;&#61;-0.03. &#946;&#61;-0.06. p&#61;0.12), overall number of comments (&#914;&#61;0.02. &#946;&#61;0.15. p&#61;0.07), the number of favourable comments (&#914;&#61;-0.02. &#946;&#61;-0.13. p&#61;0.10), and the gap between external ratings and self-rating (&#914;&#61;-0.01. &#946;&#61;-0.04. p&#61;0.14) did not have significant influence on whether a topic was discussed as an area for improvement (see table 5 <ImgLink imgNo="5" imgType="table" />).</Pgraph><SubHeadline>3.6. Influences of MSF ratings (part i) and topics discussed (part ii) on learning goals (part iii)</SubHeadline><SubHeadline2>3.6.1. Number of comments</SubHeadline2><Pgraph>A higher number of comments per item significantly increased (&#914;&#61;0.04. &#946;&#61;0.43. p&#60;0.05) the likelihood the topic would be translated into a learning goal.</Pgraph><SubHeadline2>3.6.2. Discussed as an area for improvement</SubHeadline2><Pgraph>Discussing a topic as an area for improvement (&#914;&#61;0.029. &#946;&#61;0.19. p&#60;0.05) significantly increased the likelihood the topic would be translated into a learning goal.</Pgraph><Pgraph>Scale-based external ratings (&#914;&#61;-0.06. &#946;&#61;-0.04. p&#61;0.52), the number of favourable comments (&#914;&#61;-0.03. &#946;&#61;-0.21. p&#61;0.21), the number of unfavourable comments (&#914;&#61;-0.01. &#946;&#61;-0.03. p&#61;0.76), the gap between external ratings and self-rating (&#914;&#61;0.01. &#946;&#61;0.01. p&#61;0.88), and discussing a topic as a strength did not significantly influence its translation to a learning goal (&#914;&#61;0.01. &#946;&#61;0.01. p&#61;0.79) (see table 6 <ImgLink imgNo="6" imgType="table" />).</Pgraph></TextBlock>
    <TextBlock name="3. Ergebnisse" linked="yes" language="de">
      <MainHeadline>3. Ergebnisse</MainHeadline><SubHeadline>3.1. Narrative Kommentare</SubHeadline><Pgraph>Die MSF-Datens&#228;tze umfassten 3024 narrative Kommentare, durchschnittlich 2,63 Kommentare pro Item pro Person in Weiterbildung (zwischen 0 und 12, SD&#61;1,90) und insgesamt 39,51 Kommentare pro Person in Weiterbildung (zwischen 15 und 66, SD&#61;12,09). Von den narrativen Kommentaren waren 77&#37; positiv, 15&#37; negativ und 7&#37; konnten nicht zugeordnet werden; 95&#37; der narrativen Kommentare waren aufgabenorientiert, 0,9&#37; eigenschaftsorientiert und 3,5&#37; konnten nicht zugeordnet werden. </Pgraph><SubHeadline>3.2. Lernziele</SubHeadline><SubHeadline2>3.2.1. Anzahl der Lernziele</SubHeadline2><Pgraph>Insgesamt haben wir 132 separate Lernziele analysiert, was einem Durchschnitt von 2,13 (zwischen 0 und 4) Lernzielen pro Person in Weiterbildung und Feedbackgespr&#228;ch entspricht.</Pgraph><SubHeadline2>3.2.2. Inhalt der Lernziele</SubHeadline2><Pgraph>Von diesen 132 Zielen konnten 68 direkt einzelnen Items des MSF-Fragebogens zugeordnet werden, 64 entsprachen mehreren Items oder bezogen sich auf Themen, die im MSF-Fragebogen nicht erw&#228;hnt wurden. Diese 64 Ziele wiesen im Vergleich zu den kompetenzbasierten Items des Fragebogens eine andere Qualit&#228;t auf und bezogen sich auf weiter gefasste Konzepte, die mit Bezug auf die Entwicklung der professionellen Identit&#228;t verstanden werden k&#246;nnen. Sie betrafen die Karriereplanung (n&#61;24), den Erwerb von Wissen (n&#61;15), wissenschaftliches Arbeiten (n&#61;9), selbstbewusstes Auftreten (n&#61;7), selbstst&#228;ndiges Arbeiten (n&#61;3) und andere Themen (z. B. Sprachkenntnisse, Pr&#228;senz zeigen, Umgang mit Stress; n&#61;6). Um m&#246;glichst viele Ziele in die Berechnungen einbeziehen zu k&#246;nnen, haben wir sie, mit Ausnahme von drei &#252;bergeordneten Zielen und 24 Zielen zur Karriereplanung, den entsprechenden CanMEDS-Rollen zugeordnet, siehe Tabelle 3 <ImgLink imgNo="3" imgType="table" /> und Abbildung 1 <ImgLink imgNo="1" imgType="figure" />.</Pgraph><SubHeadline>3.3. Einflussfaktoren</SubHeadline><Pgraph>Unsere Ergebnisse sind in Abbildung 2 <ImgLink imgNo="2" imgType="figure" /> zusammengefasst.</Pgraph><Pgraph>Bei der Analyse der Einflussfaktoren fanden wir signifikante Regressionsgleichungen (F(5&#47;1116)&#61;48,3, p&#60;0,05) mit einem R<Superscript>2</Superscript> von 0,17 f&#252;r Themen, die als St&#228;rken diskutiert wurden (F(5&#47;1116)&#61;27,5, p&#60;0,05), einem R<Superscript>2</Superscript> von 0,11 f&#252;r Themen, die als Bereiche der Verbesserung diskutiert wurden (F(7&#47;352)&#61;7,8, p&#60;0,05), und einem R<Superscript>2</Superscript> von 0,11 f&#252;r Lernziele, siehe Tabelle 3 <ImgLink imgNo="3" imgType="table" />, Tabelle 4 <ImgLink imgNo="4" imgType="table" /> und Tabelle 5 <ImgLink imgNo="5" imgType="table" /> f&#252;r die Regressionskoeffizienten.</Pgraph><SubHeadline2>3.3.1. Anzahl der aufgabenorientierten oder eigenschaftsorientierten Kommentare</SubHeadline2><Pgraph>Von den narrativen Kommentaren waren 95,5&#37; aufgabenorientiert, 1&#37; eigenschaftsorientiert und 3,5&#37; konnten nicht zugeordnet werden. Aufgrund dieser Verteilung haben wir beschlossen, keine Berechnungen &#252;ber die Unterschiede zwischen der Anzahl der aufgabenorientierten und eigenschaftsorientierten Kommentare zu unseren Berechnungen der Gesamtzahl der Kommentare hinzuzuf&#252;gen.</Pgraph><SubHeadline>3.4. Einfl&#252;sse der MSF-Bewertungen (Teil i) auf die w&#228;hrend der Feedbackgespr&#228;che diskutierten St&#228;rken (Teil ii)</SubHeadline><SubHeadline2>3.4.1. Skalenbasierte externe Bewertungen</SubHeadline2><Pgraph>H&#246;here skalierte externe Bewertungen pro Item (&#914;&#61;0,39, &#946;&#61;0,30, p&#60;0,05) erh&#246;hten die Wahrscheinlichkeit, dass das Thema als St&#228;rke angesprochen wurde, signifikant.</Pgraph><SubHeadline2>3.4.2. Positive Kommentare</SubHeadline2><Pgraph>Eine h&#246;here Anzahl positiver Kommentare pro Item (&#914;&#61;0,05, &#946;&#61;0,18, p&#60;0,05) erh&#246;hte die Wahrscheinlichkeit, dass das Thema als St&#228;rke diskutiert wurde, signifikant.</Pgraph><Pgraph>Die Anzahl der Gesamtkommentare (&#914;&#61;0,00, &#946;&#61;0,00, p&#61;1,00), die Anzahl der negativen Kommentare (&#914;&#61;0,00, &#946;&#61;0,01, p&#61;0,90) und die Diskrepanz zwischen externen Bewertungen und Selbstbewertungen (&#914;&#61;0,03, &#946;&#61;0,04, p&#61;0,11) hatten keinen signifikanten Einfluss darauf, ob ein Thema als St&#228;rke diskutiert wurde (siehe Tabelle 4 <ImgLink imgNo="4" imgType="table" />).</Pgraph><SubHeadline>3.5. Einfluss der MSF-Bewertungen (Teil i) auf die Themen, die w&#228;hrend des Feedbackgespr&#228;chs als Bereiche zur Verbesserung diskutiert wurden (Teil ii)</SubHeadline><SubHeadline2>3.5.1. Negative Kommentare</SubHeadline2><Pgraph>Eine h&#246;here Anzahl negativer Kommentare pro Item (&#914;&#61;0,06. &#946;&#61;0,23. p&#60;0,05) erh&#246;hte die Wahrscheinlichkeit, dass das Thema als verbesserungsw&#252;rdig diskutiert wurde, signifikant. Skalenbasierte externe Bewertungen (&#914;&#61;-0,03. &#946;&#61;-0,06. p&#61;0,12), die Gesamtzahl der Kommentare (&#914;&#61;0,02. &#946;&#61;0,15. p&#61;0,07), die Anzahl der positiven Kommentare (&#914;&#61;-0,02. &#946;&#61;-0,13. p&#61;0,10) und die Diskrepanz zwischen externen Bewertungen und Selbstbewertung (&#914;&#61;-0,01. &#946;&#61;-0,04. p&#61;0,14) hatten keinen signifikanten Einfluss darauf, ob ein Thema als Bereich der Verbesserung diskutiert wurde (siehe Tabelle 5 <ImgLink imgNo="5" imgType="table" />).</Pgraph><SubHeadline>3.6. Einfl&#252;sse der MSF-Bewertungen (Teil i) und der diskutierten Themen (Teil ii) auf die Lernziele (Teil iii)</SubHeadline><SubHeadline2>3.6.1. Anzahl der Kommentare</SubHeadline2><Pgraph>Eine h&#246;here Anzahl von Kommentaren pro Item erh&#246;hte signifikant (&#914;&#61;0,04. &#946;&#61;0,43. p&#60;0,05) die Wahrscheinlichkeit, dass das Thema in ein Lernziel umgesetzt wurde.</Pgraph><SubHeadline2>3.6.2. Als Bereich zur Verbesserung diskutiert</SubHeadline2><Pgraph>Die Diskussion eines Themas als Bereich zur Verbesserung (&#914;&#61;0,029. &#946;&#61;0,19. p&#60;0,05) erh&#246;hte die Wahrscheinlichkeit, dass das Thema in ein Lernziel umgesetzt wurde, signifikant.</Pgraph><Pgraph>Skalenbasierte externe Bewertungen (&#914;&#61;-0,06, &#946;&#61;-0,04, p&#61;0,52), die Anzahl der positiven Kommentare (&#914;&#61;-0,03. &#946;&#61;-0,21. p&#61;0,21), die Anzahl der negativen Kommentare (&#914;&#61;-0,01. &#946;&#61;-0,03. p&#61;0,76), die Diskrepanz zwischen externen Bewertungen und Selbstbewertung (&#914;&#61;0,01. &#946;&#61;0,01. p&#61;0,88) und die Erw&#228;hnung eines Themas als St&#228;rke hatten keinen signifikanten Einfluss auf dessen &#220;bertragung in ein Lernziel (&#914;&#61;0,01. &#946;&#61;0,01. p&#61;0,79) (siehe Tabelle 6 <ImgLink imgNo="6" imgType="table" />).</Pgraph></TextBlock>
    <TextBlock name="4. Discussion" linked="yes" language="en">
      <MainHeadline>4. Discussion</MainHeadline><Pgraph>Our investigation revealed that topics discussed as strengths depended on scale-based ratings and the number of favourable comments while areas for improvement depended on the number of unfavourable comments. Gaps between self-ratings and external ratings did not increase the likelihood of discussion. Each learning goal was influenced by the number of narrative comments and whether the topic had been discussed as an area for improvement. Unexpectedly, we found a range of narrative comments and learning goals that exceeded the competences suggested on the MSF questionnaire and related to broader concepts. We see those goals connected to professional identity formation, discuss them under 4.2. and propose implications for practice based on this finding.</Pgraph><SubHeadline>4.1. Narrative comments</SubHeadline><Pgraph>The high proportion of favourable narrative comments aligns with other studies <TextLink reference="23"></TextLink>, <TextLink reference="25"></TextLink>. We found a higher proportion of task-focused comments <TextLink reference="13"></TextLink>, <TextLink reference="23"></TextLink>, likely due to differences in rater training or questionnaire design. Both Dory et al. <TextLink reference="26"></TextLink>, who studied in-training assessment reports based on written feedback, and Lockyer et al. <TextLink reference="23"></TextLink>, who studied MSF, indicate that even small adjustments in the format of the questionnaire can increase the quality of feedback. We concluded that the specific rater training and item formulations, asking for task-focused comments, raised the proportion of task-focused comments. </Pgraph><SubHeadline>4.2. Learning goals and connection to Professional Identity Formation</SubHeadline><Pgraph>We observed between 1 and 4 learning goals per feedback conversation. Many of these learning goals could not be clearly tied to single items of the MSF questionnaire; some addressed combinations of items, and others addressed aspects of the residents&#8217; development not covered by the questionnaire, e.g., career plans, engagement in research or personal attitudes like appearing more self-confident. This finding can be interpreted through the lens of professional identity formation theory <TextLink reference="5"></TextLink>, which explains that during a resident&#8217;s development, the focus of learning goals might shift from single, separate skills to broader, more personal goals. Thus, MSF conversations with residents might be expanded to encompass both <Mark2>development</Mark2> goals and <Mark2>learning</Mark2> goals.</Pgraph><Pgraph>Our finding that some learning goals seemed unrelated to items on the MSF questionnaire hints at the need to adjust the questionnaire to meet learners&#8217; additional needs. These additional learning goals might also indicate gaps in the curriculum. An analysis of learning goals could be used to actively improve the residency curriculum <TextLink reference="27"></TextLink>, by including overarching goals.</Pgraph><Pgraph>When learning goals exceed the scope of the MSF questionnaire, it points out the complexity of measuring the effectiveness of MSF since the MSF process addresses both competences and overarching goals. Orienting the feedback conversation to meet these additional goals might not directly increase the effectiveness of MSF as a formative assessment of competences, but expand its range. Embracing the added use might exceed the assessment of competences and might support professional identity development. The MSF could better fulfil this second aim by extending the training of supervisors and residents to encompass the added content and prepare them to better formulate these overarching goals. To see whether this also holds true in an international context, more cross-validation is needed, as MSF is idiosyncratic in every setting, surrounded by different learning cultures including other forms of assessment in different curricula of residency training.</Pgraph><SubHeadline>4.3. Influencing factors</SubHeadline><Pgraph>Items were more likely to be discussed as strengths with more favourable comments and as an area for improvement with more unfavourable comments. Higher ratings predicted discussion of strengths, but lower ratings did not predict discussion of improvements; only the number of unfavourable comments did. This is in contrast to studies by Sargeant et al. <TextLink reference="7"></TextLink> and Overeem et al. <TextLink reference="15"></TextLink>, who reported low ratings as a main motivator for change. A recent qualitative study <TextLink reference="28"></TextLink> described that feedback conversations, perceived as summative, affected the residents&#8217; behaviour leading them to conceal weaknesses. A review of the assessor&#8217;s behaviour <TextLink reference="29"></TextLink> found this group also felt this tension, which led them to avoid delivering unpleasant results. This might partially explain our findings that low ratings and the gap between external ratings and self-ratings were not discussed as often as high ratings. Focussing on the formative aspect of feedback might lower this barrier to honest conversation <TextLink reference="29"></TextLink>.</Pgraph><Pgraph>Also, our study found significant differences between external and self-ratings, as other studies did, but we did not confirm the influence of this difference on conversation or the learning goals <TextLink reference="15"></TextLink>, <TextLink reference="18"></TextLink>. Again, it is possible that supervisors avoided directly pointing out the differences to reduce friction during the feedback conversation.</Pgraph><Pgraph>A study of managers by Smither and Walker <TextLink reference="13"></TextLink> found that a small number of unfavourable task-focused comments had the strongest effect on performance, but a high number of unfavourable comments was discouraging. The number of written comments in their study averaged 6.8, while we observed even 15 to 66 unfavourable comments per resident. We hypothesise that in our study the supervisors prevented residents from being overwhelmed by too many comments. </Pgraph><Pgraph>Despite the high number of favourable narrative comments, feedback conversations focused more on areas for improvement, possibly because corrective feedback was felt to be more actionable than reinforcing feedback. A model on reflection supports this argument; Sargeant et al. <TextLink reference="11"></TextLink> found that feedback inconsistent with self-perception leads to longer lasting reflection; the resident and supervisor might have unconsciously been engaging in this process. Besides, supervisor training in our study focussed on a balance between strengths and areas for improvement, but did not focus on reinforcing goals.</Pgraph><SubHeadline>4.4. Implications for practice</SubHeadline><SubHeadline2>4.4.1. Professional Identity Formation</SubHeadline2><Pgraph>We suggest expanding the MSF questionnaire and participant training to meet the residents&#8217; need for overarching development goals. By addressing both specific competences and broader developmental goals, MSF could support professional identity development, besides assessing competences.</Pgraph><SubHeadline2>4.4.2. Format of the MSF questionnaire and rater training</SubHeadline2><Pgraph>For the more clearly defined competences, we encourage the use of clear task-related items to achieve high quality feedback with specific task-focused comments.</Pgraph><SubHeadline2>4.4.3. Feedback conversation</SubHeadline2><Pgraph>We suggest a formative focus in feedback conversations to encourage honest discussions and reduce tension. When supervisors and residents decide which topics to discuss, they should combine scale-based ratings with narrative comments because both provide valuable information for learning goals. </Pgraph><SubHeadline>4.5. Limitations and strengths of the study</SubHeadline><Pgraph>We were limited by our inability to observe the conversation directly; we analysed only data going into the feedback conversation, limited notes, and the learning goals as its outcome. Because our study focused in detail on the quantitative data of MSF, we could not study other factors that also influenced the process like the perceptions of the residents or their emotional response to the feedback.</Pgraph><Pgraph>Our unique approach of breaking MSF into components helped us understand the interplay between scale-based ratings, narrative comments, feedback conversations, and learning goals, elucidating the complex process. Since few studies quantitatively investigated influences on the feedback conversation, and the way feedback was translated into learning goals, our data provides valuable insights. As a quantitative study can only show connections between data, but not explain them, qualitative studies are needed to investigate the residents&#8217; and supervisors&#8217; perspective on our findings and recommendations.</Pgraph></TextBlock>
    <TextBlock name="4. Diskussion" linked="yes" language="de">
      <MainHeadline>4. Diskussion</MainHeadline><Pgraph>Unsere Untersuchung zeigte, dass die als St&#228;rken diskutierten Themen von den skalenbasierten Bewertungen und der Anzahl positiver Kommentare abhingen, w&#228;hrend Bereiche zur Verbesserung von der Anzahl negativer Kommentare abhingen. Diskrepanzen zwischen der Selbstbewertung und den externen Bewertungen erh&#246;hten nicht die Wahrscheinlichkeit einer Diskussion. Jedes Lernziel wurde durch die Anzahl der narrativen Kommentare beeinflusst und dadurch, ob das Thema als Bereich zur Verbesserung diskutiert worden war. &#220;berraschend fanden wir eine Reihe von narrativen Kommentaren und Lernzielen, die &#252;ber die im MSF-Fragebogen vorgeschlagenen Kompetenzen hinausgingen und sich auf weiter gefasste Konzepte bezogen. Wir sehen diese Ziele im Zusammenhang mit der Entwicklung der professionellen Identit&#228;t, diskutieren sie unter 4.2. und schlagen auf der Grundlage dieser Ergebnisse Implikationen f&#252;r die Praxis vor.</Pgraph><SubHeadline>4.1. Narrative Kommentare</SubHeadline><Pgraph>Der hohe Anteil an positiven narrativen Kommentaren deckt sich mit anderen Studien <TextLink reference="23"></TextLink>, <TextLink reference="25"></TextLink>. Wir stellten einen h&#246;heren Anteil an aufgabenbezogenen Kommentaren fest <TextLink reference="13"></TextLink>, <TextLink reference="23"></TextLink>, was wahrscheinlich auf Unterschiede in der Schulung der Bewertenden oder das Fragebogendesign zur&#252;ckzuf&#252;hren ist. Sowohl Dory et al. <TextLink reference="26"></TextLink>, die &#8222;in-training assessment reports&#8220; mit schriftlichem Feedback untersuchten, als auch Lockyer et al. <TextLink reference="23"></TextLink>, die MSF untersuchten, weisen darauf hin, dass bereits kleine Anpassungen im Format des Fragebogens die Qualit&#228;t des Feedbacks verbessern k&#246;nnen. Wir kamen zu dem Schluss, dass die spezifische Schulung der Bewertenden und die Formulierung der Fragen, die zu aufgabenbezogenen Kommentaren aufforderten, den Anteil der aufgabenbezogenen Kommentare erh&#246;hten. </Pgraph><SubHeadline>4.2. Lernziele und Zusammenhang mit der Entwicklung der professionellen Identit&#228;t</SubHeadline><Pgraph>Wir haben zwischen 1 und 4 Lernziele pro Feedbackgespr&#228;ch beobachtet. Viele dieser Lernziele konnten nicht eindeutig mit einzelnen Items des MSF-Fragebogens in Verbindung gebracht werden; einige bezogen sich auf Kombinationen von Items, andere auf Aspekte der Entwicklung der Weiterzubildenden, die im Fragebogen nicht abgedeckt waren, z. B. Karrierepl&#228;ne, Engagement in der Forschung oder pers&#246;nliche Haltungen wie ein selbstbewussteres Auftreten. Dieser Fund kann durch die Theorie der Professional Identity Formation <TextLink reference="5"></TextLink> betrachtet werden, welche erkl&#228;rt, dass sich der Schwerpunkt der Lernziele w&#228;hrend der Entwicklung einer Person in Weiterbildung von einzelnen, separaten F&#228;higkeiten zu breiteren, pers&#246;nlicheren Zielen verlagern kann. Daher schlagen wir vor, die MSF-Gespr&#228;che mit Weiterzubildenden zu erweitern, um sowohl Entwicklungsziele als auch Lernziele zu ber&#252;cksichtigen.</Pgraph><Pgraph>Unsere Erkenntnis, dass einige Lernziele offenbar keinen Bezug zu den Fragen des MSF-Fragebogens hatten, deutet darauf hin, dass der Fragebogen angepasst werden muss, um den zus&#228;tzlichen Bed&#252;rfnissen der Lernenden gerecht zu werden. Diese zus&#228;tzlichen Lernziele k&#246;nnten auch auf L&#252;cken im Curriculum hinweisen. Eine Analyse der Lernziele k&#246;nnte daher genutzt werden, um das Weiterbildungscurriculum zu verbessern <TextLink reference="27"></TextLink>, indem &#252;bergeordnete Ziele aufgenommen werden.</Pgraph><Pgraph>Wenn die Lernziele &#252;ber den Umfang des MSF-Fragebogens hinausgehen, wird deutlich, wie komplex die Messung der Wirksamkeit von MSF ist, da der MSF-Prozess sowohl Kompetenzen als auch &#252;bergeordnete Ziele ber&#252;cksichtigt. Die Ausrichtung des Feedbackgespr&#228;chs auf diese zus&#228;tzlichen Ziele erh&#246;ht m&#246;glicherweise nicht direkt die Wirksamkeit von MSF als formative Kompetenzbewertung, erweitert jedoch deren Anwendungsbereich. Diese zus&#228;tzlichen Funktion k&#246;nnte &#252;ber die Bewertung von Kompetenzen hinausf&#252;hren und die professionelle Identit&#228;tsentwicklung unterst&#252;tzen. MSF k&#246;nnte letzteres Ziel besser erf&#252;llen, indem die Schulung von Supervisionspersonen und Weiterzubildenden um die zus&#228;tzlichen Inhalte erweitert wird und sie darauf vorbereitet werden, die &#252;bergeordneten Ziele besser zu formulieren. Um zu sehen, ob dies auch in einem internationalen Kontext gilt, sind weitere Untersuchungen erforderlich, da das MSF kontextabh&#228;ngig ist, gepr&#228;gt von unterschiedlichen Lernkulturen, einschliesslich anderer Formen der Bewertung in unterschiedlichen Weiterbildungscurricula.</Pgraph><SubHeadline>4.3. Einflussfaktoren</SubHeadline><Pgraph>Items wurden eher als St&#228;rken diskutiert, wenn sie mehr positive Kommentare hatten und als Bereiche zur Verbesserung, wenn sie negativen Kommentare hatten. H&#246;here Bewertungen liessen eine Diskussion &#252;ber St&#228;rken erwarten, niedrigere Bewertungen hingegen liessen keine Diskussion &#252;ber Bereiche zur Verbesserung erwarten; nur die Anzahl der negativen Kommentare war ein Indikator f&#252;r eine Diskussion &#252;ber Verbesserungen. Dies steht im Gegensatz zu Studien von Sargeant et al. <TextLink reference="7"></TextLink> und Overeem et al. <TextLink reference="15"></TextLink>, die niedrige Bewertungen als Hauptmotiv f&#252;r Ver&#228;nderungen nannten. Eine aktuelle qualitative Studie <TextLink reference="28"></TextLink> beschrieb, dass Feedback-Gespr&#228;che, die als summativ empfunden wurden, das Verhalten der Weiterzubildenden beeinflussten und sie dazu veranlassten, Schw&#228;chen zu verbergen. Ein Literatur-Review zum Verhalten der Beurteilenden <TextLink reference="29"></TextLink> fasste zusammen, dass auch diese Gruppe diese Spannung empfand, was sie dazu veranlasste, unangenehme Information zu verschweigen. Dies k&#246;nnte teilweise unsere Ergebnisse erkl&#228;ren, dass niedrige Bewertungen und die Diskrepanz zwischen externen Bewertungen und Selbstbewertungen nicht so h&#228;ufig diskutiert wurden wie hohe Bewertungen. Eine Fokussierung auf den formativen Aspekt des Feedbacks k&#246;nnte diese Barriere f&#252;r ehrliche Gespr&#228;che verkleinern <TextLink reference="29"></TextLink>.</Pgraph><Pgraph>Ausserdem fanden wir, wie andere Studien, signifikante Unterschiede zwischen externen Bewertungen und Selbstbewertungen, konnten jedoch den beschriebenen Einfluss dieser Unterschiede auf die Gespr&#228;che oder die Lernziele nicht best&#228;tigen <TextLink reference="15"></TextLink>, <TextLink reference="18"></TextLink>. Auch hier ist es m&#246;glich, dass Supervisionspersonen es vermieden, direkt auf die Unterschiede hinzuweisen, um Spannungen w&#228;hrend des Feedbackgespr&#228;chs zu vermeiden.</Pgraph><Pgraph>Eine Studie von Smither und Walker <TextLink reference="13"></TextLink> mit F&#252;hrungskr&#228;ften ergab, dass eine kleine Anzahl negativer aufgabenbezogener Kommentare den st&#228;rksten Einfluss auf die Leistung hatte, w&#228;hrend eine hohe Anzahl negativer Kommentare demotivierend wirkte. Die Anzahl der schriftlichen Kommentare lag in ihrer Studie bei durchschnittlich 6,8, w&#228;hrend wir sogar 15 bis 66 negative Kommentare pro Person in Weiterbildung beobachteten. Wir vermuten, dass die Supervisionspersonen in unserer Studie verhindert haben, die Weiterzubildenden durch zu viele Kommentare zu &#252;berfordern. </Pgraph><Pgraph>Trotz der hohen Anzahl positiver narrativer Kommentare konzentrierten sich die Feedback-Gespr&#228;che eher auf Bereiche zur Verbesserung, m&#246;glicherweise weil korrigierendes Feedback als umsetzbarer empfunden wurde als best&#228;tigendes Feedback. Ein Reflexionsmodell st&#252;tzt diese Argumentation: Sargeant et al. <TextLink reference="11"></TextLink> fanden heraus, dass Feedback, das nicht mit der Selbstwahrnehmung &#252;bereinstimmt, zu einer l&#228;nger anhaltenden Reflexion f&#252;hrt; m&#246;glicherweise haben Weiterzubildende und der Supervisionspersonen unbewusst diesen Prozess ber&#252;cksichtigt. Ausserdem wurde in unserer Studie bei der Schulung der Supervisionspersonen betont, dass St&#228;rken und Bereiche zur Verbesserung im Gleichgewicht diskutiert werden sollten, jedoch nicht geschult, Ziele zu formulieren, die das bestehende Verhalten best&#228;rken.</Pgraph><SubHeadline>4.4. Implikationen f&#252;r die Praxis</SubHeadline><SubHeadline2>4.4.1. Entwicklung der professionellen Identit&#228;t</SubHeadline2><Pgraph>Wir schlagen vor, den MSF-Fragebogen und die Schulung zu erweitern, um dem Bed&#252;rfnis der Weiterzubildenden nach &#252;bergeordneten Entwicklungszielen gerecht zu werden. Durch die Ber&#252;cksichtigung sowohl spezifischer Kompetenzen als auch allgemeinerer Entwicklungsziele k&#246;nnte MSF neben der Bewertung von Kompetenzen auch die Entwicklung der professionellen Identit&#228;t unterst&#252;tzen.</Pgraph><SubHeadline2>4.4.2. Format des MSF-Fragebogens und Schulung der Bewertenden</SubHeadline2><Pgraph>F&#252;r die klar definierten Kompetenzen empfehlen wir die Verwendung aufgabenbezogener Items, um ein qualitativ hochwertiges Feedback mit spezifischen, aufgabenorientierten Kommentaren zu erzielen.</Pgraph><SubHeadline2>4.4.3. Feedbackgespr&#228;ch</SubHeadline2><Pgraph>Wir empfehlen einen formativen Fokus in Feedbackgespr&#228;chen, um ehrliche Diskussionen zu f&#246;rdern und Spannungen abzubauen. Wenn Supervisionspersonen und Weiterzubildende entscheiden, welche Themen besprochen werden sollen, sollten sie skalenbasierte Bewertungen mit narrativen Kommentaren kombinieren, da beide wertvolle Informationen f&#252;r die Lernziele liefern. </Pgraph><SubHeadline>4.5. Limitationen und St&#228;rken der Studie</SubHeadline><Pgraph>Wir waren dadurch eingeschr&#228;nkt, dass wir die Gespr&#228;che nicht direkt beobachten konnten; wir analysierten nur die Daten, die in das Feedback-Gespr&#228;ch einflossen, begrenzte Notizen und die Lernziele als Ergebnis. Da sich unsere Studie detailliert auf die quantitativen Daten des MSF konzentrierte, konnten wir andere Faktoren, die den Prozess ebenfalls beeinflussten, wie die Wahrnehmung der Weiterzubildenden oder ihre emotionale Reaktion auf das Feedback, nicht untersuchen.</Pgraph><Pgraph>Unser einzigartiger Ansatz, den MSF-Prozess in einzelne Teile zu betrachten, half uns, die Wechselwirkungen zwischen skalenbasierten Bewertungen, narrativen Kommentaren, Feedback-Gespr&#228;chen und Lernzielen zu verstehen und so den komplexen Prozess zu beleuchten. Da nur wenige Studien die Einfl&#252;sse auf das Feedbackgespr&#228;ch und die Art und Weise, wie Feedback in Lernziele umgesetzt wurde, quantitativ untersucht haben, liefern unsere Daten wertvolle Erkenntnisse. Da eine quantitative Studie nur Zusammenh&#228;nge zwischen Daten aufzeigen, aber nicht erkl&#228;ren kann, sind qualitative Studien erforderlich, um die Perspektive der Weiterzubildenden und Supervisionspersonen zu unseren Ergebnissen und Empfehlungen zu untersuchen.</Pgraph></TextBlock>
    <TextBlock name="5. Conclusion" linked="yes" language="en">
      <MainHeadline>5. Conclusion</MainHeadline><Pgraph>Our study focused on the feedback conversation, a crucial element in the MSF process. We found that a part of the learning goals set during the conversation concerned the professional development of residents. Thus we suggest to use MSF not only as from of a formative assessment of competences but as a guidance process that helps residents develop their professional identity. We encourage supervisors and residents to explicitly include Professional Identity Formation topics such as career plans, engagement in research or personal attitudes into regular assessments and feedback conversations. Our insights offer practical recommendations for improving the use of MSF and shows a way how Professional Identity Formation might be supported during residency training.</Pgraph></TextBlock>
    <TextBlock name="5. Fazit" linked="yes" language="de">
      <MainHeadline>5. Fazit</MainHeadline><Pgraph>Unsere Studie konzentrierte sich auf das Feedbackgespr&#228;ch, ein entscheidendes Element im MSF-Prozess. Wir haben festgestellt, dass ein Teil der w&#228;hrend des Gespr&#228;chs festgelegten Lernziele die professionelle Entwicklung der Weiterzubildenden betraf. Daher schlagen wir vor, MSF nicht nur als formatives Bewertungsformat zu nutzen, sondern als Begleitmassnahme, welche Weiterzubildende bei der Entwicklung der professionellen Identit&#228;t unterst&#252;tzt. Wir ermutigen Supervisionspersonen und Weiterzubildende, Themen der Entwicklung der professionellen Identit&#228;t, wie Karrierepl&#228;ne, Engagement in der Forschung oder pers&#246;nliche Haltungen, ausdr&#252;cklich in regelm&#228;ssige Bewertungen und Feedbackgespr&#228;che einzubeziehen. Unsere Erkenntnisse bieten praktische Empfehlungen zur Verbesserung der Nutzung von MSF und zeigen einen Weg auf, wie die Entwicklung der professionellen Identit&#228;t w&#228;hrend der &#228;rztlichen Weiterbildung unterst&#252;tzt werden kann.</Pgraph></TextBlock>
    <TextBlock name="Notes" linked="yes" language="en">
      <MainHeadline>Notes</MainHeadline><SubHeadline>Authorship</SubHeadline><Pgraph>The authors Kathrin Neuhaus and S&#246;ren Huwendiek share the last authorship.</Pgraph><SubHeadline>Authors&#8217; ORCIDs</SubHeadline><Pgraph><UnorderedList><ListItem level="1">Eva K. Hennel: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0002-7625-5785">0000-0002-7625-5785</Hyperlink>&#93;</ListItem><ListItem level="1">Felicitas-M. Lahner: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0001-6697-3698">0000-0001-6697-3698</Hyperlink>&#93;</ListItem><ListItem level="1">Noemi Zweifel: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0001-7313-3929">0000-0001-7313-3929</Hyperlink>&#93;</ListItem><ListItem level="1">Sigrid Harendza: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0002-7920-8431">0000-0002-7920-8431</Hyperlink>&#93;</ListItem><ListItem level="1">Kathrin Neuhaus: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0003-2438-1779">0000-0003-2438-1779</Hyperlink>&#93;</ListItem><ListItem level="1">S&#246;ren Huwendiek: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0001-6116-9633">0000-0001-6116-9633</Hyperlink>&#93;</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock name="Anmerkungen" linked="yes" language="de">
      <MainHeadline>Anmerkungen</MainHeadline><SubHeadline>Autorenschaft</SubHeadline><Pgraph>Die Autor&#42;in Kathrin Neuhaus und S&#246;ren Huwendiek teilen sich die Letztautorenschaft.</Pgraph><SubHeadline>ORCIDs der Autor&#42;innen</SubHeadline><Pgraph><UnorderedList><ListItem level="1">Eva K. Hennel: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0002-7625-5785">0000-0002-7625-5785</Hyperlink>&#93;</ListItem><ListItem level="1">Felicitas-M. Lahner: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0001-6697-3698">0000-0001-6697-3698</Hyperlink>&#93;</ListItem><ListItem level="1">Noemi Zweifel: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0001-7313-3929">0000-0001-7313-3929</Hyperlink>&#93;</ListItem><ListItem level="1">Sigrid Harendza: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0002-7920-8431">0000-0002-7920-8431</Hyperlink>&#93;</ListItem><ListItem level="1">Kathrin Neuhaus: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0003-2438-1779">0000-0003-2438-1779</Hyperlink>&#93;</ListItem><ListItem level="1">S&#246;ren Huwendiek: &#91;<Hyperlink href="https:&#47;&#47;orcid.org&#47;0000-0001-6116-9633">0000-0001-6116-9633</Hyperlink>&#93;</ListItem></UnorderedList></Pgraph></TextBlock>
    <TextBlock name="Competing interests" linked="yes" language="en">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests. </Pgraph></TextBlock>
    <TextBlock name="Interessenkonflikt" linked="yes" language="de">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autor&#42;innen erkl&#228;ren, dass sie keinen Interessenkonflikt im Zusammenhang mit diesem Artikel haben.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Sargeant J</RefAuthor>
        <RefTitle>Reflecting upon multisource feedback as &#8216;assessment for learning&#8217;</RefTitle>
        <RefYear>2015</RefYear>
        <RefJournal>Perspect Med Educ</RefJournal>
        <RefPage>55-56</RefPage>
        <RefTotal>Sargeant J. Reflecting upon multisource feedback as &#8216;assessment for learning&#8217;. Perspect Med Educ. 2015;4(2):55-56. DOI: 10.1007&#47;s40037-015-0175-y</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s40037-015-0175-y</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Norcini J</RefAuthor>
        <RefAuthor>Burch V</RefAuthor>
        <RefTitle>Workplace-based assessment as an educational tool: AMEE Guide No. 31</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>855-871</RefPage>
        <RefTotal>Norcini J, Burch V. Workplace-based assessment as an educational tool: AMEE Guide No. 31. Med Teach. 2007;29(9):855-871. DOI: 10.1080&#47;01421590701775453</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;01421590701775453</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Boursicot K</RefAuthor>
        <RefAuthor>Etheridge L</RefAuthor>
        <RefAuthor>Setna Z</RefAuthor>
        <RefAuthor>Sturrock A</RefAuthor>
        <RefAuthor>Ker J</RefAuthor>
        <RefAuthor>Smee S</RefAuthor>
        <RefAuthor>Sambandam E</RefAuthor>
        <RefTitle>Performance in assessment: consensus statement and recommendations from the Ottawa conference</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>370-383</RefPage>
        <RefTotal>Boursicot K, Etheridge L, Setna Z, Sturrock A, Ker J, Smee S, Sambandam E. Performance in assessment: consensus statement and recommendations from the Ottawa conference. Med Teach. 2011;33(5):370-383. DOI: 10.3109&#47;0142159X.2011.565831</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2011.565831</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Boursicot K</RefAuthor>
        <RefAuthor>Kemp S</RefAuthor>
        <RefAuthor>Wilkinson T</RefAuthor>
        <RefAuthor>Findyartini A</RefAuthor>
        <RefAuthor>Canning C</RefAuthor>
        <RefAuthor>Cilliers F</RefAuthor>
        <RefAuthor>Fuller R</RefAuthor>
        <RefTitle>Performance assessment: Consensus statement and recommendations from the 2020 Ottawa Conference</RefTitle>
        <RefYear>2021</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>58-67</RefPage>
        <RefTotal>Boursicot K, Kemp S, Wilkinson T, Findyartini A, Canning C, Cilliers F, Fuller R. Performance assessment: Consensus statement and recommendations from the 2020 Ottawa Conference. Med Teach. 2021;43(1):58-67. DOI: 10.1080&#47;0142159X.2020.1830052</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;0142159X.2020.1830052</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Jarvis-Selinger S</RefAuthor>
        <RefAuthor>Pratt DD</RefAuthor>
        <RefAuthor>Regehr G</RefAuthor>
        <RefTitle>Competency is not enough: integrating identity formation into the medical education discourse</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>1185-1190</RefPage>
        <RefTotal>Jarvis-Selinger S, Pratt DD, Regehr G. Competency is not enough: integrating identity formation into the medical education discourse. Acad Med. 2012;87(9):1185-1190. DOI: 10.1097&#47;ACM.0b013e3182604968</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;ACM.0b013e3182604968</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Overeem K</RefAuthor>
        <RefAuthor>Lombarts M</RefAuthor>
        <RefAuthor>Arah OA</RefAuthor>
        <RefAuthor>Klazinga NS</RefAuthor>
        <RefAuthor>Grol RP</RefAuthor>
        <RefAuthor>Wollersheim HC</RefAuthor>
        <RefTitle>Three methods of multi-source feedback compared: a plea for narrative comments and coworkers&#8217; perspectives</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>141-147</RefPage>
        <RefTotal>Overeem K, Lombarts M, Arah OA, Klazinga NS, Grol RP, Wollersheim HC. Three methods of multi-source feedback compared: a plea for narrative comments and coworkers&#8217; perspectives. Med Teach. 2010;32(2):141-147. DOI: 10.3109&#47;01421590903144128</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;01421590903144128</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Sargeant J</RefAuthor>
        <RefAuthor>Mann K</RefAuthor>
        <RefAuthor>Sinclair D</RefAuthor>
        <RefAuthor>Van der Vleuten C</RefAuthor>
        <RefAuthor>Metsemakers J</RefAuthor>
        <RefTitle>Challenges in multisource feedback: intended and unintended outcomes</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>583-591</RefPage>
        <RefTotal>Sargeant J, Mann K, Sinclair D, Van der Vleuten C, Metsemakers J. Challenges in multisource feedback: intended and unintended outcomes. Med Educ. 2007;41(6):583-591. DOI: 10.1111&#47;j.1365-2923.2007.02769.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2923.2007.02769.x</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Burford B</RefAuthor>
        <RefAuthor>Illing J</RefAuthor>
        <RefAuthor>Kergon C</RefAuthor>
        <RefAuthor>Morrow G</RefAuthor>
        <RefAuthor>Livingston M</RefAuthor>
        <RefTitle>User perceptions of multi-source feedback tools for junior doctors</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>165-176</RefPage>
        <RefTotal>Burford B, Illing J, Kergon C, Morrow G, Livingston M. User perceptions of multi-source feedback tools for junior doctors. Med Educ. 2010;44(3):165-176. DOI: 10.1111&#47;j.1365-2923.2009.03565.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2923.2009.03565.x</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Overeem K</RefAuthor>
        <RefAuthor>Wollersheim H</RefAuthor>
        <RefAuthor>Driessen E</RefAuthor>
        <RefAuthor>Lombarts K</RefAuthor>
        <RefAuthor>Van De Ven G</RefAuthor>
        <RefAuthor>Grol R</RefAuthor>
        <RefAuthor>Arah O</RefAuthor>
        <RefTitle>Doctors&#8217; perceptions of why 360&#8208;degree feedback does (not) work: a qualitative study</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>874-882</RefPage>
        <RefTotal>Overeem K, Wollersheim H, Driessen E, Lombarts K, Van De Ven G, Grol R, Arah O. Doctors&#8217; perceptions of why 360&#8208;degree feedback does (not) work: a qualitative study. Med Educ. 2009;43(9):874-882. DOI: 10.1111&#47;j.1365-2923.2009.03439.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2923.2009.03439.x</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Sargeant J</RefAuthor>
        <RefAuthor>Mann KV</RefAuthor>
        <RefAuthor>Ferrier SN</RefAuthor>
        <RefAuthor>Langille DB</RefAuthor>
        <RefAuthor>Muirhead PD</RefAuthor>
        <RefAuthor>Hayes VM</RefAuthor>
        <RefAuthor>Sinclair DE</RefAuthor>
        <RefTitle>Responses of rural family physicians and their colleague and coworker raters to a multi-source feedback process: a pilot study</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>S42-S44</RefPage>
        <RefTotal>Sargeant J, Mann KV, Ferrier SN, Langille DB, Muirhead PD, Hayes VM, Sinclair DE. Responses of rural family physicians and their colleague and coworker raters to a multi-source feedback process: a pilot study. Acad Med. 2003;78(10 Suppl):S42-S44. DOI: 10.1097&#47;00001888-200310001-00014</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;00001888-200310001-00014</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Sargeant JM</RefAuthor>
        <RefAuthor>Mann KV</RefAuthor>
        <RefAuthor>van der Vleuten CP</RefAuthor>
        <RefAuthor>Metsemakers JF</RefAuthor>
        <RefTitle>Reflection: a link between receiving and using assessment feedback</RefTitle>
        <RefYear>2009</RefYear>
        <RefJournal>Adv Health Sci Educ Theory Pract</RefJournal>
        <RefPage>399-410</RefPage>
        <RefTotal>Sargeant JM, Mann KV, van der Vleuten CP, Metsemakers JF. Reflection: a link between receiving and using assessment feedback. Adv Health Sci Educ Theory Pract. 2009;14(3):399-410. DOI: 10.1007&#47;s10459-008-9124-4</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s10459-008-9124-4</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Hall J</RefAuthor>
        <RefAuthor>Atkinson A</RefAuthor>
        <RefAuthor>Chan M-K</RefAuthor>
        <RefAuthor>Tourian L</RefAuthor>
        <RefAuthor>Thoma B</RefAuthor>
        <RefAuthor>Pattani R</RefAuthor>
        <RefTitle>The Clinical Learning Environment in CanMEDS 2025</RefTitle>
        <RefYear>2023</RefYear>
        <RefJournal>Can Med Educ J</RefJournal>
        <RefPage>41-45</RefPage>
        <RefTotal>Hall J, Atkinson A, Chan M-K, Tourian L, Thoma B, Pattani R. The Clinical Learning Environment in CanMEDS 2025. Can Med Educ J. 2023;14(1):41-45. DOI: 10.36834&#47;cmej.75537</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.36834&#47;cmej.75537</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Smither JW</RefAuthor>
        <RefAuthor>Walker AG</RefAuthor>
        <RefTitle>Are the Characteristics of Narrative Comments Related to Improvement in Multirater Feedback Ratings Over Time&#63;</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>J Appl Psychol</RefJournal>
        <RefPage>575-581</RefPage>
        <RefTotal>Smither JW, Walker AG. Are the Characteristics of Narrative Comments Related to Improvement in Multirater Feedback Ratings Over Time&#63; J Appl Psychol. 2004;89(3):575-581. DOI: 10.1037&#47;0021-9010.89.3.575</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1037&#47;0021-9010.89.3.575</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Ferguson J</RefAuthor>
        <RefAuthor>Wakeling J</RefAuthor>
        <RefAuthor>Bowie P</RefAuthor>
        <RefTitle>Factors influencing the effectiveness of multisource feedback in improving the professional practice of medical doctors: a systematic review</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>76</RefPage>
        <RefTotal>Ferguson J, Wakeling J, Bowie P. Factors influencing the effectiveness of multisource feedback in improving the professional practice of medical doctors: a systematic review. BMC Med Educ. 2014;14:76. DOI: 10.1186&#47;1472-6920-14-76</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;1472-6920-14-76</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>Overeem K</RefAuthor>
        <RefAuthor>Wollersheimh HC</RefAuthor>
        <RefAuthor>Arah OA</RefAuthor>
        <RefAuthor>Cruijsberg JK</RefAuthor>
        <RefAuthor>Grol RP</RefAuthor>
        <RefAuthor>Lombarts KM</RefAuthor>
        <RefTitle>Factors predicting doctors&#8217; reporting of performance change in response to multisource feedback</RefTitle>
        <RefYear>2012</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>52</RefPage>
        <RefTotal>Overeem K, Wollersheimh HC, Arah OA, Cruijsberg JK, Grol RP, Lombarts KM. Factors predicting doctors&#8217; reporting of performance change in response to multisource feedback. BMC Med Educ. 2012;12:52. DOI: 10.1186&#47;1472-6920-12-52</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;1472-6920-12-52</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Al Khalifa K</RefAuthor>
        <RefAuthor>Al Ansari A</RefAuthor>
        <RefAuthor>Violato C</RefAuthor>
        <RefAuthor>Donnon T</RefAuthor>
        <RefTitle>Multisource Feedback to Assess Surgical Practice: A Systematic Review</RefTitle>
        <RefYear>2013</RefYear>
        <RefJournal>J Surg Educ</RefJournal>
        <RefPage>475-486</RefPage>
        <RefTotal>Al Khalifa K, Al Ansari A, Violato C, Donnon T. Multisource Feedback to Assess Surgical Practice: A Systematic Review. J Surg Educ. 2013;70(4):475-486. DOI: 10.1016&#47;j.jsurg.2013.02.002</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1016&#47;j.jsurg.2013.02.002</RefLink>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Violato C</RefAuthor>
        <RefAuthor>Lockyer JM</RefAuthor>
        <RefAuthor>Fidler H</RefAuthor>
        <RefTitle>Changes in performance: a 5year longitudinal study of participants in a multisource feedback programme</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>1007-1013</RefPage>
        <RefTotal>Violato C, Lockyer JM, Fidler H. Changes in performance: a 5year longitudinal study of participants in a multisource feedback programme. Med Educ. 2008;42(10):1007-1013. DOI: 10.1111&#47;j.1365-2923.2008.03127.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2923.2008.03127.x</RefLink>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Wood L</RefAuthor>
        <RefAuthor>Hassell A</RefAuthor>
        <RefAuthor>Whitehouse A</RefAuthor>
        <RefAuthor>Bullock A</RefAuthor>
        <RefAuthor>Wall D</RefAuthor>
        <RefTitle>A literature review of multi-source feedback systems within and without health services, leading to 10 tips for their successful design</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>e185-e191</RefPage>
        <RefTotal>Wood L, Hassell A, Whitehouse A, Bullock A, Wall D. A literature review of multi-source feedback systems within and without health services, leading to 10 tips for their successful design. Med Teach. 2006;28(7):e185-e191. DOI: 10.1080&#47;01421590600834286</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;01421590600834286</RefLink>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Sargeant J</RefAuthor>
        <RefAuthor>McNaughton E</RefAuthor>
        <RefAuthor>Mercer S</RefAuthor>
        <RefAuthor>Murphy D</RefAuthor>
        <RefAuthor>Sullivan P</RefAuthor>
        <RefAuthor>Bruce DA</RefAuthor>
        <RefTitle>Providing feedback: Exploring a model (emotion, content, outcomes) for facilitating multisource feedback</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>744-749</RefPage>
        <RefTotal>Sargeant J, McNaughton E, Mercer S, Murphy D, Sullivan P, Bruce DA. Providing feedback: Exploring a model (emotion, content, outcomes) for facilitating multisource feedback. Med Teach. 2011;33(9):744-749. DOI: 10.3109&#47;0142159X.2011.577287</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2011.577287</RefLink>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Mackillop L</RefAuthor>
        <RefAuthor>Parker-Swift J</RefAuthor>
        <RefAuthor>Crossley J</RefAuthor>
        <RefTitle>Getting the questions right: non-compound questions are more reliable than compound questions on matched multi-source feedback instruments</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>843-848</RefPage>
        <RefTotal>Mackillop L, Parker-Swift J, Crossley J. Getting the questions right: non-compound questions are more reliable than compound questions on matched multi-source feedback instruments. Med Educ. 2011;45(8):843-848. DOI: 10.1111&#47;j.1365-2923.2011.03996.x</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;j.1365-2923.2011.03996.x</RefLink>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Frank JR</RefAuthor>
        <RefAuthor>Danoff D</RefAuthor>
        <RefTitle>The CanMEDS initiative: implementing an outcomes-based framework of physician competencies</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>642-647</RefPage>
        <RefTotal>Frank JR, Danoff D. The CanMEDS initiative: implementing an outcomes-based framework of physician competencies. Med Teach. 2007;29(7):642-647. DOI: 10.1080&#47;01421590701746983</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1080&#47;01421590701746983</RefLink>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Hennel EK</RefAuthor>
        <RefAuthor>Subotic U</RefAuthor>
        <RefAuthor>Berendonk C</RefAuthor>
        <RefAuthor>Stricker D</RefAuthor>
        <RefAuthor>Harendza S</RefAuthor>
        <RefAuthor>Huwendiek S</RefAuthor>
        <RefTitle>A german-language competency-based multisource feedback instrument for residents: development and validity evidence</RefTitle>
        <RefYear>2020</RefYear>
        <RefJournal>BMC Med Educ</RefJournal>
        <RefPage>357</RefPage>
        <RefTotal>Hennel EK, Subotic U, Berendonk C, Stricker D, Harendza S, Huwendiek S. A german-language competency-based multisource feedback instrument for residents: development and validity evidence. BMC Med Educ. 2020;20(1):357. DOI: 10.1186&#47;s12909-020-02259-2</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1186&#47;s12909-020-02259-2</RefLink>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Lockyer JM</RefAuthor>
        <RefAuthor>Sargeant J</RefAuthor>
        <RefAuthor>Richards SH</RefAuthor>
        <RefAuthor>Campbell JL</RefAuthor>
        <RefAuthor>Rivera LA</RefAuthor>
        <RefTitle>Multisource Feedback and Narrative Comments: Polarity, Specificity, Actionability, and CanMEDS Roles</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>J Contin Educ Health Prof</RefJournal>
        <RefPage>32-40</RefPage>
        <RefTotal>Lockyer JM, Sargeant J, Richards SH, Campbell JL, Rivera LA. Multisource Feedback and Narrative Comments: Polarity, Specificity, Actionability, and CanMEDS Roles. J Contin Educ Health Prof. 2018;38(1):32-40. DOI: 10.1097&#47;CEH.0000000000000183</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1097&#47;CEH.0000000000000183</RefLink>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>R Core Team</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2021</RefYear>
        <RefBookTitle>R: A language and environment for statistical computing. R Foundation for Statistical Computing</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>R Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria: R Core Team; 2021. Zug&#228;nglich unter&#47;available from: https:&#47;&#47;www.R-project.org&#47;</RefTotal>
        <RefLink>https:&#47;&#47;www.R-project.org&#47;</RefLink>
      </Reference>
      <Reference refNo="25">
        <RefAuthor>Brown JM</RefAuthor>
        <RefAuthor>Lowe K</RefAuthor>
        <RefAuthor>Fillingham J</RefAuthor>
        <RefAuthor>Murphy PN</RefAuthor>
        <RefAuthor>Bamforth M</RefAuthor>
        <RefAuthor>Shaw NJ</RefAuthor>
        <RefTitle>An investigation into the use of multi-source feedback (MSF) as a work-based assessment tool</RefTitle>
        <RefYear>2014</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>997-1004</RefPage>
        <RefTotal>Brown JM, Lowe K, Fillingham J, Murphy PN, Bamforth M, Shaw NJ. An investigation into the use of multi-source feedback (MSF) as a work-based assessment tool. Med Teach. 2014;36(11):997-1004. DOI: 10.3109&#47;0142159X.2014.909920</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.3109&#47;0142159X.2014.909920</RefLink>
      </Reference>
      <Reference refNo="26">
        <RefAuthor>Dory V</RefAuthor>
        <RefAuthor>Cummings BA</RefAuthor>
        <RefAuthor>Mondou M</RefAuthor>
        <RefAuthor>Young M</RefAuthor>
        <RefTitle>Nudging clinical supervisors to provide better in-training assessment reports</RefTitle>
        <RefYear>2020</RefYear>
        <RefJournal>Perspect Med Educ</RefJournal>
        <RefPage>66-70</RefPage>
        <RefTotal>Dory V, Cummings BA, Mondou M, Young M. Nudging clinical supervisors to provide better in-training assessment reports. Perspect Med Educ. 2020;9(1):66-70. DOI: 10.1007&#47;s40037-019-00554-3</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1007&#47;s40037-019-00554-3</RefLink>
      </Reference>
      <Reference refNo="27">
        <RefAuthor>Thomas PA</RefAuthor>
        <RefAuthor>Kern DE</RefAuthor>
        <RefAuthor>Hughes MT</RefAuthor>
        <RefAuthor>Chen BY</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2016</RefYear>
        <RefBookTitle>Curriculum development for medical education: a six-step approach</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Thomas PA, Kern DE, Hughes MT, Chen BY. Curriculum development for medical education: a six-step approach. Baltimore (MA): JHU Press; 2016.</RefTotal>
      </Reference>
      <Reference refNo="28">
        <RefAuthor>Huffman BM</RefAuthor>
        <RefAuthor>Hafferty FW</RefAuthor>
        <RefAuthor>Bhagra A</RefAuthor>
        <RefAuthor>Leasure EL</RefAuthor>
        <RefAuthor>Santivasi WL</RefAuthor>
        <RefAuthor>Sawatsky AP</RefAuthor>
        <RefTitle>Resident impression management within feedback conversations: A qualitative study</RefTitle>
        <RefYear>2020</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>266-274</RefPage>
        <RefTotal>Huffman BM, Hafferty FW, Bhagra A, Leasure EL, Santivasi WL, Sawatsky AP. Resident impression management within feedback conversations: A qualitative study. Med Educ. 2020;55(2):266-274. DOI: 10.1111&#47;medu.14360</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;medu.14360</RefLink>
      </Reference>
      <Reference refNo="29">
        <RefAuthor>Scarff CE</RefAuthor>
        <RefAuthor>Bearman M</RefAuthor>
        <RefAuthor>Chiavaroli N</RefAuthor>
        <RefAuthor>Trumble S</RefAuthor>
        <RefTitle>Keeping mum in clinical supervision: private thoughts and public judgements</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>133-142</RefPage>
        <RefTotal>Scarff CE, Bearman M, Chiavaroli N, Trumble S. Keeping mum in clinical supervision: private thoughts and public judgements. Med Educ. 2019;53(2):133-142. DOI: 10.1111&#47;medu.13728 </RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.1111&#47;medu.13728</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 1: Data collection and analyses according to the three parts of MSF investigated in this study</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 1: Datenerhebung und -analysen entsprechend der drei in dieser Studie untersuchten Teile vom MSF</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 2: Assumptions for multiple linear models</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 2: Annahmen f&#252;r multiple lineare Regressionen</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>3</MediaNo>
          <MediaID language="en">3en</MediaID>
          <MediaID language="de">3de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 3: Allocation of items of the MSF questionnaire and learning goals to CanMEDS roles</Mark1><LineBreak></LineBreak>Three goals which concerned the overall performance and 24 goals which concerned career planning were not allocated and not included into the calculations</Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 3: Zuordnung der Items des MSF-Fragebogens und der Lernziele zu den CanMEDS-Rollen. Die CanMEDS-Rollen wurden bewusst nicht ins Deutsche &#252;bersetzt</Mark1><LineBreak></LineBreak>Drei Ziele, die sich auf die Gesamtleistung bezogen, und 24 Ziele, die sich auf die Karriereplanung bezogen, wurden nicht zugeordnet und nicht in die Berechnungen einbezogen.</Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>4</MediaNo>
          <MediaID language="en">4en</MediaID>
          <MediaID language="de">4de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 4: Influences on the discussion of strengths</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 4: Einfl&#252;sse auf die Diskussion der St&#228;rken</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>5</MediaNo>
          <MediaID language="en">5en</MediaID>
          <MediaID language="de">5de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 5: Influences on the discussion of areas for improvement</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 5: Einfl&#252;sse auf die Diskussion von Bereichen zur Verbesserung</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>6</MediaNo>
          <MediaID language="en">6en</MediaID>
          <MediaID language="de">6de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Table 6: Influences on learning goals</Mark1></Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Tabelle 6: Einfl&#252;sse auf Lernziele</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>6</NoOfTables>
      </Tables>
      <Figures>
        <Figure width="426" height="271" format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="en">1en</MediaID>
          <MediaID language="de">1de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 1: Content of the conversations and learning goals, documented on the structured form for the feedback conversation, dependent on CanMEDS roles</Mark1><LineBreak></LineBreak>Note: this chart excludes the 3 goals that focused on overall performance and the 24 career planning goals.</Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 1: Inhalt der Gespr&#228;che und Lernziele, dokumentiert auf dem strukturierten Formular f&#252;r das Feedbackgespr&#228;ch, abh&#228;ngig von den CanMEDS-Rollen. Die CanMEDS-Rollen wurden bewusst nicht ins Deutsche &#252;bersetzt.</Mark1><LineBreak></LineBreak>Hinweis: Diese Grafik enth&#228;lt nicht die 3 Ziele, die sich auf die Gesamtleistung konzentrierten und nicht die 24 Ziele zur Karriereplanung.</Pgraph></Caption>
        </Figure>
        <Figure width="630" height="387" format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="en">2en</MediaID>
          <MediaID language="de">2de</MediaID>
          <Caption language="en"><Pgraph><Mark1>Figure 2: Overview of factors that influence the feedback conversation and the learning goals</Mark1><LineBreak></LineBreak>Arrows represent significant influence.</Pgraph></Caption>
          <Caption language="de"><Pgraph><Mark1>Abbildung 2: &#220;berblick &#252;ber Faktoren, die das Feedbackgespr&#228;ch und die Lernziele beeinflussen</Mark1><LineBreak></LineBreak>Pfeile stehen f&#252;r einen signifikanten Einfluss.</Pgraph></Caption>
        </Figure>
        <NoOfPictures>2</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>