<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<GmsArticle>
  <MetaData>
    <Identifier>zma000705</Identifier>
    <IdentifierDoi>10.3205/zma000705</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0007053</IdentifierUrn>
    <ArticleType language="de">Forschungsarbeit</ArticleType>
    <ArticleType language="en">research article</ArticleType>
    <TitleGroup>
      <Title language="de">Gruppenleistungen beim Review von Multiple-Choice-Fragen - Ein Vergleich von face-to-face und virtuellen Gruppen mit und ohne Moderation</Title>
      <TitleTranslated language="en">Review of multiple-choice-questions and group performance - A comparison of face-to-face and virtual groups with and without facilitation</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Kazubke</Lastname>
          <LastnameHeading>Kazubke</LastnameHeading>
          <Firstname>Edda</Firstname>
          <Initials>E</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Humboldt-Universit&#228;t zu Berlin, Institut f&#252;r Psychologie, Berlin, Deutschland</Affiliation>
        </Address>
        <Email>eddakaz&#64;googlemail.com</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Sch&#252;ttpelz-Brauns</Lastname>
          <LastnameHeading>Sch&#252;ttpelz-Brauns</LastnameHeading>
          <Firstname>Katrin</Firstname>
          <Initials>K</Initials>
          <AcademicTitle>Dr. rer. nat.</AcademicTitle>
        </PersonNames>
        <Address>Charit&#232; - Universit&#228;tsmedizin Berlin, Dieter Scheffner Fachzentrum, Assessment-Bereich &#47; Progress Test Medizin, Virchowweg 24, D-10117 Berlin, Deutschland<Affiliation>Charit&#232; - Universit&#228;tsmedizin Berlin, Dieter Scheffner Fachzentrum, Assessment-Bereich &#47; Progress Test Medizin, Berlin, Deutschland</Affiliation></Address>
        <Email>katrin.brauns&#64;charite.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">multiple choice questions</Keyword>
      <Keyword language="en">MCQ</Keyword>
      <Keyword language="en">face-to-fac</Keyword>
      <Keyword language="en">virtual</Keyword>
      <Keyword language="en">facilitation</Keyword>
      <Keyword language="en">review-committee</Keyword>
      <Keyword language="de">Multiple-Choice-Fragen</Keyword>
      <Keyword language="de">face-to-face</Keyword>
      <Keyword language="de">virtuell</Keyword>
      <Keyword language="de">Moderation</Keyword>
      <Keyword language="de">Review-Komitee</Keyword>
      <SectionHeading language="en">medicine</SectionHeading>
      <SectionHeading language="de">Humanmedizin</SectionHeading>
    </SubjectGroup>
    <DateReceived>20100309</DateReceived>
    <DateRevised>20100709</DateRevised>
    <DateAccepted>20100720</DateAccepted>
    <DatePublishedList>
      
    <DatePublished>20101115</DatePublished></DatePublishedList>
    <Language>germ</Language>
    <LanguageTranslation>engl</LanguageTranslation>
    <SourceGroup>
      <Journal>
        <ISSN>1860-3572</ISSN>
        <Volume>27</Volume>
        <Issue>5</Issue>
        <JournalTitle>GMS Zeitschrift f&#252;r Medizinische Ausbildung</JournalTitle>
        <JournalTitleAbbr>GMS Z Med Ausbild</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>68</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph><Mark1>Einleitung: </Mark1>Multiple-Choice-Fragen (MCF) werden in vielen Pr&#252;fungen der medizinischen Ausbildung verwendet und bed&#252;rfen aus diesem Grund einer sorgf&#228;ltigen Qualit&#228;tssicherung, beispielsweise durch den Einsatz von Review-Komitees. Anhand der vorliegenden empirischen Studie soll erforscht werden, ob virtuell per E-Mail kommunizierende Review-Komitees vergleichbar sind mit face-to-face Review-Komitees hinsichtlich ihrer Leistung beim Review-Prozess und ob sich Moderation positiv auswirkt.</Pgraph><Pgraph><Mark1>Methodik: </Mark1>16 Kleingruppen von Psychologie-Studenten hatten die Aufgabe unter vier verschiedenen Versuchsbedingungen MCF zu bewerten und zu verbessern. Im zweiten Untersuchungsabschnitt wurden die ver&#228;nderten Fragen zur Beurteilung der G&#252;te einer neuen Stichprobe vorgelegt. </Pgraph><Pgraph><Mark1>Ergebnisse:</Mark1> F&#252;r die Variablen &#8222;Art der Review-Komitees&#8220; und &#8222;Moderation&#8220; wurde kein signifikanter Einfluss gefunden. Jedoch unterschieden sich face-to-face und virtuelle Gruppen deutlich in den ben&#246;tigten Bearbeitungszeiten. Die Versuchsbedingung &#8222;face-to-face ohne Moderation&#8220; wurde von den Versuchsteilnehmern hinsichtlich Verantwortungs&#252;bernahme, Arbeitsweise, Wohlgef&#252;hl, Motivation und Konzentration auf die Aufgabe generell am positivsten bewertet.</Pgraph><Pgraph><Mark1>Diskussion: </Mark1>Face-to-face und virtuelle Gruppen sind beim Review von MCF gleich effektiv, unterscheiden sich aber hinsichtlich ihrer Effizienz. Der Einsatz elektronischen Reviews scheint somit m&#246;glich, ist aber wenig empfehlenswert wegen der langen Bearbeitungszeit und technischer Probleme.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph><Mark1>Background: </Mark1>Multiple choice questions (MCQs) are often used in exams of medical education and need careful quality management for example by the application of review committees. This study investigates whether groups communicating virtually by email are similar to face-to-face groups concerning their review process performance and whether a facilitator has positive effects.</Pgraph><Pgraph><Mark1>Methods: </Mark1>16 small groups of students were examined, which had to evaluate and correct MCQs under four different conditions. In the second part of the investigation the changed questions were given to a new random sample for the judgement of the item quality.</Pgraph><Pgraph><Mark1>Results: </Mark1>There was no significant influence of the variables &#8220;form of review committee&#8221; and &#8220;facilitation&#8221;. However, face-to-face and virtual groups clearly differed in the required treatment times. The test condition &#8220;face to face without facilitation&#8221; was generally valued most positively concerning taking over responsibility, approach to work, sense of well-being, motivation and concentration on the task.</Pgraph><Pgraph><Mark1>Discussion:</Mark1> Face-to-face and virtual groups are equally effective in the review of MCQs but differ concerning their efficiency. The application of electronic review seems to be possible but is hardly recommendable because of the long process time and technical problems.</Pgraph></Abstract>
    <TextBlock language="de" linked="yes" name="Einleitung">
      <MainHeadline>Einleitung</MainHeadline><Pgraph>Die &#228;rztliche Approbationsordnung verlangt f&#252;r jedes Fach in der medizinischen Ausbildung eine Benotung. Zur &#220;berpr&#252;fung der Studienleistung werden vielfach Multiple-Choice (MC) Aufgaben eingesetzt. Hierbei ist die Qualit&#228;t der konstruierten Fragen von hoher Bedeutung. Zur Gew&#228;hrleistung dieses Anspruchs ist es notwendig, die MC-Fragen vor ihrem Einsatz in Pr&#252;fungen zu evaluieren und gegebenenfalls zu verbessern. Die Qualit&#228;tssicherung erfolgt in der Regel durch den Einsatz von Review-Komitees (RKs), welche sich aus Experten verschiedener Fachbereiche konstituieren und bez&#252;glich der Erkennung formaler Fehler in Fragen geschult werden. Diese spezielle Aufgabe wird in Gruppen bearbeitet, um das Wissen und die Erfahrung vieler Personen nutzbar zu machen. Um m&#246;gliche St&#246;reinfl&#252;sse gruppendynamischer Prozesse zu minimieren, werden die regelm&#228;&#223;igen Sitzungen moderiert. Moderation beeinflusst die Qualit&#228;t von Kommunikation und Zusammenarbeit positiv <TextLink reference="1"></TextLink>. Die Terminierung der Mitglieder von RKs ist ein Problem, zu dessen L&#246;sung die Einf&#252;hrung elektronischer Reviews beitragen k&#246;nnte. Die Umsetzung virtueller Zusammenarbeit als RK ist beispielsweise per E-Mail denkbar. Von Vorteil ist hierbei die selbstbestimmte Wahl des Kommunikationszeitpunktes und der Bearbeitungszeit <TextLink reference="2"></TextLink>. Die bisherige Forschung zum Vergleich der Arbeit von face-to-face und virtuellen Gruppen konnte keine Leistungsunterschiede zeigen. Virtuelle Gruppen ben&#246;tigten allerdings deutlich mehr Zeit f&#252;r die Bearbeitung derselben Aufgabe. Dar&#252;ber hinaus waren die Mitglieder solcher Gruppen wesentlich unzufriedener mit der Zusammenarbeit. Ein positiver Einfluss von Moderation konnte auch f&#252;r den Bereich virtueller Zusammenarbeit gezeigt werden <TextLink reference="3"></TextLink>. Weitgehend unerforscht ist bisher die Vergleichbarkeit der Leistungen von face-to-face und virtuellen Gruppen bei der speziellen Aufgabenstellung des Review von MC-Aufgaben. Hieraus resultiert die Frage nach der &#220;bertragbarkeit der Ergebnisse aus der sozialpsychologischen Forschung in den Bereich der medizinischen Ausbildung. </Pgraph><Pgraph>Zur Beurteilung der Leistung werden sowohl Effektivit&#228;ts-, als auch Effizienzkriterien herangezogen. Weiterhin soll untersucht werden, in wieweit Unterschiede zwischen face-to-face und virtuellen RK-Gruppen bez&#252;glich der subjektiven Beurteilung von Verantwortungs&#252;bernahme, Zusammenarbeit, Wohlgef&#252;hl, Motivation und Konzentration auf die Aufgabe existieren. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Introduction">
      <MainHeadline>Introduction</MainHeadline><Pgraph>The regulations for medical licensure require gradings of all courses of the medical training. In many cases multiple choice questions are used in order to test the student&#8217;s achievements. The quality of the designed questions is of high importance here. To meet this requirement, it is necessary to evaluate the multiple-choice questions and to improve them where applicable before using them in the exams. Usually, the quality control is carried out by review committees (RCs) which are constituted of experts of various faculties and trained to recognize formal errors in questions. This special task is performed in groups to make the experience of many people usable. In order to minimise possible perturbances caused by group dynamic processes, the regular sessions are facilitated. Facilitation has a positive influence on the quality of communication and cooperation <TextLink reference="1"></TextLink>. Scheduling the members of the RCs is a problem which could be solved by introducing electronic reviews. Virtual cooperation of the RC could be put into practice via email, for example. The self-determined choice of when to communicate and how long to work on a task is of an advantage <TextLink reference="2"></TextLink>. Previously done research on comparison of work of face-to-face groups and virtual groups could not show differences in the achievements. However, virtual groups needed significantly more time for processing the same task. Moreover, the members of those groups were significantly more unsatisfied with the teamwork. A positive effect of facilitation could also be demonstrated for the field of virtual cooperation <TextLink reference="3"></TextLink>. The comparability of the achievements of face-to-face groups and virtual groups as to the special task of reviewing multiple-choice exercises is still extensively unexplored. This leads to the question whether the results of the social psychological research activities can be applied to the area of medical education. </Pgraph><Pgraph>For evaluating the achievements, both effectiveness and efficiency criteria are applied. Furthermore, it is to be investigated to what extent face-to-face groups differ from virtual RC groups with respect to subjective rating of taking over responsibility, teamwork, sense of well-being, motivation and concentration on the task. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Methodik">
      <MainHeadline>Methodik</MainHeadline><Pgraph>Die Untersuchung erfolgte in zwei Abschnitten &#8211; der Durchf&#252;hrung von RKs zur Beurteilung und Verbesserung mangelhafter MC-Fragen und einem anschlie&#223;enden Testlauf der ver&#228;nderten Fragen zur Ermittlung der G&#252;te.</Pgraph><SubHeadline>Stichproben</SubHeadline><Pgraph>Teilnehmer f&#252;r die RKs waren 41 Studentinnen und 8 Studenten der Psychologie im Grundstudium der Humboldt-Universit&#228;t zu Berlin mit einem Altersmittel von 23,17 Jahren (SD&#61;4,21). Diese wurden durch Aush&#228;nge und direkte Ansprache in Vorlesungen rekrutiert und erhielten f&#252;r ihre Teilnahme Versuchspersonen-Stunden vom Lehrstuhl f&#252;r Sozialpsychologie gutgeschrieben.  Sie arbeiteten in 16 Kleingruppen von zwei bis vier Personen. Die Anzahl der Gruppen wurde mittels G&#42;Power festgelegt, um einen mittleren Effekt mit Hilfe der gew&#228;hlten Teststatistiken  belegen zu k&#246;nnen. Die H&#228;lfte der Gruppen war in ihrer geschlechtsbezogenen Zusammensetzung homogen. Von der Teilnahme ausgeschlossen wurden Personen, die nicht Psychologiestudenten im Grundstudium waren, die keine Erfahrung im Umgang mit Computern hatten oder denen kein E-Mail-Konto zur Verf&#252;gung stand.</Pgraph><Pgraph>Am zweiten Untersuchungsabschnitt nahmen 80 Studenten anderer Fachrichtungen der Humboldt-Universit&#228;t zu Berlin teil, welche von den Versuchsleitern direkt am Hauptgeb&#228;ude der Universit&#228;t angesprochen wurden.</Pgraph><SubHeadline>Material</SubHeadline><Pgraph>Den RKs wurden 32 MC-Fragen zum Thema Allgemeinwissen mit beabsichtigten M&#228;ngeln <TextLink reference="4"></TextLink> vorgelegt. Die Anzahl der eingef&#252;gten formalen Fehler variierte zwischen Null und Sechs und wurde mittels Expertenurteil best&#228;tigt. Zwei geschulte Personen beurteilten unabh&#228;ngig voneinander die Art und Anzahl der Fehler. Im Anschluss wurde in Absprache ein gemeinsames Expertenurteil gebildet. Zur Erleichterung der Gruppenarbeit kam ein Schema zum Einsatz, welches der Bewertung und Verbesserung von MC-Fragen dient und vom Assessment-Bereich der Charit&#233; &#8211; Universit&#228;tsmedizin Berlin entwickelt wurde. Das verwendete Schema erm&#246;glicht die Abfrage zur Einhaltung der Fragenrichtlinien <TextLink reference="4"></TextLink> (z.B. unplausible Distraktoren oder Homogenit&#228;t der Antwortoptionen). Als Ma&#223; der Gruppenleistung galt im ersten Untersuchungsabschnitt die Differenz zwischen der Fehlerzahl, welche durch die RKs gefunden wurde und der von Experten bestimmten Fehlerzahl. Im zweiten Untersuchungsabschnitt wurde die Leistung &#252;ber die Erh&#246;hung bzw. Verringerung der Trennsch&#228;rfen in den Testdurchl&#228;ufen bestimmt. Die beschriebenen Leistungsma&#223;e dienten der Effektivit&#228;tsbestimmung, w&#228;hrend die erfasste Bearbeitungszeit als Effizienzkriterium herangezogen wurde. Eine m&#246;gliche weitere Effizienzbeurteilung lieferte ein 10 Items umfassender Fragebogen zur Erfassung von Verantwortungs&#252;bernahme, Arbeitsweise (bezieht sich auf gemeinsame vs. alleinige Arbeit), Wohlgef&#252;hl, Motivation und Konzentration auf die Aufgabe. Die verwendeten Items wurden zum Teil gebr&#228;uchlichen Frageb&#246;gen, wie dem &#8222;Fragebogen zur Arbeit im Team&#8220; (FAT; Kauffeld, 2004) entnommen oder als one-item-measurement selbst konstruiert. Bei allen handelt es sich um 6-stufige Likert-Items.</Pgraph><SubHeadline>Durchf&#252;hrung</SubHeadline><Pgraph>Die Umsetzung der Fragestellung erfolgte mittels eines zweifaktoriellen Designs mit vollst&#228;ndiger Messwiederholung mit den Faktoren Art des Review (face-to-face&#47;virtuell) und Moderation (ja&#47;nein). Die Teilnehmer wurden den RKs randomisiert zugeteilt, wobei die Gruppen letztendlich aus zwei bis vier Teilnehmern bestanden. Dies ergab sich aus dem Umstand, dass manche Versuchspersonen nicht erschienen oder am vereinbarten Termin erkrankt waren. Die Zuordnung zu den Versuchsgruppen erfolgte nach dem Zufallsprinzip, je nach Ankommen zu den Schulungsterminen. Die Reihenfolge der zu durchlaufenden Versuchsbedingungen wurde permutiert, um Reihenfolgeeffekte zu verhindern. Vor Versuchsbeginn wurden die Probanden mit den zu verwendenden Materialien vertraut gemacht und bez&#252;glich der Kriterien zur Beurteilung von MC-Aufgaben geschult. Im Anschluss wurden den Teilnehmern die MC-Fragen (pro Bedingung 8) und Instruktionen per E-Mail &#252;bermittelt. Die Zuordnung der Fragen zu den Versuchsbedingungen erfolgte per Zufall. Bevor die Gruppenarbeit begann, stand allen Versuchsteilnehmern eine halbst&#252;ndige Vorbereitungszeit zur Verf&#252;gung. F&#252;r die face-to-face Bedingungen waren jeweils 30 Minuten zur Bearbeitung der MC-Fragen geplant, f&#252;r die virtuellen Bedingungen jeweils eine Woche. Die Moderation wurde von den Versuchsleiterinnen &#252;bernommen. Unter jeder Bedingung mussten die vorgelegten MC-Fragen mit Hilfe des o.g. Schemas bewertet und gegebenenfalls verbessert werden. Nach jeder Versuchsbedingung war der Fragebogen zu den Aspekten Verantwortungs&#252;bernahme, Arbeitsweise, Wohlgef&#252;hl, Motivation und Konzentration auf die Aufgabe von den Teilnehmern zu beantworten.</Pgraph><Pgraph>Aus der Menge der ver&#228;nderten MC-Fragen wurde pro Versuchsbedingung f&#252;r jede der 32 Fragen eine Version zuf&#228;llig gezogen und zu vier Wissenstests zusammengestellt. Jeder Test enthielt jeweils acht Fragen aus jeder Versuchsbedingung. Ein f&#252;nfter Test enthielt die 32 Original-Fragen als Vergleichsma&#223; f&#252;r die vorgenommenen Verbesserungen. Die so entstandenen f&#252;nf Tests wurden weiteren Studenten abschlie&#223;end vorgelegt. Die Bearbeitung erfolgte in Anwesenheit der Versuchsleiterinnen.</Pgraph><SubHeadline>Statistische Analysen</SubHeadline><Pgraph>Zur Beurteilung der Gruppenarbeit wurde f&#252;r die Differenzwerte zwischen Gruppen- und Expertenurteil eine Varianzanalyse (ANOVA) f&#252;r Messwiederholung berechnet. Zus&#228;tzlich zu Testgr&#246;&#223;e und p-Wert wird jeweils die Effektst&#228;rke mit &#951;<Superscript>2</Superscript> angegeben. Nach Cohen <TextLink reference="5"></TextLink> handelt es sich ab einem &#951;<Superscript>2</Superscript> von 0,0099 um einen kleinen Effekt, bei einen &#951;<Superscript>2</Superscript> von 0,0588 um einen mittleren und bei &#951;<Superscript>2</Superscript>&#61;0,1379 um einen gro&#223;en Effekt. Die Bearbeitungszeiten der virtuellen Versuchsbedingungen wurden aufgrund der nicht vorliegenden Normalverteilung der Variable ohne Moderation mit Hilfe des Vorzeichenrangtests von Wilcoxon beurteilt. F&#252;r die erhobenen Daten zu den Aspekten Verantwortungs&#252;bernahme, Arbeitsweise, Motivation, Wohlgef&#252;hl und Konzentration auf die Aufgabe wurde eine Rangvarianzanalyse f&#252;r abh&#228;ngige Stichproben nach Friedman mit den jeweiligen Gruppenmittelwerten durchgef&#252;hrt. Die im zweiten Teil der Untersuchung erhobenen Trennsch&#228;rfekoeffizienten der Original-Fragen (punkt-biserialer  Korrelationskoeffizient mit Part-Whole-Korrektur) bzw. ver&#228;nderten Fragen aus den ver&#228;nderten Bedingungen wurden mittels Wilcoxon-Rangsummen-Test verglichen. Unterschiede galten als statistisch signifikant, wenn p&#8804;0,05. Alle Daten wurden mit Hilfe des Statistikprogramms SPSS 15.0 analysiert.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Methods">
      <MainHeadline>Methods</MainHeadline><Pgraph>The study was conducted in two stages comprising RCs for evaluating and improving insufficient MCQs and testing the modified questions in order to determine their quality.</Pgraph><SubHeadline>Sample survey</SubHeadline><Pgraph>41 female students and 8 male students of psychology of the 1<Superscript>st</Superscript> and 2<Superscript>nd</Superscript> year from the Humboldt University in Berlin participated in the RCs, having an average age of 23.17 years (SD&#61;4.21). They were recruited via notices and by individual approach in lectures and credited with test person hours by the Chair in Social Psychology. They worked in 16 small groups of two to four persons. The number of the groups was determined by means of G&#42;Power to evidence an average effect with the help of the chosen testing statistics. 50&#37; of the groups were homogeneously composed with regard to their sex. Excluded from the study were persons who were not students of psychology of the 1<Superscript>st</Superscript> and 2<Superscript>nd</Superscript> year, who were unskilled in using computers or who had no email account at their disposal.</Pgraph><Pgraph>In the second part of the investigation 80 students of other faculties from the Humboldt University in Berlin who were directly approached by the investigators on the university campus participated in the study.</Pgraph><SubHeadline>Material</SubHeadline><Pgraph>32 MCQs regarding general knowledge containing intended defects &#91;4&#93; were presented to the RCs. The number of inserted formal defects varied from zero to six and was confirmed by an expert&#8217;s opinion. Two trained persons rated independently from one another the quality and number of the errors. Subsequently, a joint expert opinion was formed by discussion. In order to make the teamwork easier a scheme was used which serves to evaluate and improve multiple-choice questions and which was developed by the assessment center of the Charit&#233; - Universit&#228;tsmedizin Berlin. The applied scheme allows interrogating compliance with questionnaire guidelines <TextLink reference="4"></TextLink> (e.g. implausible distractors or homogeneity of the answer options). During stage one of the study, the group&#8217;s achievement was measured via the difference between the number of errors which were detected by the RCs and the number of errors determined by the experts. In the second part of the investigation the achievement was determined by increasing and decreasing coefficients of item discrimination in the testing sessions. The described achievement measures were used to determine effectiveness while the recorded processing time served as efficiency criteria. Efficiency rating was further possible by a questionnaire comprising 10 items for recording the aspects taking over responsibility, approach to work (referring to teamwork vs. working on his&#47;her own), sense of well-being, motivation and concentration on the task. The used items were partially taken from usual questionnaires like the German &#8220;Fragebogen zur Arbeit im Team&#8221; (FAT, Kauffeld, 2004) (Questionnaire on working in a team), or designed as one-item-measurements. All items are six-point Likert items.</Pgraph><SubHeadline>Procedure</SubHeadline><Pgraph>The research question was investigated by means of a two-way factorial design with repeated measures of the variables form of review committee (face-to-face&#47;virtual) and facilitation (yes&#47;no). The participants were randomly assigned to the RCs and the groups finally consisted of two to four participants. This was due to the fact that some testing persons failed to appear or had fallen ill on the fixed date. The assignment to the groups was random, depending on the arrival of the participants at the training. The sequence of the testing conditions to be passed was permuted to prevent sequence effects. Prior to the testing, the test persons were familiarized with the material to use and they were trained with regard to the criteria for judging multiple-choice tasks. Then, the MCQs (8 per condition) and instructions were submitted to the participants via email. The assignment of the questions to the testing conditions was carried out at random. Before the teamwork started, the participants had half an hour for preparation. For the face-to-face conditions half an hour was scheduled for answering the MCQs, for the virtual conditions, one week was scheduled. Facilitation was provided by the investigators. In each condition the multiple-choice questions were to be evaluated and, where applicable, improved by means of the above-mentioned scheme. After each test condition the questionnaire was to be answered by the participants as to the aspects taking over responsibility, approach to work, sense of well-being, motivation and concentration on the task.</Pgraph><Pgraph>From the set of modified multiple-choice questions one version was randomly selected of each of the 32 questions and put together in four knowledge tests. Each test contained eight questions from each test condition. A fifth test contained the 32 original questions as comparative measure of the improvements. Finally, the five tests generated this way were presented to other students. They were processed in presence of the investigators.</Pgraph><SubHeadline>Statistical analyses</SubHeadline><Pgraph>The teamwork was evaluated by means of an analysis of variance (ANOVA) for repeated measurements which was calculated for the difference values between the group&#8217;s and expert&#8217;s opinion. Additionally to the test statistic and the p-value the effect size is indicated as &#951;<Superscript>2</Superscript>. According to Cohen <TextLink reference="5"></TextLink>, an effect size from &#951;<Superscript>2</Superscript>&#61;0.0099 is a small effect, from &#951;<Superscript>2</Superscript>&#61;0.0588 is a medium effect and from &#951;<Superscript>2</Superscript>&#61;0.1379 is a large effect. The processing times of the virtual test conditions were evaluated by means of the Wilcoxon signed-rank test due to the non-existing normal distribution of the variable without facilitation. With the data collected for the aspects taking over responsibility, approach to work, motivation, sense of well-being, and concentration on the task, an analysis of variance by ranks for dependent samples according to Friedman was computed with the respective group means. The coefficients of item discrimination of the original questions collected in the second part of the investigation (point-bi-serial correlation coefficient with part-whole-correction) and of the modified questions collected in the modified test conditions were compared by means of the Wilcoxon rank-sum test. Differences were considered to be statistically significant with p&#8804;0.05. All data were analyzed with the SPSS statistics software 15.0.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Ergebnisse">
      <MainHeadline>Ergebnisse</MainHeadline><SubHeadline>Effektivit&#228;t von face-to-face und virtuellen Gruppen</SubHeadline><Pgraph><Mark1>1. Expertenurteil</Mark1></Pgraph><Pgraph>Die Voraussetzungen f&#252;r die Berechnung der ANOVA wurden gepr&#252;ft und sind gegeben. In der Bedingung virtuelles Review ohne Moderation betr&#228;gt die mittlere Differenz zum Expertenurteil M&#61;7,69 (SD&#61;3,11) Fehler, in der Bedingung virtuelles Review mit Moderation M&#61;7,50 (SD&#61;2,73) Fehler. Beim Review face-to-face ohne Moderation werden im Mittel M&#61;8,12 (SD&#61;2,75) bzw. mit Moderation M&#61;6,75 (SD&#61;2,77) Fehler der Experten nicht gefunden (siehe Abbildung 1 <ImgLink imgNo="1" imgType="figure"/>). Weder die RK-Form (F(1)&#61; 0,04, p&#61;0,84, &#951;<Superscript>2</Superscript>&#61;0,00) noch der Einsatz von Moderation (F(1)&#61;1,54, p&#61;0,23, &#951;<Superscript>2</Superscript>&#61;0,09) oder die Wechselwirkung der beiden Variablen (F(1)&#61;0,73, p&#61;0,41, &#951;<Superscript>2</Superscript>&#61;0,05) haben einen signifikanten Einfluss auf die Gr&#246;&#223;e der Differenz zum Expertenurteil. Hierbei ist der Anteil der aufgekl&#228;rten Varianz f&#252;r die Variable Moderation mit 9&#37; am h&#246;chsten. </Pgraph><Pgraph>Die Untersuchung der Wirkung der &#252;ber alle Versuchsbedingungen konstanten Einflussfaktoren Gruppengr&#246;&#223;e (F(2)&#61;0,18, p&#61;0,84, &#951;<Superscript>2</Superscript>&#61;0,03) und Geschlechtszusammensetzung (F(1)&#61;2,06, p&#61;0,17, &#951;<Superscript>2</Superscript>&#61;0,13) zeigt ebenfalls keine signifikanten Ergebnisse. In der Versuchsbedingung face-to-face erreichen gleichgeschlechtliche Gruppierungen eine mittlere Differenz zum Expertenurteil von M&#61;8,38 (SD&#61;2,05) und gemischtgeschlechtliche Gruppierungen M&#61;6,50 (SD&#61;1,04). Beim virtuellen RK werden in gleichgeschlechtlichen Gruppierungen M&#61;7,69 (SD&#61;3,10) und in gemischtgeschlechtlichen Gruppierungen M&#61;7,59 (SD&#61;2,40) Fehler aus dem Expertenurteil gefunden (siehe Abbildung 2 <ImgLink imgNo="2" imgType="figure"/>).  </Pgraph><Pgraph><Mark1>2. Reliabilit&#228;t </Mark1></Pgraph><Pgraph>Die Reliabilit&#228;ten der einzelnen Tests, welche durch die RKs ver&#228;ndert wurden, verbessern sich im Vergleich zu dem Originaltest (siehe Tabelle 1 <ImgLink imgNo="1" imgType="table"/>). Zwei von vier Tests weisen eine deutlich h&#246;here Reliabilit&#228;t auf. </Pgraph><Pgraph><Mark1>3. Trennsch&#228;rfe</Mark1></Pgraph><Pgraph>Der Wilcoxon-Test zeigt, dass sich die Anzahl von MC-Fragen, deren Trennsch&#228;rfekoeffizienten nach Bearbeitung durch die RKs h&#246;her ausfallen als im Original, von der Anzahl der MC-Fragen, deren Trennsch&#228;rfekoeffizienten niedriger geworden sind, nur geringf&#252;gig unterscheidet. Ver&#228;nderungen in eine der beiden Richtungen sind bei jeweils etwa der H&#228;lfte der Fragenstichprobe pro Versuchsbedingung zu erkennen. F&#252;r die Gesamtheit der Fragen pro Versuchsbedingung kann keine Ver&#228;nderung der Trennsch&#228;rfe statistisch nachgewiesen werden (siehe Tabelle 2 <ImgLink imgNo="2" imgType="table"/>).</Pgraph><SubHeadline>Effizienz von face-to-face und virtuellen Gruppen</SubHeadline><Pgraph><Mark1>1. Bearbeitungszeit</Mark1></Pgraph><Pgraph>Die Bearbeitungszeit betr&#228;gt in den beiden face-to-face Bedingungen jeweils konstant 30 Minuten. F&#252;r die Gruppenarbeit in der virtuellen Bedingung mit Moderation werden zwischen 5 und 28 Tagen (M&#61;14,31; SD&#61;7,54) ben&#246;tigt. W&#228;hrenddessen bearbeiten die Gruppen in der virtuellen Bedingung ohne Moderation ihre Aufgabe in einem Zeitraum zwischen 6 und 55 Tagen (M&#61;12,06; SD&#61;11,69). Hinsichtlich des Effizienzkriteriums Bearbeitungszeit unterscheiden sich die verschiedenen virtuellen Bedingungen mit Z&#61;-1,3 und p&#61;0,20 nicht. </Pgraph><Pgraph><Mark1>2. Weitere Effizienzkriterien</Mark1></Pgraph><Pgraph>Die durch den Friedman-Test ausgewiesene Rangfolge der Versuchsbedingungen ist f&#252;r die untersuchten Aspekte  Verantwortungs&#252;bernahme, Arbeitsweise, Wohlgef&#252;hl, Motivation und Konzentration auf die Aufgabe gleich (siehe Tabelle 3 <ImgLink imgNo="3" imgType="table"/>). Die Bedingung face-to-face ohne Moderation erlangt jeweils die h&#246;chsten Werte. Es folgen die Bedingungen face-to-face mit Moderation und virtuell ohne Moderation. Die moderierte virtuelle Bedingung erzielt jeweils den niedrigsten Rangplatz. Die Unterschiede zwischen den Untersuchungsbedingungen sind f&#252;r alle Aspekte bis auf Motivation statistisch bedeutsam. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Results">
      <MainHeadline>Results</MainHeadline><SubHeadline>Effectiveness of face-to-face and virtual groups</SubHeadline><Pgraph><Mark1>1. Expert&#8217;s opinion</Mark1></Pgraph><Pgraph>The prerequisites for computing the ANOVA were verified and are given. In the test condition virtual review without facilitation the mean difference to the expert&#8217;s opinion is M&#61;7.69 (SD&#61;3.11) errors, in the test condition virtual review with facilitation M&#61;7.50 (SD&#61;2.73) errors. In the condition review face-to-face without facilitation experts&#8217; errors are not detected on an average M&#61;8.12 (SD&#61;2.75), and with facilitation M&#61;6.75 (SD&#61;2.77) (see figure 1 <ImgLink imgNo="1" imgType="figure"/>). Neither the RC form (F(1)&#61;0.04, p&#61;0.84, &#951;<Superscript>2</Superscript>&#61;0,00) nor applying facilitation (F(1&#61;1.54, p&#61;0.23, &#951;<Superscript>2</Superscript>&#61;0.09) or interaction of both variables (F(1)&#61;0.73, p&#61;0.41, &#951;<Superscript>2</Superscript>&#61;0.05) have significant influence on the size of the difference to the expert&#8217;s opinion. In this case, the shared explained variation for the variable facilitation is highest with 9&#37;. </Pgraph><Pgraph>The investigation of the effect of the influencing factors group size (F(2)&#61;0.18, p&#61;0.84, &#951;<Superscript>2</Superscript>&#61;0.03) and sex composition (F(1)&#61;2.06, p&#61;0.17, &#951;<Superscript>2</Superscript>&#61;0.13) which were constant over all test conditions does not show any significant results either. In the test condition face-to-face the mean difference to the expert&#8217;s opinion of same-sex groups is M&#61;8.38 (SD&#61;2.05) and of mixed-sex groups is M&#61;6.50 (SD&#61;1.04). In the virtual RC errors of the expert&#8217;s opinion are detected in same-sex groups with M&#61;7.69 (SD&#61;3.10)  and in mixed-sex groups with M&#61;7.59 (SD&#61;2.40) (see figure 2 <ImgLink imgNo="2" imgType="figure"/>). </Pgraph><Pgraph><Mark1>2. Reliability</Mark1> </Pgraph><Pgraph>The reliabilities of the respective tests which were modified by the RCs improve in comparison to the original test (see table 1 <ImgLink imgNo="1" imgType="table"/>). Two of four tests show relevant higher reliability. </Pgraph><Pgraph><Mark1>3. Item discrimination</Mark1></Pgraph><Pgraph>The Wilcoxon test shows that the number of multiple-choice questions whose coefficient of discrimination is higher than originally after modification by the RCs differs only slightly from the number of multiple-choice questions whose coefficient of discrimination decreased. Changes into one of the two directions can be recognized in approximately 50&#37; of the question sample per test condition. For the overall of the questions per test condition a change in the power of the test cannot be proved statistically (see table 2 <ImgLink imgNo="2" imgType="table"/>).</Pgraph><SubHeadline>Efficiency of face-to-face and virtual groups</SubHeadline><Pgraph><Mark1>1. Processing time</Mark1></Pgraph><Pgraph>In both face-to-face conditions the processing time is constantly 30 minutes. The teamwork in the virtual test condition with facilitation requires between 5 and 28 days (M&#61;14.31; SD&#61;7.54). Meanwhile, the groups in the virtual test condition without facilitation process the task within 6 and 55 days (M&#61;12.06; SD&#61;11.69). As to the efficiency criteria processing time, the various virtual conditions do not differ with Z&#61;-1.3 and p&#61;0.20. </Pgraph><Pgraph><Mark1>2. Further efficiency criteria</Mark1></Pgraph><Pgraph>The ranking of the test conditions shown by the Friedman test is identical for the investigated aspects taking over responsibility, approach to work, sense of well-being, motivation and concentration on the task (see table 3 <ImgLink imgNo="3" imgType="table"/>). The condition face-to-face without facilitation reaches the highest scores in each case. This is followed by the conditions face-to-face with facilitation and virtual without facilitation. The virtual facilitated condition reaches the lowest score in each case. The differences between the test conditions are statistically relevant for all aspects except motivation. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Diskussion">
      <MainHeadline>Diskussion</MainHeadline><SubHeadline>Effektivit&#228;t von face-to-face und virtuellen Gruppen</SubHeadline><Pgraph>Zwischen den beiden Gruppen face-to-face und virtuell konnte bzgl. der Entdeckung von Fehlern in MC-Fragen kein Effekt gezeigt werden (0&#37; Varianzaufkl&#228;rung). Auch hinsichtlich der Erh&#246;hung von Trennsch&#228;rfekoeffizienten nach dem Review zeigte sich kein Unterschied zwischen den Gruppen. Dieses Ergebnis ist konsistent mit anderen Studien zum Leistungsvergleich <TextLink reference="3"></TextLink>, <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>. </Pgraph><Pgraph>Die Metaanalyse von Baltes <TextLink reference="6"></TextLink> konnte keinen Effekt der Gruppengr&#246;&#223;e identifizieren. Dieser Befund wird durch die Ergebnisse der vorliegenden Studie nur zum Teil gest&#252;tzt, da wir einen kleinen Effekt zeigen konnten (3&#37; Varianzaufkl&#228;rung). Der Einflussfaktor Geschlechtszusammensetzung lieferte im Rahmen  der ANOVA einen mittleren Effekt (13&#37; Varianzaufkl&#228;rung). Interessant ist der Fakt, dass die Bearbeitung der Fragen durch ein Review-Komitee, egal welcher Art, die Reliabilit&#228;t der Tests teilweise deutlich erh&#246;hen konnte. </Pgraph><SubHeadline>Effizienz von face-to-face und virtuellen Gruppen</SubHeadline><Pgraph>Die vorgegebene Bearbeitungszeit wurde von den face-to-face Gruppen immer eingehalten und die Koordination der Termine erwies sich als unproblematisch. Die Zeitdauer der virtuellen Bedingungen stellte jedoch ein gro&#223;es Problem in der Zusammenarbeit dar. Zum einen konnte nahezu nie die vorab geplante und mit den Probanden besprochene Dauer von 2 Wochen eingehalten werden und zum anderen entstand dadurch ein erh&#246;hter Koordinationsbedarf durch die Versuchsleiterin. </Pgraph><Pgraph>Die Teilnehmer dieser Untersuchung f&#252;hlten sich bei der Zusammenarbeit face-to-face&#47; unmoderiert wohler als unter allen anderen Arbeitsbedingungen. Sie sch&#228;tzten sich hier auch als konzentrierter, und verantwortungsvoller ein, und arbeiteten konsequenter als Gruppe zusammen. Computer-mediierte Kommunikation ist immer etwas schwerf&#228;lliger <TextLink reference="8"></TextLink>, womit auch der Befund der geringeren Zufriedenheit unter virtuellen Bedingungen erkl&#228;rt werden kann.</Pgraph><SubHeadline>Einfluss der Moderation auf die Gruppenleistung</SubHeadline><Pgraph>Die Moderation von Gruppen hat einen mittleren Effekt auf die Leistung der Review-Komitees.  Dieses Ergebnis ist konform mit anderen empirischen Untersuchungen zur Leistungssteigerung in Gruppen durch Moderation <TextLink reference="3"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="10"></TextLink>. </Pgraph><SubHeadline>Kritische Aspekte</SubHeadline><Pgraph>Der zweistufige Schulungsprozess &#8211; 3 Stunden f&#252;r die Versuchsleiter und im Anschluss daran 30 Minuten f&#252;r die Probanden &#8211; k&#246;nnte zu Informationsverlusten und Verst&#228;ndnisproblemen gef&#252;hrt haben. Zudem verf&#252;gen Mitglieder realer RKs &#252;ber mehr &#220;bung und die regelm&#228;&#223;igen Treffen f&#252;hren zu einer anderen Gruppendynamik. Das verwendete Schema zur Beurteilung der MC-Fragen bildet im Vergleich mit den Richtlinien von Haladyna <TextLink reference="4"></TextLink> nicht vollst&#228;ndig alle Fehlerm&#246;glichkeiten ab. Ein weiteres methodisches Problem ist die Anwendung von Messwiederholungen, welche m&#246;glicherweise zu Motivationsverlusten f&#252;hren k&#246;nnen. F&#252;r die virtuelle Gruppenarbeit konnte nicht kontrolliert werden, wie regelm&#228;&#223;ig die Probanden ihr E-Mail-Konto frequentierten und wie zeitnah sie die empfangenen E-Mails beantworteten. Des weiteren kam es zu unkalkulierbaren technischen Problemen beim Versand der E-Mails, so wurden E-Mail-Adressen von den Probanden falsch angegeben , die empfangenen E-Mails verschwanden im Spam-Ordner oder konnten auf Rechnern mit einem Linux-Betriebssystem nicht ge&#246;ffnet werden.</Pgraph><Pgraph>Die vollst&#228;ndige Moderationsmethode, deren &#252;berlegen effektivit&#228;tssteigernde Wirkung verglichen mit Teilaspekten der Methode von Schimansky <TextLink reference="10"></TextLink> gezeigt werden konnte, wurde in der vorliegenden Studie nicht zum Einsatz gebracht. Eine weitere Limitierung ist der Umstand, dass f&#252;r diese Studie keine ausgebildeten Moderatorinnen zur Verf&#252;gung standen. Aus der Literatur geht hervor, dass professionelle Moderatoren st&#228;rker methodisch und aufgabenorientiert vorgehen als solche, die diese Rolle nur &#34;nebenbei&#34; ausf&#252;llen <TextLink reference="11"></TextLink>.</Pgraph><Pgraph>Da die Motivation grunds&#228;tzlich etwas niedriger bewertet wurde als alle anderen Aspekte, ist der geringere Befund unter Umst&#228;nden gar nicht auf die durchlaufenen Versuchsbedingungen, sondern auf eine geringe initiale Motivation der Studenten zur&#252;ckzuf&#252;hren <TextLink reference="12"></TextLink>. Ein weiteres Problem der Untersuchung ist die mangelnde &#220;berpr&#252;fung der G&#252;te des verwendeten Fragebogens. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Discussion">
      <MainHeadline>Discussion</MainHeadline><SubHeadline>Effectiveness of face-to-face and virtual groups</SubHeadline><Pgraph>As to detecting errors in MCQs no effect between the face-to-face and the virtual groups could be proved (0&#37; explained variation) Also, as far as the increase of discriminatory power coefficients after the review is concerned, no difference between the groups was found. This result is consistent with other achievement comparison studies <TextLink reference="3"></TextLink>, <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink>. </Pgraph><Pgraph>The Baltes meta-analysis <TextLink reference="6"></TextLink> could not identify any effect of the group size. This result is only partly supported by the findings of the present study since we were able to prove a small effect (3&#37; explained variation). The influencing factor sex composition showed a medium effect within the framework of the ANOVA (13&#37; explained variation). Interesting is the fact that the processing of the questions by a review committee, no matter of which kind, could increase the reliability of the tests in parts relevantly. </Pgraph><SubHeadline>Efficiency of face-to-face and virtual groups</SubHeadline><Pgraph>The allowed processing time limit was always met by the face-to-face groups and coordinating the fixed dates was uncomplicated. Yet, the period of time in the virtual conditions turned out ot be a big problem for the teamwork. On the one hand, the time limit of two weeks fixed with the probands was nearly never met, on the other hand, this produced an increased demand for coordination by the investigator. </Pgraph><Pgraph>The participants of this investigation felt more comfortable with face-to-face&#47;unfacilitated cooperation than in the other working conditions. In addition, they rated themselves as more concentrated and responsible and worked more consistently as a group together. Computer-mediated communication is always a bit cumbersome <TextLink reference="8"></TextLink>, which explains the finding of the lower satisfaction in virtual conditions.</Pgraph><SubHeadline>Impact of facilitation on the group&#8217;s achievement</SubHeadline><Pgraph>Facilitating groups has a medium effect on the achievements of the review committees.  This result is conform with other empirical investigations on increasing achievement in groups via facilitation <TextLink reference="3"></TextLink>, <TextLink reference="9"></TextLink>, <TextLink reference="10"></TextLink>. </Pgraph><SubHeadline>Critical aspects</SubHeadline><Pgraph>The two-stage training process (3 hours for the investigators followed by 30 minutes for the test persons) might have led to loss of information and problems in understanding. In addition, members of real RCs have more practice and the regular meetings lead to a different kind of group dynamic. The scheme used for judging the multiple-choice questions does not reproduce completely all possibilities of defects in comparison to the guidelines of Haladyna <TextLink reference="4"></TextLink>. Another methodical problem is the use of repeated measurements which might lead to loss in motivation. With regard to the virtual teamwork it could not be controlled how often the test persons checked their email accounts and how fast they answered the received emails. Furthermore, unforeseeable technical problems occurred when sending the emails: Email addresses had been misstated by the test persons, the received emails disappeared in spam folders or could not be opened on computers with a Linux operating system.</Pgraph><Pgraph>The complete facilitation method which has, as could be demonstrated by Schimansky <TextLink reference="10"></TextLink>, a superior impact on increasing effectiveness in comparison to partial aspects of the method, was not used in the present study. Another limitating factor is that no trained facilitators were available for this investigation. As can be seen from the literature, professional facilitators proceed more methodically and oriented on tasks than those who perform this role solely casually <TextLink reference="11"></TextLink>.</Pgraph><Pgraph>Since motivation was basically rated lower than all other aspects, the lower score might not trace back to the passed test conditions but to a low initial motivation of the students <TextLink reference="12"></TextLink>. Another problem of the investigation is insufficient examination of the quality of the used questionnaire. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Schlussfolgerung">
      <MainHeadline>Schlussfolgerung</MainHeadline><Pgraph>Die elektronische Durchf&#252;hrung des Reviews per E-Mail scheint generell m&#246;glich, aber aus Gr&#252;nden der Effizienz wenig empfehlenswert. Virtuelle Zusammenarbeit ist wesentlich zeitaufwendiger, oftmals mit technischen Problemen verbunden und erfordert einen erh&#246;hten Koordinationsaufwand durch den Moderator. Eine denkbare Alternative k&#246;nnte die virtuelle Umsetzung nach Nominalgruppentechnik sein. Es ist weitere Forschung an realen RKs notwendig, um beispielsweise differenziertere Leistungsvergleiche zu erm&#246;glichen oder die Rolle des RK-Leiters (Moderator) zu konkretisieren. Vorstellbar k&#246;nnte auch eine Realisierung virtueller Zusammenarbeit beispielsweise in Internet-Foren sein. Es bleibt zu &#252;berpr&#252;fen, ob damit eine Eliminierung der oben genannten Probleme gelingen kann. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Conclusion">
      <MainHeadline>Conclusion</MainHeadline><Pgraph>The application of electronic review via email seems to be possible but is hardly recommended due to efficiency reasons. Virtual teamwork is considerably more time consuming, often associated with technical problems and requires a higher demand for coordination by the facilitator. A possible alternative could be a virtual application according to nominal group technique. Further investigation on real RCs is necessary to permit for example more differentiated achievement comparisons or to substantiate the role of the RC leader (facilitator). For example, the realization of virtual teamwork in internet forums could be imagined. It remains to be verified whether eliminating the above problems is possible in this way. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Interessenkonflikt">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autoren erkl&#228;ren, dass sie keine Interessenkonflikte in Zusammenhang mit diesem Artikel haben. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Competing interests">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Scholl W</RefAuthor>
        <RefTitle>Grundprobleme der Teamarbeit und ihre Bew&#228;ltigung - Ein Kausalmodell</RefTitle>
        <RefYear>2005</RefYear>
        <RefBookTitle>Management von Teams. Theoretische Konzepte und empirische Befunde</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Scholl W. Grundprobleme der Teamarbeit und ihre Bew&#228;ltigung - Ein Kausalmodell. In: Gem&#252;nden HG, H&#246;gl M (Hrsg). Management von Teams. Theoretische Konzepte und empirische Befunde. 3. Auflage. Wiesbaden: Gabler; 2005.</RefTotal>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>D&#246;ring N</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1999</RefYear>
        <RefBookTitle>Sozialpsychologie des Internets. Die Bedeutung des Internets f&#252;r Kommunikationsprozesse, Identit&#228;ten, soziale Beziehungen und Gruppen. Internet und Psychologie. Neue Medien in der Psychologie</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>D&#246;ring N. Sozialpsychologie des Internets. Die Bedeutung des Internets f&#252;r Kommunikationsprozesse, Identit&#228;ten, soziale Beziehungen und Gruppen. Internet und Psychologie. Neue Medien in der Psychologie, Band II. G&#246;ttingen: Hogrefe; 1999.</RefTotal>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Unger D</RefAuthor>
        <RefAuthor>Witte EH</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2007</RefYear>
        <RefBookTitle>Virtuelle Teams &#8211; Geringe Kosten, geringer Nutzen&#63; Zur Leistungsverbesserung von Kleingruppen beim Probleml&#246;sen durch elektronische Moderation. Hamburger Forschungsbericht zur Sozialpsychologie (HAFOS)</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Unger D, Witte EH. Virtuelle Teams &#8211; Geringe Kosten, geringer Nutzen&#63; Zur Leistungsverbesserung von Kleingruppen beim Probleml&#246;sen durch elektronische Moderation. Hamburger Forschungsbericht zur Sozialpsychologie (HAFOS), 73. Hamburg: Universit&#228;t Hamburg, Arbeitsbereich Sozialpsychologie; 2007.</RefTotal>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Haladyna TM</RefAuthor>
        <RefAuthor>Downing SM</RefAuthor>
        <RefAuthor>Rodriguez MC</RefAuthor>
        <RefTitle>A review of multiple-choice item-writing guidelines for classroom assessment</RefTitle>
        <RefYear>2002</RefYear>
        <RefJournal>Appl Meas Educ</RefJournal>
        <RefPage>309-334</RefPage>
        <RefTotal>Haladyna TM, Downing SM, Rodriguez MC. A review of multiple-choice item-writing guidelines for classroom assessment. Appl Meas Educ. 2002;15(3):309-334. DOI: 10.1207&#47;S15324818AME1503&#95;5</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1207&#47;S15324818AME1503&#95;5</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Cohen J</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1988</RefYear>
        <RefBookTitle>Statistical power analysis for the behavioral science</RefBookTitle>
        <RefPage>285</RefPage>
        <RefTotal>Cohen J. Statistical power analysis for the behavioral science. 2Nd, edition.Hillsdale, NJ: Lawrence Erlbaum; 1988. S.285.</RefTotal>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Baltes BB</RefAuthor>
        <RefAuthor>Dickson MW</RefAuthor>
        <RefAuthor>Sherman MP</RefAuthor>
        <RefAuthor>Bauer CC</RefAuthor>
        <RefAuthor>LaGanke</RefAuthor>
        <RefAuthor>JS</RefAuthor>
        <RefTitle>Computer-mediated communication and group decision making: A meta-analysis</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Organ Behav Hum Decis Process</RefJournal>
        <RefPage>156-179</RefPage>
        <RefTotal>Baltes BB, Dickson MW, Sherman MP, Bauer CC, LaGanke, JS. Computer-mediated communication and group decision making: A meta-analysis. Organ Behav Hum Decis Process. 2007;87:156-179. DOI: 10.1006&#47;obhd.2001.2961</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1006&#47;obhd.2001.2961</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Li SS</RefAuthor>
        <RefTitle>Computer-mediated communication and group decision making</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Small Group Res</RefJournal>
        <RefPage>593-614</RefPage>
        <RefTotal>Li SS. Computer-mediated communication and group decision making. Small Group Res. 2007;38(5):593-614. DOI: 10.1177&#47;1046496407304335</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1177&#47;1046496407304335</RefLink>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Becker-Beck U</RefAuthor>
        <RefAuthor>Wintermantel M</RefAuthor>
        <RefAuthor>Borg A</RefAuthor>
        <RefTitle>Principles of regulating interaction in teams practicing face-to-face communication versus teams practising computer-mediated communication</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Small Group Res</RefJournal>
        <RefPage>499-536</RefPage>
        <RefTotal>Becker-Beck U, Wintermantel M, Borg A. Principles of regulating interaction in teams practicing face-to-face communication versus teams practising computer-mediated communication. Small Group Res. 2005;36(4):499-536. DOI: 10.1177&#47;1046496405277182</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1177&#47;1046496405277182</RefLink>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Kramer TJ</RefAuthor>
        <RefAuthor>Fleming GP</RefAuthor>
        <RefAuthor>Mannis SM</RefAuthor>
        <RefTitle>Improving face-to-face brainstorming through modeling and facilitation</RefTitle>
        <RefYear>2001</RefYear>
        <RefJournal>Small Group Res</RefJournal>
        <RefPage>533-557</RefPage>
        <RefTotal>Kramer TJ, Fleming GP, Mannis SM. Improving face-to-face brainstorming through modeling and facilitation. Small Group Res. 2001;32(5):533-557. DOI: 10.1177&#47;104649640103200502</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1177&#47;104649640103200502</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Schimansky A</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2007</RefYear>
        <RefBookTitle>Die Moderationsmethode als Strukturierungsansatz effektiver Gruppenarbeit</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Schimansky A. Die Moderationsmethode als Strukturierungsansatz effektiver Gruppenarbeit. Berlin: Papst; 2007.</RefTotal>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Immig S</RefAuthor>
        <RefAuthor>Bachmann T</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2001</RefYear>
        <RefBookTitle>Was professionelle Moderation leistet</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Immig S, Bachmann T. Was professionelle Moderation leistet. Berlin: artop &#8211; Institut an der Humboldt-Universit&#228;t zu Berlin; 2001. Zug&#228;nglich unter&#47;available under: http:&#47;&#47;www.artop.de&#47;5000&#95;Archiv&#47;5000&#95;PDF&#95;und&#95;Material&#47;Moderation.pdf.</RefTotal>
        <RefLink>http:&#47;&#47;www.artop.de&#47;5000&#95;Archiv&#47;5000&#95;PDF&#95;und&#95;Material&#47;Moderation.pdf</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Geister S</RefAuthor>
        <RefAuthor>Konrad U</RefAuthor>
        <RefAuthor>Hertel G</RefAuthor>
        <RefTitle>Effects of process feedback on motivation, satisfaction and performance in virtual Teams</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>Small Group Res</RefJournal>
        <RefPage>459-489</RefPage>
        <RefTotal>Geister S, Konrad U, Hertel G. Effects of process feedback on motivation, satisfaction and performance in virtual Teams. Small Group Res. 2006;37(5):459-489. DOI: 10.1177&#47;1046496406292337</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1177&#47;1046496406292337</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="de">1de</MediaID>
          <MediaID language="en">1en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 1: Reliabilit&#228;ten des Originaltests und der ver&#228;nderten Tests</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 1: Reliabilities of the original test and the modified tests</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="de">2de</MediaID>
          <MediaID language="en">2en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 2: Erh&#246;hung bzw. Verringerung der Trennsch&#228;rfekoeffizienten im Vergleich Original-Test und durch RK ver&#228;nderte Tests</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 2: Increase and decrease of the item discrimination coefficients comparing the original test and tests modified by RC.</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>3</MediaNo>
          <MediaID language="de">3de</MediaID>
          <MediaID language="en">3en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 3: Friedman-Test zum Vergleich von Verantwortungs&#252;bernahme, Arbeitsweise, Wohlgef&#252;hl, Motivation und Konzentration auf die Aufgabe zwischen den Versuchsbedingungen</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 3: Friedman test for comparison of taking over responsibility, approach to work, sense of well-being, motivation and concentration on the task between the test conditions</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>3</NoOfTables>
      </Tables>
      <Figures>
        <Figure format="png" height="490" width="516">
          <MediaNo>1</MediaNo>
          <MediaID language="de">1de</MediaID>
          <MediaID language="en">1en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Abbildung 1: Effektivit&#228;t der RK-Form in Abh&#228;ngigkeit von Moderation </Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Figure 1: Effectiveness of the RC form depending on facilitation</Mark1></Pgraph></Caption>
        </Figure>
        <Figure format="png" height="517" width="577">
          <MediaNo>2</MediaNo>
          <MediaID language="de">2de</MediaID>
          <MediaID language="en">2en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Abbildung 2: Effektivit&#228;t der RK-Form in Abh&#228;ngigkeit von Zusammensetzung der Gruppen (bzgl. Geschlecht) </Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Figure 2: Effectiveness of the RC form depending on group composition (referring to sex)</Mark1></Pgraph></Caption>
        </Figure>
        <NoOfPictures>2</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>