<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>mbi000393</Identifier>
    <IdentifierDoi>10.3205/mbi000393</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-mbi0003935</IdentifierUrn>
    <ArticleType>Fachbeitrag</ArticleType>
    <TitleGroup>
      <Title language="de">Statistische Analysen von Semantic Entities aus Metadaten- und Volltextbest&#228;nden von German Medical Science</Title>
      <TitleTranslated language="en">Statistical evaluation of semantic entities from metadata and full texts on German Medical Science corpora</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Gr&#252;n</Lastname>
          <LastnameHeading>Gr&#252;n</LastnameHeading>
          <Firstname>Stefan</Firstname>
          <Initials>S</Initials>
        </PersonNames>
        <Address>
          <Affiliation>ZB MED &#8211; Informationszentrum Lebenswissenschaften, LIVIVO Entwicklung, K&#246;ln, Deutschland</Affiliation>
        </Address>
        <Email>gruen&#64;zbmed.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Poley</Lastname>
          <LastnameHeading>Poley</LastnameHeading>
          <Firstname>Christoph</Firstname>
          <Initials>C</Initials>
        </PersonNames>
        <Address>ZB MED &#8211; Informationszentrum Lebenswissenschaften, Leitung LIVIVO, Gleueler Str. 60, 50931 K&#246;ln, Deutschland<Affiliation>ZB MED &#8211; Informationszentrum Lebenswissenschaften, LIVIVO Entwicklung, K&#246;ln, Deutschland</Affiliation></Address>
        <Email>poley&#64;zbmed.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">ZB MED</Keyword>
      <Keyword language="en">LIVIVO</Keyword>
      <Keyword language="en">ZB MED Knowledge Environment</Keyword>
      <Keyword language="en">ZB MED KE</Keyword>
      <Keyword language="en">metadata</Keyword>
      <Keyword language="en">full texts</Keyword>
      <Keyword language="en">named entitiy recognition</Keyword>
      <Keyword language="en">UIMA</Keyword>
      <Keyword language="en">SPSS</Keyword>
      <Keyword language="en">descriptive statistics</Keyword>
      <Keyword language="en">MongoDB</Keyword>
      <Keyword language="en">life science</Keyword>
      <Keyword language="de">ZB MED</Keyword>
      <Keyword language="de">LIVIVO</Keyword>
      <Keyword language="de">ZB MED Knowledge Environment</Keyword>
      <Keyword language="de">ZB MED KE</Keyword>
      <Keyword language="de">Metadaten</Keyword>
      <Keyword language="de">Volltexte</Keyword>
      <Keyword language="de">Eigennamenerkennung</Keyword>
      <Keyword language="de">UIMA</Keyword>
      <Keyword language="de">SPSS</Keyword>
      <Keyword language="de">deskriptive Statistik</Keyword>
      <Keyword language="de">MongoDB</Keyword>
      <Keyword language="de">Lebenswissenschaften</Keyword>
    </SubjectGroup>
    <DatePublishedList>
      
    <DatePublished>20171220</DatePublished><DateRepublished>20171221</DateRepublished></DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Journal>
        <ISSN>1865-066X</ISSN>
        <Volume>17</Volume>
        <Issue>3</Issue>
        <JournalTitle>GMS Medizin - Bibliothek - Information</JournalTitle>
        <JournalTitleAbbr>GMS Med Bibl Inf</JournalTitleAbbr>
        <IssueTitle>AGMB Jahrestagung in Wien 2017: Medizinbibliotheken: inter:disziplin&#228;r - inter:national - inter:aktiv</IssueTitle>
      </Journal>
    </SourceGroup>
    <ArticleNo>14</ArticleNo>
    <Erratum><DateLastErratum>20171221</DateLastErratum><Pgraph>In der Titel&#252;bersetzung wurde ein Buchstabendreher (semanitc) korrigiert.</Pgraph></Erratum>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph>Dieser Fachbeitrag besch&#228;ftigt sich damit, englischsprachige German Medical Science (GMS) Artikel zu analysieren. Untersuchungsgegenstand ist ein Vergleich zwischen Semantic Entities, mit denen GMS-Metadaten (Titel und Zusammenfassungen) und GMS-Volltexte angereichert werden. </Pgraph><Pgraph>Inwieweit der informationelle Mehrwert durch Hinzunahme von Volltexten steigt, ist Fragestellung dieses Beitrages. Der durchgef&#252;hrte Vergleich erfolgt statistisch durch die Auswertung annotierter Semantic Entities. Es werden hierzu Kennziffern der deskriptiven Statistik berechnet. Neben den Kennziffern zur zentralen Tendenz und zur Streuung erfolgt zudem eine Berechnung der Schnitt- und Differenzmengen. </Pgraph><Pgraph>Die Ergebnisse zeigen ein deutliches Mehr an Informationen aus den Volltexten. Durchschnittlich liegen in den Metadaten 25 verschiedene Entities vor, in den Volltexten hingegen 215. 89&#37; der Konzepte aus den Metadaten werden auch im Volltext repr&#228;sentiert. Dagegen werden 11&#37; der gefundenen Konzepte der Metadaten auch nur in den Metadaten gefunden. Die berechneten Ergebnisse belegen statistisch, dass durch die Hinzunahme von Volltexten der informationelle Mehrwert z.B. f&#252;r das Information Retrieval steigt. </Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph>This paper analyzes the information content of metadata and full texts in German Medical Science (GMS) articles in English language. The object of the study is to compare semantic entities that are used to enrich GMS metadata (titles and abstracts) and GMS full texts. </Pgraph><Pgraph>The aim of the study is to test whether using full texts increases the value added information. The comparison and evaluation of semantic entities was done statistically. Measures of descriptive statistics were gathered for this purpose. In addition to the ratio of central tendencies and scatterings, we computed the overlaps and complements of the values.</Pgraph><Pgraph>The results show a distinct increase of information when full texts are added. On average, metadata contain 25 different entities and full texts 215. 89&#37; of the concepts in the metadata are also represented in the full texts. Hence, 11&#37; of the metadata concepts are found in the metadata only. In summary, the results show that the addition of full texts increases the informational value, e.g. for information retrieval processes.</Pgraph></Abstract>
    <TextBlock linked="yes" name="Einleitung">
      <MainHeadline>Einleitung</MainHeadline><Pgraph>Die Deutsche Zentralbibliothek f&#252;r Medizin (ZB MED) &#8211; Informationszentrum Lebenswissenschaften (<Hyperlink href="https:&#47;&#47;www.zbmed.de&#47;">https:&#47;&#47;www.zbmed.de&#47;</Hyperlink>) versteht sich als zentrale Informationsinfrastruktur f&#252;r die Lebenswissenschaften in Deutschland und Europa. Aufbauend auf einzigartige Best&#228;nde bietet ZB MED forschungsbasierte M&#246;glichkeiten zur Gewinnung von Informationen und Nutzung von Forschungsdaten in den Lebenswissenschaften. F&#252;r die Recherche nach wissenschaftlicher Fachliteratur wird das Suchportal LIVIVO entwickelt und betrieben (<Hyperlink href="https:&#47;&#47;www.livivo.de">https:&#47;&#47;www.livivo.de</Hyperlink>), das den Zugriff auf etwa 60 Millionen Medien aus dem Bereichen Medizin- und Gesundheitswesen sowie den Umwelt-, Ern&#228;hrungs- und Agrarwissenschaften bietet. Als Datengrundlage dient das <TextGroup><PlainText>ZB MED</PlainText></TextGroup> Knowledge Environment (ZB MED KE) <TextLink reference="1"></TextLink>, in dem mehr als 70 verschiedene Datenquellen aus den Lebenswissenschaften zusammengef&#252;hrt werden. Dieses stellt u.a. die Datengrundlage f&#252;r LIVIVO bereit und beinhaltet neben den dort abrufbaren Metadaten beispielsweise auch Volltexte, Verf&#252;gbarkeiten oder Verkn&#252;pfungen zu aktuellen Forschungsarbeiten <TextLink reference="2"></TextLink>.</Pgraph><Pgraph>F&#252;r die vorliegende Untersuchung sind Forschungsarbeiten zur Anreicherung des ZB MED Datenbestands mit sogenannten Semantic Entities (Begriffe, Konzepte, Deskriptoren oder vereinfacht Entities <TextLink reference="3"></TextLink>) grundlegend. Diese sind Ein- oder Mehrwortbenennungen aus einem kontrollierten Vokabular. Sie beinhalten allgemeinsprachliche Sachbegriffe (z.B. aus den Thesauri MeSH <TextLink reference="4"></TextLink> oder Agrovoc <TextLink reference="5"></TextLink>) oder Individualnamen (z.B. in DrugBank <TextLink reference="6"></TextLink>). In beiden F&#228;llen verf&#252;gen sie &#252;ber die Charakteristika, kontextfrei, wiedergabetreu und vorhersagbar zu sein <TextLink reference="7"></TextLink>. Deshalb k&#246;nnen sie auch im Information Retrieval als Indexterme eingesetzt werden.</Pgraph><Pgraph>Eine Studie von M&#252;ller et al. <TextLink reference="8"></TextLink> besch&#228;ftigt sich damit, auf der Basis von Titeln und Zusammenfassungen Semantic Entities zu generieren und den Dokumenten zuzuordnen. Zudem wurde ein Wordcloud-Prototyp (<Hyperlink href="http:&#47;&#47;labs.livivo.de">http:&#47;&#47;labs.livivo.de</Hyperlink>) vorgestellt, der die h&#228;ufigsten Entities je W&#246;rterbuch im LIVIVO-Korpus visualisiert. Eine zweite Studie von M&#252;ller et al. <TextLink reference="9"></TextLink> befasst sich damit, die identifizierten Semantic Entities zu z&#228;hlen und dabei den jeweiligen Anteil der W&#246;rterb&#252;cher mithilfe des Jaccard-Index zu messen. Ergebnis hier war beispielsweise eine hohe Schnittmenge bei den allgemeinen Sachdeskriptoren der Thesauri MeSH und Agrovoc, w&#228;hrend die Datenbank DrugBank aufgrund ihrer Individualnamen niedrige Indexzahlen zur &#196;hnlichkeit der identifizierten Konzepte aufwies. </Pgraph><Pgraph>Die vorliegende Studie kn&#252;pft an die oben genannten Arbeiten an und weitet in einem ersten Schritt den Ansatz zum Generieren von Semantic Entities f&#252;r Metadaten <TextLink reference="8"></TextLink> zus&#228;tzlich auf Volltexte aus. Verwendet werden hierbei englischsprachige Fachartikel aus German Medical Science. Ein statistischer Vergleich zwischen Semantic Entities aus Metadaten und Volltexten erfolgt dann im zweiten Schritt der Arbeit. Hierzu werden neben Kennwerten der deskriptiven Statistik zus&#228;tzlich Schnitt- und Differenzmengen berechnet. Hintergrund ist dabei die Fragestellung, inwieweit eine Hinzunahme des Volltextes einen informationellen Mehrwert darstellt, beispielsweise f&#252;r das Information Retrieval lebenswissenschaftlicher Literatur in LIVIVO. </Pgraph></TextBlock>
    <TextBlock linked="yes" name="Methoden">
      <MainHeadline>Methoden</MainHeadline><Pgraph>Das ZB MED KE beinhaltet die technische Infrastruktur zum Datenmanagement und dient damit als Ausgangspunkt f&#252;r die vorliegenden Untersuchung. Dessen Aufgabe ist es unter anderem, Daten aus verschiedenen Quellen (z.B. ZB MED-Kataloge, Medline <TextLink reference="10"></TextLink>, DissOnline <TextLink reference="11"></TextLink>, German Medical Science <TextLink reference="12"></TextLink> oder Verlagsdaten) und unterschiedlichen Datenformaten (z.B. MARC21 <TextLink reference="13"></TextLink>, JATS <TextLink reference="14"></TextLink> oder DublinCore <TextLink reference="15"></TextLink>) einzusammeln,  zu harmonisieren und f&#252;r weitere Anreicherungen abzuspeichern. Die Daten dienen auch als Grundlage f&#252;r die anwendungsorientierte Forschung an ZB MED und&#47;oder Dienstleistungen wie LIVIVO. Das dokumentenbasierte Datenbankmanagementsystem MongoDB (<Hyperlink href="http:&#47;&#47;www.mongodb.com">http:&#47;&#47;www.mongodb.com</Hyperlink>) bildet hierbei die Infrastruktur f&#252;r die Datenhaltung des ZB MED KE &#91;2&#93;. &#220;ber einen Connector erfolgt der Zugriff auf die darin enthaltenen GMS-Dokumente (Metadaten und Volltexte), die als Grundlage f&#252;r die Studie dienen.</Pgraph><Pgraph>Die im ZB MED KE vorliegende Gesamtzahl der GMS-Artikel wurde zun&#228;chst auf 530 Dokumente eingeschr&#228;nkt. Die Filterung erfolgte auf die Artikeltypen &#8222;Case Report&#8220;, &#8222;Research Article&#8220; und &#8222;Review Article&#8220;. Poster, Abstracts ohne Volltexte oder &#228;hnliche Formate wurden nicht herangezogen. Dar&#252;ber hinaus beschr&#228;nkte sich die Studie auf englischsprachige Dokumente, da die eingebundenen W&#246;rterb&#252;cher (MeSH, Agrovoc und DrugBank) ebenfalls in englischer Sprache zum Einsatz kamen.</Pgraph><Pgraph>Im zweiten Schritt wurden die im ZB MED KE abgelegten Dokumente extrahiert und verarbeitet. Ausgangspunkt hier waren Dokumente, die sich verallgemeinert in die Kategorien Metadaten und Volltexte unterteilen. In der Kategorie Metadaten finden sich inhaltliche (z.B. Titel oder Abstract) und formale (z.B. DOI oder Autor) Aspekte. Die Kategorie Volltexte beinhaltet XML-Repr&#228;sentationen der ausgew&#228;hlten GMS-Dokumente. Um einen Vergleich zwischen Semantic Entities aus Metadaten (Titel und Zusammenfassung) und Volltexten zu realisieren, wurden die XML-Auszeichnungen entfernt.</Pgraph><Pgraph>Im n&#228;chsten Schritt lie&#223; sich der auf das UIMA-Framework (<Hyperlink href="https:&#47;&#47;uima.apache.org">https:&#47;&#47;uima.apache.org</Hyperlink>) basierende Concept Mapper (vgl. vorausgegangene Studie von M&#252;ller et al. <TextLink reference="8"></TextLink>) einsetzen und  damit die Metadaten (Titel und Zusammenfassung) sowie die Volltexte annotieren. Die eingebundenen W&#246;rterb&#252;cher waren MeSH, Agrovoc und DrugBank. Das MeSH-Vokabular besteht aus allgemeinen Sachdeskriptoren der Medizin, der multilinguale Agrovoc Thesaurus aus allgemeinen Sachbegriffen der Agrarwirtschaft.  DrugBank beinhaltet Individualnamen von Medikamenten. Alle drei Ressourcen realisieren eine Synonymrelationierung. Dementsprechend konnte die Zuteilung der Deskriptoren (Vorzugsbenennungen) zu Dokumenten durch das UIMA Framework durchgef&#252;hrt werden. Im MeSH-Thesaurus wurden beispielhaft u.a. die bedeutungsgleichen Benennungen &#8222;Tumors&#8220; und &#8222;Cancer&#8220; der Vorzugsbenennung &#8222;Neoplasms&#8220; zugeordnet. Taucht in einem Dokument eines dieser Synonyme oder die Vorzugsbenennung selbst auf, wird der Begriff &#8222;Neoplasms&#8220; identifiziert und dem jeweiligen Dokument zugeordnet. Die Ergebnisse des UIMA Concept Mappers wurden im ZB MED KE f&#252;r die weitere Verarbeitung zus&#228;tzlich abgelegt <TextLink reference="2"></TextLink>.</Pgraph><Pgraph>Nach Anreicherung der Metadaten und Volltexte durch Semantic Entites erfolgte die Extraktion (getrennt nach Metadaten und Volltexten) und die Z&#228;hlung der annotierten Begriffe. F&#252;r den vorliegenden Vergleich wurden alle Begriffe beim ersten Vorkommen einfach gez&#228;hlt, da die Untersuchung einen m&#246;glichen informationellen Mehrwert anhand unterschiedlicher Entities analysiert. Zudem erfolgte an dieser Stelle die Messung von Schnitt- und Differenzmengen (vgl. Tab. 2). Wenn ein identifizierter Begriff im Titel oder in der Zusammenfassung (Metadaten) auftaucht und zus&#228;tzlich auch im Volltext steht, wird dieser als Schnittmenge eingetragen. Sofern der Begriff nur in den Metadaten oder nur im Volltext steht, wird dieser als Komplement eingeordnet. In dem am Ende erzeugten Extraktionsergebnis befanden sich somit Semantic Entities aus Metadaten und aus Volltexten sowie deren Schnitt- und Differenzmengen. Jeweils hinter den Begriffen stand deren errechnete Anzahl der unterschiedlichen Entities je Dokument.</Pgraph><Pgraph>Die erzeugte Datei wurde dann in ein SPSS konformes Format gebracht und statistisch analysiert (<Hyperlink href="https:&#47;&#47;www.ibm.com&#47;analytics&#47;de&#47;de&#47;technology&#47;spss">https:&#47;&#47;www.ibm.com&#47;analytics&#47;de&#47;de&#47;technology&#47;spss</Hyperlink>). Hier folgten Berechnungen der deskriptiven Statistik <TextLink reference="16"></TextLink>, um die vorliegenden Begriffsmengen hinsichtlich der im ersten Abschnitt formulierten Forschungsfrage zu untersuchen.  Die Kennwerte der zentralen Tendenz (Modus, Median und arithmetisches Mittel) waren relevant, um zu analysieren wie viele unterschiedliche Konzepte je Dokument im Mittel annotiert wurden. Die Werte der Verteilung&#47;Streuung (Standardabweichung, Varianz, Spannweite, Minimum und Maximum sowie Summe) sollten zeigen, wie repr&#228;sentativ die Werte der Mitte waren und wie diese, bezogen auf die gesamte Stichprobe von 530 Dokumenten einzuordnen sind. </Pgraph></TextBlock>
    <TextBlock linked="yes" name="Ergebnisse">
      <MainHeadline>Ergebnisse</MainHeadline><Pgraph>Tabelle 1 <ImgLink imgNo="1" imgType="table"/> fasst die durch SPSS berechneten Ergebnisse f&#252;r die Konzepte der Metadaten und der Volltexte zusammen.</Pgraph><Pgraph>Am h&#228;ufigsten (Modus) wurden zu den Metadaten <TextGroup><PlainText>22 B</PlainText></TextGroup>egriffe (vgl. Abbildung 1 <ImgLink imgNo="1" imgType="figure"/>) annotiert. Bei den Volltexten wird &#8211; mit Verweis auf eine gleich h&#228;ufige Anzahl von Begriffen &#8211; ein Wert von 98 Begriffen (vgl. Abbildung 2 <ImgLink imgNo="2" imgType="figure"/>) angegeben. 98 Begriffe wurden insgesamt sechsmal identifiziert &#8211; daneben tauchen 132, 136, 137, 146, 172, 181 und 205 ebenfalls sechsmal auf. Das Verh&#228;ltnis der Modi zwischen Metadaten (22) und Volltexten (98) liegt bei 4,5. Mit dem gr&#246;&#223;ten Modus f&#252;r die Volltexte (205) wird ein Verh&#228;ltnis von 9,3 erreicht. </Pgraph><Pgraph>Der Zentralwert (Median) liegt in den Metadaten bei 24 und in den Volltexten bei 175 Entities. F&#252;r die Metadaten bedeutet dies, das die untere H&#228;lfte der 530 Dokumente gleich viele oder weniger als 24 Entities und die obere H&#228;lfte der Dokumente gleich viele oder mehr als 24 Entities identifiziert wurden. Analog dazu beinhalten die unteren 50&#37; der 530 Volltexte gleich viele oder weniger als 175 Entities und die oberen 50&#37; der Dokumente gleich viele oder mehr als 175 Entities. Hier liegt der Faktor der Mediane von Volltexten zu Metadaten bei ca. 7,3. </Pgraph><Pgraph>Das arithmetische Mittel bei den Metadaten betr&#228;gt 25,23 und 214,83 bei den Volltexten. Es wurden damit auf die verwendeten 530 Dokumente durchschnittlich 25 Begriffe in den Metadaten und 215 Begriffe in den Volltexten identifiziert. Die Anzahl an gefundenen Konzepte aus den Volltexten ist mit einem Faktor von ca. 8,6 h&#246;her als die Anzahl aus den Metadaten. </Pgraph><Pgraph>Die Standardabweichung 10,86 (Varianz: 117,85) in den Metadaten zeigt, dass die H&#228;ufigkeiten der identifizierten Sematic Entities in den Bereichen zwischen 14,37 (Mittelwert &#8211; Standardabweichung) und 36,09 (Mittelwert &#43; Standardabweichung) liegen. F&#252;r die Volltexte wurde eine Standardabweichung von 141,59 (Varianz: 20.048,05) Konzepten ermittelt. Hier liegen die meisten H&#228;ufigkeiten der erkannten Semantic Entities zwischen 73,24 und 366,42. </Pgraph><Pgraph>In den Metadaten lag in einer Range (Spannweite) von 80 Konzepten ein Minimum von 5 und ein Maximum von 85 Konzepten je Dokument vor. F&#252;r die Volltexte wurden in einer Spannweite von 1.104 Konzepten ein Minimum von 37 und ein Maximum von 1.141 Konzepten berechnet. Hier liegen die Werte des Minimums zwischen Metadaten (5) und Volltexten (37) ca. um den Faktor 7 auseinander, w&#228;hrend die Werte des Maximums zwischen Metadaten (85) und Volltexten (1.141) ca. den Faktor 13 betragen.</Pgraph><Pgraph>Die unterschiedlichen Kennwerte der zentralen Tendenz (vgl. Tabelle 1 <ImgLink imgNo="1" imgType="table"/>) zeigen f&#252;r die Metadaten geringe Abweichung untereinander &#8211; der Median (24) weicht um zwei Konzepte vom Modus (22) und um 1,23 Konzepte vom arithmetischen Mittel (25,23) ab. Deutlicher sind die Abweichungen in den Werten der Volltexte. Der arithmetische Mitteilwert (214,83) weicht um 39,80 vom Median ab und liegt 116,83 vom Modus entfernt, wobei hier zu beachten ist, das 98 der niedrigste angegebene Wert ist. </Pgraph><Pgraph>Die Kennzahlen der Streuung zeigen, dass vor allem in Volltexten Dokumente mit hoher Anzahl an identifizierten Konzepten gefunden wurden. Dies zeigt z.B. die Standardabweichung der Volltexte (141,59) vom Mittelwert (214,83), bei einem h&#246;heren Maximum (1.141). Bei den Metadaten zeigt die Standardabweichung (10,86) vom Mittelwert (25,23) bei dem gr&#246;&#223;eren Maximum (85) ebenfalls vereinzelt Datens&#228;tze mit vielen identifizierten Konzepten.</Pgraph><Pgraph>Tabelle 2 <ImgLink imgNo="2" imgType="table"/> zeigt das Verh&#228;ltnis der in dem GMS-Testkorpus identifizierten Entities. In den Metadaten der 530 GMS-Dokumente befinden sich insgesamt 13.374 gefundene Konzepte. Die Volltexte weisen eine Summe von 113.862 Konzepten auf. Das stellt einen Faktor von ca. 8,5 dar. </Pgraph><Pgraph>Von den in den Metadaten gefundenen 13.374 Begriffen befinden sich 11.902 (ca. 89&#37;) in den Volltexten. Die verbleibenden 1.472 Begriffe (ca. 11&#37;) der Metadaten wurden nicht in den Volltexten gefunden. Analog dazu beinhalten die Volltexte &#8211; mit 101.960 von insgesamt 113.862 Begriffen (ca. 89&#37;) &#8211; Begriffe, die nicht in den Metadaten zu finden sind. </Pgraph></TextBlock>
    <TextBlock linked="yes" name="Diskussion">
      <MainHeadline>Diskussion</MainHeadline><Pgraph>Die statistischen Berechnungen zeigen, dass nach dem angewendeten Verfahren auf der Basis von identifizierten Konzepten in Volltexten ein Mehr an Informationen als in Metadaten vorhanden ist. Dies l&#228;sst sich anhand der h&#246;heren Werte aus den vorliegenden statistischen Berechnungen durchg&#228;ngig belegen. Beispielsweise zeigt der Median f&#252;r die Volltexte mit 175 Konzepten im Vergleich zum Median der Metadaten mit 24 Konzepten einen um den Faktor 7 h&#246;heren Wert. Erg&#228;nzend dazu best&#228;tigt der Vergleich der Maximalwerte von Metadaten (85 Begriffe) und Volltexten (1.141 Begriffe) die Annahme. </Pgraph><Pgraph>Eine m&#246;gliche Erkl&#228;rung daf&#252;r ist, dass Metadaten (hier Titel und Zusammenfassung) nur ein Kurzabriss &#252;ber den gesamten Text darstellen. Verfasser beschr&#228;nken sich in der Regel in Metadaten auf das Grundlegendste und f&#252;hren oft erst im Verlauf des (Voll-)Textes alle Fachbegriffe ein, beschreiben ihre Methoden und analysieren und reflektieren ihre Erkenntnisse ausf&#252;hrlich. </Pgraph><Pgraph>Weiterhin zeigen die Ergebnisse, dass ein Gro&#223;teil der in den Metadaten befindlichen Informationen auch in den Volltexten repr&#228;sentiert ist. 89&#37; der in den Metadaten identifizierten Begriffe sind auch im jeweiligen Volltext gefunden worden. Dies deutet darauf hin, dass die wohl grundlegenden (Fach-)Begriffe in den Metadaten untergebracht werden. Dies liegt im Interesse eines Verfassers, da Titel und Zusammenfassung vorzugsweise vor dem eigentlichen Volltext von m&#246;glichen interessierten Lesern durchgesehen werden. Au&#223;erdem richtet sich ein Fachbeitrag in der Regel an eine Fachleserschaft, bei der bestimmte Fachbegriffe nicht erkl&#228;rt, sondern nur in einen bestimmten Zusammenhang gebracht werden m&#252;ssen.</Pgraph><Pgraph>Trotz der gro&#223;en Schnittmenge beinhalten Metadaten Informationen, die nicht in Volltexten repr&#228;sentiert werden. Die Kennziffer der Differenzmengen aus Tabelle 2 <ImgLink imgNo="2" imgType="table"/> zeigt, dass von den 13.374 Begriffen 1.472 (ca. 11&#37;) nicht im Volltext benannt werden. Dies kann etwa daf&#252;r sprechen, dass bestimmte Individualnamen nur in Metadaten genannt werden oder dass es sich dabei um allgemeine Sachdeskriptoren handelt, die im Volltext nicht vorkommen. </Pgraph><Pgraph>Eine nicht zu vernachl&#228;ssigende Bedingung f&#252;r die konkreten Werte aus den statistischen Berechnungen besteht in der Charakteristik der Entities in den Volltexten und Metadaten, die im Rahmen dieser Arbeit aber kein Untersuchungsgegenstand war. Eine angelehnte Analyse unter gleichen Bedingungen mit der Untersuchung getrennt nach w&#246;rterbuchspezifischen Konzepten k&#246;nnte diese Annahme best&#228;tigen. Ein m&#246;gliches Resultat kann dann sein, dass die Verwendung von allgemeinen Namen und Individualnamen in den Metadaten und den Volltexten unterschiedlich ist.</Pgraph><Pgraph>Werden mehrere W&#246;rterb&#252;cher gleichzeitig eingesetzt, dann wird dieses Verh&#228;ltnis die Ergebnisse auch beeinflussen. M&#252;ller et al. <TextLink reference="9"></TextLink> zeigten beispielsweise in ihrer Arbeit, dass unter den Top1000 Deskriptoren die Schnittmengen zwischen den beiden allgemeinsprachl<TextGroup><PlainText>ic</PlainText></TextGroup>hen Thesauri MeSH und AGROVOC (473 von <TextGroup><PlainText>1.000 K</PlainText></TextGroup>onzepten) deutlich h&#246;her sind, als z.B. zwischen einem allgemeinsprachlichen Thesaurus MeSH und den Individualnamen in der DrugBank (21 von 1.000 Konzepten). &#220;bertragen auf diese Studie kann der Einsatz von zum Beispiel zwei allgemeinsprachlichen Thesauri (MeSH und AGROVOC) jeweils eine quantitative Auswirkung auf das Identifizieren von Deskriptoren haben. </Pgraph><Pgraph>Erg&#228;nzend dazu sei ein weiterer statistischer Aspekt eingef&#252;gt: Im Titel wurde im Schnitt alle 24 Zeichen ein neuer Begriff identifiziert, in der Zusammenfassung tauchte ein neuer Begriff alle 35 Zeichen und im Volltext alle 43 Zeichen auf. Den Metadaten standen im Durchschnitt mit 33 Zeichen die Volltexte mit 43 Zeichen gegen&#252;ber. In Metadaten herrscht wie erwartet ein etwas h&#246;herer Wert an identifizierten Entities als in Volltexten bezogen auf die Anzahl von Zeichen.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Schlussfolgerungen">
      <MainHeadline>Schlussfolgerungen</MainHeadline><Pgraph>Der vorliegende Fachbeitrag belegt anhand der verwendeten Methoden auf Basis von Semantic Entities statistisch, dass Volltexte einen informationellen Mehrwert gegen&#252;ber Metadaten besitzen. Trotz einiger Einschr&#228;nkungen dieser Studie, z.B. die Begrenzung auf eine Kollektion anstatt einer Ausweitung auf mehrere Quellen, die Anzahl der Datens&#228;tze (530 Dokumente) oder die Beschr&#228;nkung auf 3 W&#246;rterb&#252;cher, ist eine deutliche positive Tendenz f&#252;r die Hinzunahme des Volltextes erkennbar. Das genutzte Verfahren bietet damit einen zus&#228;tzlichen, m&#246;glicherweise auch einen alternativen Aspekt zu Diskussionen um Metadaten- und&#47;oder Volltextin<TextGroup><PlainText>dex</PlainText></TextGroup>ierungen (z.B. <TextLink reference="17"></TextLink>, <TextLink reference="18"></TextLink>). </Pgraph><Pgraph>Dabei bietet die Anreicherung von Metadaten und Volltexten durch Semantic Entities in ihrer Gesamtheit einen Mehrwert. Individualnamen sind spezifischer als Allgemeinw&#246;rter und damit potenziell st&#228;rker f&#252;r ein Information Retrieval geeignet &#8211; besonders vor dem Hintergrund, dass LIVIVO sich an eine lebenswissenschaftliche Community richtet. Bei allgemeinen Sachdeskriptoren k&#246;nnte u.U. auf eine Anreicherung verzichtet werden, sofern die Allgemeinw&#246;rter trotz semantischer Disambiguierung zu allgemein f&#252;r ein ballastfreies Information Retrieval sind. Auch hier k&#246;nnte eine ankn&#252;pfende w&#246;rterbuchspezifische Analyse der Deskriptoren erkenntnisreich sein. </Pgraph><Pgraph>Ein Ansatzpunkt f&#252;r ZB MED w&#228;re, Autoren von Fachbeitr&#228;gen bei der Wahl des Titels sowie dem Erstellen der Zusammenfassung (Abstract) in Zukunft durch automatische Verfahren zu unterst&#252;tzen. Dies kann zum Beispiel realisiert werden, indem der vom Autor eingereichte Aufsatz dahingehend analysiert wird, dass ein Verh&#228;ltnis der gefundenen Konzepte in seinen Metadaten und dem Volltext gebildet wird, mit dem Ziel, einen bestimmten Wert nicht zu &#252;berschreiben. Als Referenzwert k&#246;nnte hier exemplarisch das Verh&#228;ltnis von 1&#47;7 f&#252;r die Anzahl der gefundenen Entities in den Metadaten&#47;Volltexte dienen. Damit kann der Autor statistisch eine &#8222;bessere&#8220; Ber&#252;cksichtigung seines Aufsatzes beim Information Retrieval auf Metadaten erzielen. Dies kann dazu beitragen, dass wissenschaftliche Aufs&#228;tze m&#246;glichst wiedergabetreu beschrieben werden. Dar&#252;ber hinaus lie&#223;e sich ein weiteres geeignetes Werkzeug einsetzen, mit dem Ziel, automatisch erg&#228;nzende Entities f&#252;r die Metadaten vorzuschlagen. Dies lie&#223;e sich dann zum Beispiel durch ein Highlighting der relevanten Textpassagen in den Volltexten mit Verlinkung auf die entsprechenden dahinter stehenden Entities realisieren.</Pgraph></TextBlock>
    <TextBlock linked="yes" name="Anmerkung">
      <MainHeadline>Anmerkung</MainHeadline><SubHeadline>Interessenkonflikte</SubHeadline><Pgraph>Die Autoren arbeiten an ZB MED in den Informationsdiensten f&#252;r die LIVIVO-Entwicklung. Herr Poley ist dar&#252;ber hinaus f&#252;r das Produkt LIVIVO verantwortlich. Ansonsten liegen keine Interessenkonflikte vor.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="12">
        <RefAuthor>Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften (AWMF)</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>German Medical Science GMS</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften (AWMF). German Medical Science GMS. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: http:&#47;&#47;www.egms.de&#47;</RefTotal>
        <RefLink>http:&#47;&#47;www.egms.de&#47;</RefLink>
      </Reference>
      <Reference refNo="1">
        <RefAuthor>M&#252;ller B</RefAuthor>
        <RefAuthor>Poley C</RefAuthor>
        <RefAuthor>P&#246;ssel J</RefAuthor>
        <RefAuthor>Hagelstein A</RefAuthor>
        <RefAuthor>G&#252;bitz T</RefAuthor>
        <RefTitle>LIVIVO &#8211; the Vertical Search Engine for Life Sciences</RefTitle>
        <RefYear>2017</RefYear>
        <RefJournal>Datenbank-Spektrum</RefJournal>
        <RefPage>29-34</RefPage>
        <RefTotal>M&#252;ller B, Poley C, P&#246;ssel J, Hagelstein A, G&#252;bitz T. LIVIVO &#8211; the Vertical Search Engine for Life Sciences. Datenbank-Spektrum. 2017;17:29-34.</RefTotal>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Poley C</RefAuthor>
        <RefTitle>Neue Herausforderungen an das ZB MED-Suchportal f&#252;r Lebenswissenschaften</RefTitle>
        <RefYear>2016</RefYear>
        <RefJournal>GMS Med Bibl Inf</RefJournal>
        <RefPage>Doc21</RefPage>
        <RefTotal>Poley C. Neue Herausforderungen an das ZB MED-Suchportal f&#252;r Lebenswissenschaften. GMS Med Bibl Inf. 2016;16(3):Doc21. DOI: 10.3205&#47;mbi000376</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3205&#47;mbi000376</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Stock WG</RefAuthor>
        <RefTitle>Concepts and semantic relations in information science</RefTitle>
        <RefYear>2010</RefYear>
        <RefJournal>J Assoc Inf Sci Technol</RefJournal>
        <RefPage>1951-69</RefPage>
        <RefTotal>Stock WG. Concepts and semantic relations in information science. J Assoc Inf Sci Technol. 2010;61(10):1951-69. DOI: 10.1002&#47;asi.21382</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1002&#47;asi.21382</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>National Library of Medicine (NLM)</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>Medical Subject Headings</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>National Library of Medicine (NLM). Medical Subject Headings. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: https:&#47;&#47;www.ncbi.nlm.nih.gov&#47;mesh</RefTotal>
        <RefLink>https:&#47;&#47;www.ncbi.nlm.nih.gov&#47;mesh</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Food and Agriculture Organization (FAO) of the United Nations</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>AGROVOC Multilingual agricultural thesaurus</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Food and Agriculture Organization (FAO) of the United Nations. AGROVOC Multilingual agricultural thesaurus. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: http:&#47;&#47;aims.fao.org&#47;vest-registry&#47;vocabularies&#47;agrovoc-multilingual-agricultural-thesaurus</RefTotal>
        <RefLink>http:&#47;&#47;aims.fao.org&#47;vest-registry&#47;vocabularies&#47;agrovoc-multilingual-agricultural-thesaurus</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>University of Alberta</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>DrugBank</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>University of Alberta. DrugBank. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: https:&#47;&#47;www.drugbank.ca&#47;</RefTotal>
        <RefLink>https:&#47;&#47;www.drugbank.ca&#47;</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>G&#246;dert W</RefAuthor>
        <RefAuthor>Lepsky K</RefAuthor>
        <RefAuthor>Nagelschmidt M</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2012</RefYear>
        <RefBookTitle>Informationserschlie&#223;ung und automatisches Indexieren &#8211; ein Lehr- und Arbeitsbuch</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>G&#246;dert W, Lepsky K, Nagelschmidt M. Informationserschlie&#223;ung und automatisches Indexieren &#8211; ein Lehr- und Arbeitsbuch. Berlin, Heidelberg: Springer; 2012.</RefTotal>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>M&#252;ller B</RefAuthor>
        <RefAuthor>Hagelstein A</RefAuthor>
        <RefTitle>Beyond Metadata &#8211; Enriching Life Science Publications in LIVIVO with Semantic Entities from the Linked Data Cloud</RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>SEMANTicS; 2016 Sep 12-15; Leipzig, Germany</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>M&#252;ller B, Hagelstein A. Beyond Metadata &#8211; Enriching Life Science Publications in LIVIVO with Semantic Entities from the Linked Data Cloud. In: SEMANTicS; 2016 Sep 12-15; Leipzig, Germany.</RefTotal>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>M&#252;ller B</RefAuthor>
        <RefAuthor>Hagelstein A</RefAuthor>
        <RefAuthor>G&#252;bitz T</RefAuthor>
        <RefTitle>Life science ontologies in literature retrieval: A comparison of linked data sets for use on semantic search on a heterogeneous corpus</RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>Proceedings of the 20th International Conference on Knowledge Engineering and Knowledge Management; 2016 Nov 19-23; Bologna, Italy</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>M&#252;ller B, Hagelstein A, G&#252;bitz T. Life science ontologies in literature retrieval: A comparison of linked data sets for use on semantic search on a heterogeneous corpus. In: Proceedings of the 20th International Conference on Knowledge Engineering and Knowledge Management; 2016 Nov 19-23; Bologna, Italy.</RefTotal>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>National Library of Medicine (NLM)</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>Medline</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>National Library of Medicine (NLM). Medline. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: https:&#47;&#47;www.ncbi.nlm.nih.gov&#47;pubmed&#47;</RefTotal>
        <RefLink>https:&#47;&#47;www.ncbi.nlm.nih.gov&#47;pubmed&#47;</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Deutsche National Bibliothek (DNB)</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>Dissonline</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Deutsche National Bibliothek (DNB). Dissonline. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: http:&#47;&#47;www.dnb.de&#47;DE&#47;Wir&#47;Kooperation&#47;dissonline&#47;dissonline&#95;node.html</RefTotal>
        <RefLink>http:&#47;&#47;www.dnb.de&#47;DE&#47;Wir&#47;Kooperation&#47;dissonline&#47;dissonline&#95;node.html</RefLink>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Deutsche National Bibliothek (DNB)</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>MARC 21</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Deutsche National Bibliothek (DNB). MARC 21. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: http:&#47;&#47;www.dnb.de&#47;DE&#47;Standardisierung&#47;Formate&#47;MARC21&#47;marc21&#95;node.html</RefTotal>
        <RefLink>http:&#47;&#47;www.dnb.de&#47;DE&#47;Standardisierung&#47;Formate&#47;MARC21&#47;marc21&#95;node.html</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Anonym</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>JATS. Journal Article Tag Suite</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>JATS. Journal Article Tag Suite. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: https:&#47;&#47;jats.nlm.nih.gov&#47;</RefTotal>
        <RefLink>https:&#47;&#47;jats.nlm.nih.gov&#47;</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>Dublin Core Metadata Initiative (DCMI)</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>Dublin Core</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Dublin Core Metadata Initiative (DCMI). Dublin Core. &#91;letzter Zugriff: 15.12.2017&#93;. Verf&#252;gbar unter: http:&#47;&#47;dublincore.org&#47;</RefTotal>
        <RefLink>http:&#47;&#47;dublincore.org&#47;</RefLink>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Field A</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2009</RefYear>
        <RefBookTitle>Discovering statistics using SPSS</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Field A. Discovering statistics using SPSS. 3. Aufl. London: Sage Publications; 2009.</RefTotal>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Stock WG</RefAuthor>
        <RefTitle>Automatische und intellektuelle Indexierung. Das &#8222;Big-Systems&#8217;-Syndrom&#8220;. Eine Antwort auf Robert Fugmann</RefTitle>
        <RefYear>2000</RefYear>
        <RefJournal>Password</RefJournal>
        <RefPage>18-20</RefPage>
        <RefTotal>Stock WG. Automatische und intellektuelle Indexierung. Das &#8222;Big-Systems&#8217;-Syndrom&#8220;. Eine Antwort auf Robert Fugmann. Password. 2000;(1):18-20.</RefTotal>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Beall J</RefAuthor>
        <RefTitle>The weaknesses of full-text searching</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>J Acad Librariansh</RefJournal>
        <RefPage>438-44</RefPage>
        <RefTotal>Beall J. The weaknesses of full-text searching. J Acad Librariansh. 2008;34(5):438-44.</RefTotal>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>2</MediaNo>
          <MediaID>2</MediaID>
          <Caption><Pgraph><Mark1>Tabelle 2: Schnitt- und Differenzmenge der Semantic Entities aus Metadaten- und Volltextbest&#228;nden des GMS-Korpus (N&#61;530)</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID>1</MediaID>
          <Caption><Pgraph><Mark1>Tabelle 1: Werte der deskriptiven Statistik zu den identifizierten Semantic Entities aus Metadaten- und Volltextbest&#228;nden des GMS-Korpus (N&#61;530)</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>2</NoOfTables>
      </Tables>
      <Figures>
        <Figure format="png" height="494" width="738">
          <MediaNo>1</MediaNo>
          <MediaID>1</MediaID>
          <Caption><Pgraph><Mark1>Abbildung 1: Histogramm zur Anzahl der identifizierten Begriffen in den Metadaten der GMS-Dokumente</Mark1></Pgraph></Caption>
        </Figure>
        <Figure format="png" height="494" width="738">
          <MediaNo>2</MediaNo>
          <MediaID>2</MediaID>
          <Caption><Pgraph><Mark1>Abbildung 2: Histogramm zur Anzahl der identifizierten Begriffe in den Volltexten der GMS-Dokumente</Mark1></Pgraph></Caption>
        </Figure>
        <NoOfPictures>2</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>