Digitalisierung des Polytechnischen Journals – Projektdokumentation zu TEI-Encoding und Editionsprinzipientextloop Martina Gödel2014EinleitungDiese Schemadokumentation wurde im Rahmen des Projektes Digitalisierung des Polytechnischen Journals erstellt und soll Interessierten die für das "Basic Encoding" genutzten Elemente und Projektfestlegungen veranschaulichen.Im Verlauf des Projektes wurden 375 Bände mit etwa 205.000 Seiten, inklusive aller Textbände, Atlanten und Realindizes, von der SLUB in Dresden imagedigitalisiert, im Anschluss von dem Digitalisierungsdienstleister Editura GmbH & Co. KG texterkannt und nach den Guidelines der Text Encoding Initiative sowie in Absprache mit den wissenschaftlichen Mitarbeitern der Humboldt Universität zu Berlin ausgezeichnet. Auf Grundlage dieses "Basic Encoding", das zunächst nur textimmanent Informationen ausgewertet hat, wurden von den Wissenschaftlern Informationen zu Personen, Orten und Patenten angereichert. Eine ausführliche Projektdokumentation zu den Projektpartnern und Arbeitsabläufen findet sich auf der Website des Projektes.Das Projektschema nutzt unverändertes TEI. Es wurden keine Elemente hinzugefügt, keine Klassen verändert. Die Logik der Auszeichnung folgt den Vorgaben der TEI-Guidelines. Restriktiv war das Vorgehen insofern, als im Projekt nicht genutzte Elemente aus dem Schema ausgeschlossen wurden und für einige Elemente geschlossene Listen von Attributwerten vorgegeben und ihr Einsatz im Projekt definiert wurde.Allgemeine FestlegungenWas erfasst wurdeEs wurden alle Scandateien, die von der SLUB aus Dresden geliefert wurden in die XML-Texte eingelinkt. Scandateinamen und Barcodes der einzelnen Bände wurden initial übernommen und analog zur SLUB Logik weitergeführt. In den Fällen bei denen die SLUB fehlende Seiten nachgescannt bzw. Korrekturen in der Scanchronolgie nachträglich vorgenommen hat, weichen die Bezeichnungen heute ab. Doppeltlieferungen von Textseiten wurden aus dem XML gelöscht. Als Orientierungshilfe wurden sprechende Band-IDs ergänzt, z. B. pj001 für "Polytechnisches Journal Band 1".Alle gedruckten Textzeichen, die für den Sinnzusammenhang wichtig sind, wurden erfasst. Sonderzeichen für die kein Unicode existiert, Textornamente und Illustrationen sind als Bilder umgesetzt worden. (Vgl. Abschnitt zu Sonderzeichen).Alle Bilder und Tafeln wurden aus den gelieferten Faksimiledateien ausgeschnitten, gerade gerückt und als Master-TIF abgespeichert. In die Texte eingebunden wurden 25 % PNG-Versionen (bezogen auf die Kantenlänge) der Originaldateien, bei Textabbildungen wurde zusätzlich auf Graustufen reduziert.Anpassungen, NichtübernahmenTextdekorierende Elemente, wie z. B. Initialen, wurden normalisiert.Dekorierte Texttrennzeichen zwischen Textabschnitten sind entfallen.In den frühen Bänden enthaltene Angaben zu Druckbögen am Seitenende wurden nicht erfasst.Kolumnentitel wurden nur einmal zu Beginn des Textabschnitts, auf den sie sich beziehen, als titlePart type="column" übernommen und sind in der Folge entfallen. (Vgl. "Legal values" zu titlePart)Herausgeberanmerkungen zur digitalen AusgabeBei offensichtlichen Fehlern in der Vorlage, wie z. B. fehlenden Anmerkungszeichen, fehlenden Einzelfiguren auf Tafeln, fehlenden Seiten, wurde ein Herausgeberkommentar gesetzt und wie folgt gekennzeichnet:
note type="digital_edition".
<note anchored="true" place="bottom">
<note type="digital_edition">Anmerkungszeichen zu dieser Fußnote fehlt im Text.</note>
<pb facs="32422908Z/00000518" n="484" xml:id="pj272_pb484_2"/>
<p>Ueber Materialprüfungsmaschinen vgl. <hi rendition="#italic">Williamson,</hi>
1882 <hi rendition="#bold">244</hi> * 41, <hi rendition="#italic">Gravenstaden
und Pohlmeyer,</hi> 1882 <hi rendition="#bold">245</hi> * 16,
<hi rendition="#italic">Thomasset,</hi> 1882 <hi rendition="#bold">246</hi>* 27
und <hi rendition="#italic">Emery,</hi> 1889 <hi rendition="#bold">271</hi>*
<ref target="#pj271_pb442">442</ref>.</p>
</note>
(Vgl. allgemein note).ZeichensetzungAlle durch Anführungszeichen gekennzeichneten Passagen wurden zusätzlich mit dem Element q umschlossen, solang es sich nicht eindeutig um Buchtitel oder Eigennamen handelte. Die Anführungszeichen wurden soweit als möglich erhalten. Im Fall von sich wiederholenden Anführungszeichen zu Beginn jeder einzelnen Zeile wurde das q-Element gekennzeichnet (q type="preline")und nur das erste öffnende und das schließende Anführungszeichen übernommen.ZeichencodierungAlle Texte sind über das Wurzelelement auf eine UTF-8 Codierung festgelegt. Auf den Einsatz von hexadezimalen Codes innerhalb der Texte wurde zugunsten eines kürzeren Quelltextes im Projektverlauf zunehmend verzichtet.Seiten-, Spalten- und ZeilenkonkordanzSeitenumbrüche der Druckvorlage wurden zu Beginn der Seite möglichst nah vor dem ersten Textzeichen, das erfasst wurde, über das Element pb markiert. Beginnt ein Kapitel mit einer neuen Seite, wird der Seitenumbruch zu Anfang und innerhalb des öffnenden Textabschnitts gesetzt. (Dieses Vorgehen folgt den Empfehlungen der Best Practices for TEI in Libraries.) In das Attribut n wurde dabei der Wert der gedruckten Seite aufgenommen, selbst wenn es sich um einen offensichtlichen Paginierungsfehler handelte. Wenn es keine gedruckte Seitenzahl gab, wurde eine sinnvolle Bezeichnung in eckigen Klammern ergänzt. (Vgl. „Legal values“ für n in pb.)Bei zweispaltigem Satz wurde jeweils möglichst nah vor dem erste Zeichen jeder neuen Spalte ein cb gesetzt.Die Zeilentrennung ist zugunsten eines dynamischen Flusses der digitalen Ausgabe aufgelöst worden. Wo eine Gliederungen über Zeilenumbrüche wichtig erschien, wurden diese in Überschriften und Tabellen erhalten. Harte Zeilentrennungen in Komposita wurden selbstverständlich erhalten.Wohlgeformtheit, ValiditätAlle Dateien wurden wären des gesamten Arbeitsprozesses auf Wohlgeformtheit und Validität geprüft. Die Erstellung des Schemas wurde über die hier vorliegende ODD-XML Datei gesteuert und jeweils das Schema auf dem aktuellen Stand in den Dateikopf aller Dateien eingelinkt. Download Schema hier.TexterfassungAbsatzformateDas am häufigsten im Text vorkommende Absatzformat (erste Zeile eingerückt, die folgende Zeile nicht) wurde als Standard festgelegt und über ein einfaches p ausgezeichnet. Absätze, deren erste Zeile nicht eingerückt war (z. B. bei ersten Absätzen in Artikeln) werden als p rendition="#no_indent" ausgewiesen.Auszeichnungsbeispiel:
<div type="section" n="1">
<head rendition="#center #wide">1. Vorzuͤge der
hydraulischen Presse.</head>
<p rendition="#no_indent">Die hydraulische Presse hat besondere Vorzuͤge, die man an andern Arten von Pressen vermißt. Man kann ihren Effekt bedeutend vermehren, ohne ihren Umfang in demselben Verhaͤltniß zu vergroͤßern. Ein einziger Mann reicht hin, vermittelst derselben sehr große Wirkungen hervorzubringen. Man hat hier mit wenigen Reibungen zu kaͤmpfen.</p>
</div>
Hervorhebungen in der TextvorlageAlle Texte wurden vollständig wiedergegeben und möglichst vorlagengetreu getaggt. Es wurde versucht möglichst viel Information des Textes zu erhalten und explizit zu machen. Größe und Schriftart des normalen Fließtextes galten als Standardwerte, zu ihnen wurde ins Verhältnis gesetzt.Jede Hervorhebung des Originaltextes wurde über das Element hi markiert, über sein Attribut rendition wird auf den Dateiheader verwiesen. Die Layout-Hervorhebungen im Text wurden hier klassifiziert und für jede Klasse ein rendition-Element gesetzt, dass in CSS-Notation eine Beschreibung enthält.
Informationen zur SchriftgrößeAusnahmeregelung: Informationen zur Schriftgröße wurden nur dann erfasst, wenn im Fließtext durch die Schriftgröße ein Textabschnitt und/oder ein Wort besonders hervorgehoben wird. Im Fall von Überschriften titlePart/head entfällt die Information zur Schriftgröße komplett.SonderzeichenSonderzeichen, die nicht eindeutig als Unicode identifiziert werden konnten, wurden als im Text mitfließende Bildchen eingebunden.Verweis im Quelltext:
FormelnIn der ersten Projektphase (Bände 1 bis 226) wurden Formeln vereinfacht übernommen (z. B. Bruchdarstellung über "/") oder als Bilder eingebunden. In der zweiten Projektphase (Band 227 bis Ende) wurde das Vorgehen optimiert und den Vorschlägen der TEI Guidelines folgend angepasst. Die TEI Guidlines empfehlen die folgende Auszeichnung: formula notation="TeX". Die notation="TeX" wurde als 'default'-Wert gesetzt, und das Tagging auf formula verkürzt. Zum Testen wurde auf das LaTeX Math Tutorial for mathTeX zurückgegriffen.Beispielabbildung einer Seite mit Formeln:
Umsetzung im Quelltext:
<p>Die <q>„Marke A“</q> besitzt ein specifisches Gewicht von 0,910 bis
0,912, einen zwischen 140 und 150° C. liegenden Flammpunkt, eine zwischen 180
und 200° C. liegende Entzündungstemperatur, die Viscosität bei 50° C. beträgt
beispielsweise <formula>\frac{5\mbox{ Min. }38\mbox{ Sec.}}{240}=1,4</formula>;
der Cold test-Punkt liegt bei – 21° C.</p>
Druckfehler, Corrigenda, unleserliche TextstellenOffensichtliche Druckfehler der Vorlage wurden innerhalb von sic identisch übernommen. Ein Korrekturvorschlag ist in corr ergänzt und über den Wert Druckfehler in type gekennzeichnet worden. (Vgl. „Legal Values“ zu corr) Die beiden Alternativen wurden in choice zusammengefasst.In der ersten Projektphase wurden Corrigendalisten der Vorlage soweit als möglich eingearbeitet. Der zu korrigierende Wert der Vorlage wurde in sic und der korrigierte Wert aus dem Corrigendaverzeichnis in corr erfasst (Vgl. „Legal values“ zu corr). Das Element choice umschließt die Alternativen. In der zweiten Projektphase musste dieser Arbeitsschritt leider entfallen.Bei unleserlichen Textstellen durch Schäden in der Vorlage oder bei nicht ohne weiteres rekonstruierbaren fehlgedruckten Wörtern wurde ein unclear gesetzt und der Grund für die Unleserlichkeit über reason näher bestimmt. (Vgl. "Legal values" zu unclear). Bei fehlenden Textsequenzen wurde ein gap gesetzt.
<p>Die um <unclear reason="damage"><gap/></unclear> 50 Minuten angeheizte
Maschine wurde von 10 Uhr 16 Minuten bis
<unclear reason="damage"><gap/></unclear> Uhr 16 Minuten mit einer
<hi rendition="#italic">Brauer'</hi>schen Bremse nach Abstellung des
<unclear reason="illegible">Regu</unclear>lators gebremst. Die Beschickung des
Ofens erfolgte durch einen französischen Heizer mit abgewogenem Brennstoff.</p>
FußnotenDer Fußnotentext wurde am Ort seines Vorkommens eingefügt und die Fußnotenziffer in das note als Wert für n übernommen. Am Anfang des Fußnotentextes wurde das pb der Seite wiederholt, aber mit einer neuen ID versehen, damit unabhängig vom späteren Ort der Umsetzung die Seitenkonkordanz nachvollziehbar bleibt. Auch umbrechende Seiten innerhalb von Fußnoten wurden auf diese Weise ausgezeichnet. Alle Fußnotentexte wurden grundsätzlich p getaggt.
<div type="section" n="B">
<pb n="103" facs="32199828Z/00000135" xml:id="pj324_pb103"/>
<head rendition="#center">B. Spezial-Löffelbagger
<note place="bottom" anchored="true" n="3)"><pb n="103" facs="32199828Z/00000135" xml:id="pj324_pb103_n38"/><p>Dem Vernehmen nach hat die bekannte Firma <hi rendition="#italic">A. Bleichert & Co.,</hi> Leipzig-Gohlis, bei
der zeitweise die Absicht bestanden hat, solche Maschinen von der <hi rendition="#italic">Bucyrus Co.</hi> in
Milwankee zu beziehen bezw. in Gemeinschaft mit ihr zu bauen, diesen Plan aufgegeben, sodass m.W. gegenwärtig nur die
Firma <hi rendition="#italic">Menck & Hambrock</hi> solche Bagger in Deutschland herstellt.</p></note>.</head>
<p>Außer den bisher besprochenen Universal-Löffelbaggern bauen <hi rendition="#italic">Mench
& Hambrock G.m.b.H.,</hi> Altona-Ottensen, ...</p>
</div>
Zusätze des Herausgebers/ÜbersetzersZusätze des Herausgebers bzw. des Übersetzers in Artikeln wurden als div type="addendum" gekennzeichnet. (Vgl. "legal values" zu div)
<div type="addendum">
<head>Zusatz des Herausgebers</head>
<p>Diese Verbesserung des Hrn. Omrod bei der Erzeugung metallener Walzen [...]</p>
</div>
Mehrteilige ArtikelAm Ende einiger Artikel findet sich ein Hinweis auf eine Fortsetzung. Diese Art von Fortsetzungshinweisen wurde als div type="continuation"gekennzeichnet und in einem zweiten Schritt mit dem Fortsetzungsabschnitt verlinkt. (Vgl. "legal values" zu div)
Text- und TafelabbildungenAlle Bilder und Tafeln wurden aus den gelieferten Faksimiledateien ausgeschnitten, geradegerückt und als Master-TIF Datei abgespeichert. In die Texte eingebunden wurden 25 % PNG-Versionen (bezogen auf die Kantenlänge) der Originaldateien, bei Textabbildungen zusätzlich auf Graustufen reduziert.TextabbildungenBei vom Text umflossenen Abbildungen wurde in der ersten Projektphase (Bände 1 bis 226), wie im Beispiel unten, der Textabsatz, auf den sie sich beziehen, in das figure-Element miteingeschlossen. In der zweiten Projektphase (Bände 227 bis Ende) wurde das figure an den Anfang des ihn umfliessenden Absatzes gesetzt.Die Textabbildungen wurden über rend näher bestimmt (Vgl. "legal values" zu figure).In das Element figDesc wurde eine formale Beschreibung des Bildes aufgenommen.
TafelabbildungenHinweise auf einzelne Figuren aus dem Text wurden mit den Einzelfiguren auf den Tafeln verlinkt. Vgl. folgender Abschnitt zu Image-Markup der Einzelfiguren auf den Tafeln.
<p>Dieser Ofen (<ref rend="new" target="image_markup/tab272668.xml#fig272668_7">
Fig. 7</ref>) bildet einen langen, aufrecht stehenden Cylinder
(<ref rend="new" target="image_markup/tab272668.xml#fig272668_1">Fig. 1</ref>),
dessen Länge ungefähr das Fünffache seines Durchmessers beträgt, und welcher aus
zwei Theilen, einem oberen <hi rendition="#italic">A</hi> und einem unteren
<hi rendition="#italic">B</hi> zusammengesetzt ist. Es wird ohne Anwendung von
Wind gearbeitet.</p>
Image-Markup der Einzelfiguren auf den TafelnFür die Ausweisung der Einzelfiguren auf den Tafeln über Bildkoordinaten wurde das Tool des UVic Image markup Tool Projects genutzt.Jede Tafel wurde mittels der freien Software geöffnet und für die Einzelfiguren der Tafeln Bildkoordinaten definiert. Jede Einzelfigur erhält eine xml:id, auf die als Sprungziel aus dem Text verwiesen werden kann (s.o.).Auszug aus der Image-markup-XML-Datei mit eingetragenen Bildkoordinaten für die Einzelfiguren 1 und 2:
TabellenDie im Journal zahlreich vorkommenden Tabellenstrukturen wurden möglichst nah an der Vorlage umgesetzt. Tabellen mit deutlichem Gitternetz wurden als table rend="boxed" ausgezeichnet. Die Ausrichtung der Zelleninhalte wurde z. B. mittels cell rendition="right" näher bestimmt. Feinausrichtungen der Zellinhalte untereinander wurden darüber hinaus mittels geschützter Leerzeichen erhalten. Zeilenumbrüche innerhalb der Zellen wurden lb/ getaggt. In der zweiten Projektphase (Band 227 bis Ende) vermehrt vorkommende vertikal ausgerichtete Zellinhalte wurden als cell rendition="#v" ausgewiesen. Über mehrere Zellen reichende Inhalte wurden wie folgt dokumentiert: cell cols="2" oder cell rows="2". (Vgl. table)Beispielabbildung einer Tabelle mit vertikal ausgerichteten Zellinhalten:
Umsetzung im Quelltext:
Sehr komplexe oder über mehr als eine Seite hinausreichende Tabellen wurden teils im Bild wiedergegeben.Vorgehen bei geschweiften Klammern in TabellenGeschweifte Klammern innerhalb von Tabellen wurden in der ersten Projektphase (Bände 1-226) als Bildchen eingebunden. In der zweiten Projektphase (Bände 227 bis Ende) entfielen die Klammern zugunsten einer semantischen Nachbildung der Klammerung.Beispielabbildung einer Tabelle mit geschweifter Klammer:
Umsetzung im Quelltext:
Struktur der Quelltexte und ProjektarchitekturDas gedruckte Journal und seine digitale UmsetzungTextbändeDas gedruckte Journal setzt sich aus Artikeln und anderen Abschnitten zusammen, die in Heften gruppiert und zu Bänden zusammengefasst sind.Pro Band wurde eine XML Datei erzeugt. Dies entspricht in den allermeisten Fällen der Bindung der aus dem Bestand der SLUB Dresden digitalisierten Bände. Ausnahmen gibt es im Bandbereich 297 bis 341, innerhalb dessen sich im Bestand der SLUB mehrere Einbände finden, die mehr als einen Band zusammenfassen. Hier weicht die digitale Edition ab.Jeder Textband enthält ein textElement mit eigener Band ID, nach dem Muster "pj001" für Band 1. Jedes text-Element gruppiert am Anfang Titelseiten, Inhaltsverzeichnisse und Vorwörter, u. ä. in einem front. Das text-Element des Bandes enthält eine group, die pro Heft ein text enthält.Das text-Element des Heftes enthält eine group, die pro Artikel oder Abschnitt auf gleicher Ebene einen text enthält.Die auf mehreren Ebenen eingesetzten text-Elemente wurden über type näher bestimmt. (Vgl. "Legal values" für text)Die einzelnen Artikel des Polytechnischen Journals werden als Kernstück der digitalen Ausgabe verstanden und stellen die unterste text-Ebene dar. Neben den Artikeln finden sich auf dieser Ebene noch Patentverzeichnisse, Literaturverzeichnisse u. ä. Über die folgenden Werte von type werden die text-Elemente auf Artikelebene näher klassifiziert: art_undef, art_patent, art_patents, art_patentlist, art_literature, art_miscellanea. (Vgl. "Legal values" für text).Register, wirtschaftliche Rundschauen, Tafelanhänge u. ä. wurden als Backmatter aufgefasst und in den back von Heften oder Bänden gestellt. Jeder inhaltliche Abschnitt steht in einem eigenen div dass über das type näher klassifiziert wurde. (Vgl. "Legal values" zu div).Als Hauptzählung für Bände, Jahrgänge und Hefte wurde die durchgehende Zählung von Band 1 bis zum letzten Band der SLUB Dresden übernommen. Diese Werte wurden in den Textelementen eingetaggt. Daneben existieren Zählungen, die einer anderen Logik folgen. Z. B. werden Jahrgänge und Hefte auf Reihen bezogen durchgezählt. Um diese alternativen Chronologien abzubilden wurden milestones an den Beginn der Bände und soweit möglich der Hefte gesetzt. (Vgl. dazu "Legal values" der Attribute type und subtype von milestone).
AtlantenTafelanhänge zu den Bänden waren im Exemplar der SLUB entweder in die Textbände miteingebunden oder existieren im Bandbereich 229 bis 253 separat gebunden. Trägt der Textband die ID text xml:id="pj229" so erhielt der dazugehörige Atlas die Band-ID text xml:id="pj229a". RealindicesEs gibt vier ergänzende Registerbände. Diese wurden über IDs mit den Textbänden, auf die sie sich beziehen verlinkt. Je Registerband ist eine Band-ID nach dem Muster "ri001" für Realindexband 1 vergeben worden.Wissenschaftliche Anreicherung des Basic EncodingsPersonenIn den Artikelkopfdaten und in Patentverzeichnissen wurden über das Element persName Personen ausgezeichnet und über das Attribut role in ihrer Funktion als Autor oder Patentanmelder näher bestimmt. Über das Attribut ref wurde ein Verweis auf einen eindeutigen Personendatensatz in einer externen Datei realisiert.Beispiel für die Ausweisung Felix Abates als Autor eines Artikels in Band 133:
<text type="art_undef" subtype="publ_secondary" n="85" xml:id="ar133085">
<front><titlePart type="number" rendition="#center">LXXXV.</titlePart><titlePart type="main" rendition="#center">Thermographie oder Verfahren Gegenstände durch directes Abdrucken derselben abzubilden; von Hrn.
<persName role="author_orig" ref="../database/persons/persons.xml#pers06797">Felix Abate</persName>
in <placeName ref="../database/places/places.xml#pl002955">Neapel</placeName>.</titlePart>...</front>
</text>
Beispiel für die Ausweisung Felix Abates als Anmelder eines Patents in Band 128:
<div type="patent" xml:id="p128mi01_68">
<p>Dem <persName role="patent_app" ref="../database/persons/persons.xml#pers06797">Felix Abate</persName> in
George-street, Hampstead-road, und <persName role="patent_app" ref="../database/persons/persons.xml#pers19084">John Clero de Clerville</persName> in
<placeName ref="../database/places/places.xml#pl003040">Newman-street</placeName>: auf Verbesserungen im Zubereiten, Verzieren und Bedrucken
von Metallflächen. <hi rendition="#roman">Dd</hi>. <date when="1853-01-12" type="dd">12. Jan. 1853</date>.</p>
</div>
Korrespondierender Personendatensatz Felix Abates in zentraler Personendatei "persons.xml":
Auf dieser Datenbasis kann sich der User auf der Website über den verlinkten Autor und Patentanmelder den zentralen Personendatensatz einblenden lassen. Gelistet werden hier alle im Polytechnischen Journal vorhandenen weiteren Artikel und Patente dieser Person. (z. B. Felix Abate).Gesamtliste aller ausgewiesenen Autoren, bzw. Patentanmelder über PersonenverzeichnisOrteÄhnlich wie bei den Personennamen wurden in den Artikelkopfdaten Orte über placeName ausgezeichnet.Beispiel aus Band 30:
<text type="art_undef" subtype="publ_secondary" n="52" xml:id="ar030052"><front><titlePart type="number" rendition="#center">LII.</titlePart><titlePart type="main" rendition="#center">Ueber die von Herrn <persName role="originator" ref="../database/persons/persons.xml#pers00628">Guilbaud</persName> zu <placeName ref="../database/places/places.xml#pl002941">Nantes</placeName>
vorgeschlagene Gasbeleuchtung.</titlePart><titlePart type="sub" rendition="#center">Aus dem <bibl type="source"><title level="j" ref="../database/journals/journals.xml#jour0063">Recueil industriel</title>. N. 17. S.
185.</bibl></titlePart><titlePart type="sub" rendition="#center">(<hi rendition="#wide">Im
Auszuge</hi>.)</titlePart><titlePart type="column">Guilbaud's, vorgeschlagene Gasbeleuchtung.</titlePart></front>...</text>
Statt eines Links auf ein Ortsverzeichnis wird hier am rechten Fensterrand ein Google Maps Kartenausschnitt eingebunden, auf dem der markierte Ort projiziert wird (z. B. Nantes).Die Basis für diese Projektion sind in einer zentralen Datei zusammengestellte geographische Ortskoordinaten:
Wurden in einem Patentverzeichnissen mehrere Orte ausgezeichnet, werden sie alle auf einen einzelnen Kartenausschnitt projiziert. (z. B. Band 10)QuellenIn einer zentralen Datei wurden bibliographische Informationen zu Literaturangaben in den Artikeln gesammelt (Quellenverzeichnis). Testweise wurden die bibliographischen Datensätze über die ZDB-ID mit dem Katalog der Zeitschriftendatenbank verlinkt.Bibliographischer Datensatz zu den "Annalen für Gewerbe und Bauwesen" in der zentralen Datei "journals.xml":
PatenteIn Patentverzeichnissen wurden die einzelnen Patente über div type="patent" als solche gekennzeichnet und Information zum Land der Anmeldung im übergeordneten div auf Ebene des Patentverzeichnisses mitgegeben:
<div type="misc_patents" subtype="english" xml:id="mi010092_2"><head rendition="#center">Verzeichniß der zu London am 18. Maͤrz ertheilten Patente.</head><head rendition="#center">Aus dem <hi rendition="#roman">Repertory of Arts, Manufactures et Agriculture. N.</hi> 251. April. 1823. S. 319.</head><div type="patent" xml:id="p010092_94"><p>Dem <persName role="patent_app" ref="../database/persons/persons.xml#pers14835">Georg Emannel
Harpur</persName> und <persName role="patent_app" ref="../database/persons/persons.xml#pers01024">Benjamin Baylis</persName>, Maschinisten zu <placeName ref="../database/places/places.xml#pl004594">Weeden</placeName>, Northamptonshire; auf
eine Methode Maschinen in Bewegung zu sezen.</p></div>...</div>
Da auch Orte ausgezeichnet wurden, lassen sich nun alle ausgezeichneten Patente komfortabel nach Land oder Dekade gruppieren (vgl. Patentverzeichnis).AnhangTechnische ProjektschemaspezifikationenFür die Module "tagdocs" und "gajii" wurden zunächst keine Restriktionen vorgenommen. Der Übersichtlichkeit halber wurden in allen anderen Modulen aber nur jene Elemente belassen, die im Projekt tatsächlich zum Einsatz kommen. Im Projekt nicht genutzte Elemente wurden aus den Modulen weitestgehend ausgeschlossen.Schlagworte für Tabellen und Textabbildungen, die Text enthalten, aber als Bild erfasst wurden. Die einzelnen Begriffe werden mit Semikolon getrennt gelistet.Beispiel aus dem Polytechnischen Journal:
Projektspezifische Restriktionen/Definitionen:Das Attribut type des Elements ab wurde auf den Wert "keywords" eingeschränkt. Hier wurden Findwörter für Tabellen und Textabbildungen, die Text enthalten aber als Bild umgesetzt wurden, erfasst.Abkürzungen von Personennamen.Beispiel aus dem Polytechnischen Journal:
<p>Quecksilber greift auch mit der Zeit Platin an und <hi rendition="#italic">Mann</hi>
bringt aus diesem Grunde beide Platindrähte ausserhalb des Quecksilbers an. [...]
und zum Quecksilber klein ist.</p>
<p rendition="#italic #right">
<abbr type="name">Rr.</abbr>
</p>
Projektspezifische Restriktionen/Definitionen:das Attribut type des Elementes abbr wurde auf den Wert "name" eingeschränkt.Beispiel aus dem Polytechnischen Journal:
Projektspezifische Restriktionen/Definitionen:Mithilfe des Elements choice wurden offensichtliche Druckfehler verbessert und Korrekturen aus Corrigendaverzeichnissen umgesetzt. (Zu dieser Unterscheidung vgl. Restriktionen für das Element corr). Der Originalwert der Vorlage wurde jeweils im Element sic dokumentiert.Korrektur folgt einem Druckfehlerverzeichnis der Druckausgabe. In source wurde die ID der Seite des Verzeichnisses aufgenommen.Korrektur aufgrund eines eindeutigen Druckfehlers.
Projektspezifische Restriktionen/Definitionen:Das Attribut type des Elementes corr wurde je nach Art der Korrektur näher bestimmt.Ledereinband, LeerseitenvorlaufVorwort, EinleitungInhaltsverzeichnisWidmungstexteHefttiteldatenTextabschnitt innerhalb eines längeren Textes, 1. EbeneTextabschnitt innerhalb eines längeren Textes, 2. EbeneLiteraturverzeichnis, nicht weiter spezifiziertEinzelnes PatentHinweis auf Fortsetzung am Ende von ArtikelZusätze am Ende von Artikeln, z. B. von HerausgeberseiteVerlagswerbung, am Ende oder zu Beginn von HeftenAbschnitt mit Berichtigungen und Angaben zu DruckfehlernMiszellen, nicht weiter spezifiziertPatentverzeichnis auf Ebene der MiszellenPatentliste auf Ebene der MiszellenPatentliste auf Ebene der MiszellenLiteraturverzeichnis auf Ebene der MiszellenLiteraturverzeichnis als Unterabschnitt eines ArtikelsIndices u. ä.TafelanhangLeerseiten, LedereinbandWirtschaftliche Rundschau am Ende des Bands.Beispiel aus dem Polytechnischen Journal:Kopfzeilen von Heften
Projektspezifische Restriktionen/Definitionen:Die Attribute type und subtype des Elementes div wurden über die gelisteten Attributwerte näher klassifiziert (Vgl. jeweils die beigegebenen Definitionen.)Textabbildung, kleinTextabbildung, seitenfüllendTafelTextabbildung, die über weitere Einzelfiguren mit Einzelkoordinaten verfügt.Werbung, die als Bild erfasst wurde, zunächst ohne Erfassung von "keywords".Beispiel aus dem Polytechnischen Journal:Beispiel einer Werbeanzeige
<p>☛ Den beigefügten Prospekt der Firma <hi rendition="#wide">Chr. Berghöfer & Co</hi>. in Cassel empfehlen wir der geneigten Beachtung unserer Leser bestens.</p>
<figure rend="ad" xml:id="tx3241376a">
<graphic url="32199828Z/tx3241376a"/>
<figDesc>Textabbildung Bd. 324</figDesc>
</figure>
Projektspezifische Restriktionen/Definitionen:Das Attribut rend des Elementes figure wurde zur Unterscheidung von Abbildungstypen klassifiziert.Beispiel aus dem Polytechnischen Journal:
Projektspezifische Restriktionen/Definitionen:Zugunsten eines kürzeren Quelltextes wurde hier TeX-Notation innerhalb von formula ohne nähere Bestimmung genutzt. Die ausführliche Schreibweise wäre: formula notation="tex"Beispiel aus dem Polytechnischen Journal:
<item><hi rendition="#bold">Schaufelradflieger</hi>. (s. Luftschiffahrt)</item>
Projektspezifische Restriktionen/Definitionen:Die Attribute rendition und rend des Elementes hi finden hier Anwendung. Der Wert von rendition verweist über eine ID auf ein rendition-Element im teiHeader. Dieser enthält eine CSS-Definition der beschriebenen Hervorhebung im Text.Register mit Namen- und SacheinträgenRegister enthält ausschließlich NamenRegister enthält ausschließlich SacheinträgeNachtragsregisterRegister von PatentinhabernRegister in separat gebundenen RealindicesNicht in Namenregister eingebettetes Register der Bücherschau.Beispiel aus dem Polytechnischen Journal:
<list type="index" n="Namenregister" xml:id="reg324001">
<head rendition="#center">Namen-Register.</head>
<item><label rendition="#center"><cb/>A.</label><list type="simple"><item>Abraham, Selbsttätige Ableitung der Flüssigkeiten aus
den Dampfkammern der Verdampfapparate in der Zuckerindustrie * 394.</item><item>Adt, Papierrohre 204.</item></list>...</item>
</list>
Projektspezifische Restriktionen/Definitionen:Das Attribut type des Elementes list wird hier über die gelisteten Attributwerte zu Typen von Listen näher bestimmt.Alternative Zählungen zur Gesamtzählung (Band 1-374 und Jahrgänge 1820-1930)Alternative Zählung: Reihe/FolgeAlternative Zählung der Jahrgänge, chronologisch nach ihrer ReihenfolgeBandHeftBeispiel aus dem Polytechnischen Journal:
<text type="volume" xml:lang="german" n="324" xml:id="pj324">
<milestone type="additional-counting" subtype="age-group" ed="Neunzigster Jahrgang" unit="volume" n="324"/>
<milestone type="additional-counting" subtype="series" ed="Siebente Reihe" unit="volume" n="24"/>
<front><divGen type="toc"/><titlePage type="volume"><docTitle rendition="#center"><pb n="titlepage_recto" facs="32199828Z/00000005" xml:id="pj324_pbtitlepage_recto_001"/><titlePart type="main" rendition="#center">DINGLERS<lb/>Polytechnisches Journal</titlePart><titlePart type="sub" rendition="#center">Herausgegeben<lb/>von Geh. Reg.-Rat. Prof. M. Rudeloff in Groß-Lichterfelde W.</titlePart><titlePart type="sub" rendition="#center">Dozent an der Königl. Technischen Hochschule zu Berlin.</titlePart><titlePart type="year"><hi rendition="#bold">Neunzigster Jahrgang 1909.</hi></titlePart><titlePart type="volume" n="324">Band 324.</titlePart><titlePart type="sub" rendition="#center">Mit 1379 in den Text gedruckten Abbildungen.</titlePart></docTitle><docImprint rendition="#center">BERLIN W.<lb/>RICHARD DIETZE, VERLAGSBUCHHANDLUNG<lb/>(Dr. R. DIETZE).</docImprint><pb n="titlepage_verso" facs="32199828Z/00000006" xml:id="pj324_pbtitlepage_verso_001"/></titlePage>...</front>
</text>
Projektspezifische Restriktionen/Definitionen:Das Element milestone wird hier genutzt um alternative Zählungen über die Bände fortlaufen zu lassen, auch wenn einige Druckexemplare diese Information nicht selbst enthalten.Herausgeberanmerkung der digitalen Edition zu Besonderheiten der Druckvorlage.Beispiel aus dem Polytechnischen Journal:
Projektspezifische Restriktionen/Definitionen:Das optionale Attribut type wurde hier genutzt um Herausgeberkommentare zur digitalen Edition von den Anmerkungen der Druckausgabe deutlich abzuheben.Projektspezifische Restriktionen/Definitionen:Definiert die Funktion einer Person innerhalb des Textkontextes.Ledereinband-VorderseiteLedereinband-RückseiteVakatTitelseite-VorderseiteTitelseite-RückseiteWerbeseiten, die nicht texterkannt werdenBeispiel aus dem Polytechnischen Journal:
<div type="contents">
<pb n="III" facs="30130090Z/00000011" xml:id="pj010_pbIII_001"/>
<head rendition="#center #wide">Inhalt des zehnten Bandes.</head>
<list type="simple"><head rendition="#center #wide">Erstes Heft.</head><item><label>I.</label> Beschreibung der Maschine des Hrn. Bramah zu London zur Erzeugung der
Mineral-Wasser. Von Hrn. <hi rendition="#wide">Hoyau</hi>. Mit Abbildungen auf Tab. I. und II.
<ref target="#ar010001">1</ref></item>...</list>
</div>
Projektspezifische Restriktionen/Definitionen:Das Attribut n des Elements pb wurde genutzt um sowohl die gedruckten Seitenzahlen, als auch wenn kein gedruckter Wert vorlag, eine Bezeichnung für die typisierte erfasste Seite aufzunehmen.Zitat ist durch wiederholende Anführungszeichen am Zeilenanfang gekennzeichnet. Beispiel aus dem Polytechnischen Journal:
<p>
<q type="preline">„In welchem Abstande, und von welchen Dimensionen, wirken
Gegenstaͤnde dadurch nachtheilig auf Windmuͤhlen, daß sie diesen
Maschinen den Wind entziehen, und unter welchen Verhaͤltnissen kann man
solche als nicht nachtheilig ansehn?“</q>
</p>
Projektspezifische Restriktionen/Definitionen:Das optionale Attribut type wurde hier genutzt um Zitate zu kennzeichen, die zu Beginn jeder Zeile das Anführungszeichen wiederholen. Da im Projekt Zeilenumbrüche aufgelöst wurden, sind nur das öffnende und das schließende Anführungszeichen übernommen worden.Tabellen die in der Vorlage mit klarem Raster, bzw. Rahmen ausgestattet sind. Strukturiert komplexe TabelleninhalteBeispiel aus dem Polytechnischen Journal:
EinzelbandEinzelheftAbtheilungen in den RealindicesNicht weiter spezifizierter ArtikelArtikel als Besprechung eines PatentsPatentverzeichnis auf ArtikelebenePatentliste auf ArtikelebeneLiteraturverzeichnis auf ArtikelebeneMiszellenBeispiel aus dem Polytechnischen Journal:
Projektspezifische Restriktionen/Definitionen:Das text-Element wird auf Band-, Heft- und Artikelebene genutzt. Der Einsatz wird durch das type-Attribut näher bestimmt (Liste der "Legal values").Einzelbandtitelbaltt in der Logik der fortlaufenden BandzählungEinzelbandtitelblatt in der Logik der Reihen-/FolgenzählungTitelblatt des HeftesBeispiel aus dem Polytechnischen Journal:
<titlePage type="series">
<docTitle rendition="#center">
<pb n="titlepage_recto" facs="32422908Z/00000008" xml:id="pj272_pbtitlepage_recto_001"/>
<titlePart type="main" rendition="#center">Dingler's<lb/> Polytechnisches Journal.</titlePart>
<titlePart type="sub" rendition="#center"> Unter Mitwirkung von<lb/> Professor Dr. C. Engler in Karlsruhe<lb/>
herausgegeben von<lb/> Ingenieur A. Hollenberg und Docent Dr. H. Kast<lb/> in Stuttgart. in Karlsruhe.</titlePart>
<titlePart type="volume" n="272"> Sechste Reihe. Zweiundzwanzigster Band.</titlePart>
<titlePart type="year"><hi rendition="#wide">Jahrgang 1889</hi>.</titlePart>
<titlePart type="sub" rendition="#center"> Mit 142 in den Text gedruckten und 30 Tafeln Abbildungen. </titlePart>
</docTitle>
<docImprint rendition="#center"><hi rendition="#bold">Stuttgart</hi>.<lb/> Verlag der J. G. Cotta'schen
Buchhandlung Nachfolger.</docImprint>
</titlePage>
<titlePage type="volume">
<docTitle rendition="#center">
<pb n="titlepage_recto" facs="32422908Z/00000009" xml:id="pj272_pbtitlepage_recto_002"/>
<titlePart type="main" rendition="#center">Dingler's<lb/> Polytechnisches Journal.</titlePart>
<titlePart type="sub" rendition="#center"> Unter Mitwirkung von<lb/> Professor Dr. C. Engler in Karlsruhe<lb/>
herausgegeben von<lb/> Ingenieur A. Hollenberg und Docent Dr. H. Kast<lb/> in Stuttgart. in
Karlsruhe.</titlePart>
<titlePart type="volume" n="272"> Zweihundertzweiundsiebenzigster Band.</titlePart>
<titlePart type="year" n="1889"><hi rendition="#wide">Jahrgang 1889</hi>.</titlePart>
<titlePart type="sub" rendition="#center"> Mit 142 in den Text gedruckten und 30 Tafeln Abbildungen. </titlePart>
</docTitle>
<docImprint rendition="#center"><hi rendition="#bold">Stuttgart</hi>.<lb/> Verlag der J. G. Cotta'schen
Buchhandlung Nachfolger.</docImprint>
<pb n="titlepage_verso" facs="32422908Z/00000010" xml:id="pj272_pbtitlepage_verso_001"/>
</titlePage>
Projektspezifische Restriktionen/Definitionen:Unterschieden werden drei Typen von Titelblättern, definiert über die obige Liste von zugelassenen Werten.Hauptitel auf Band- oder ArtikelebeneTextzeile(n) mit Angabe der Bandnummer – in Attribut n die Zahl aufnehmenTextzeile zum Erscheinungsjahr, in Attribut n das Jahr aufnehmenRömische Nummer der ArtikelTitelzeile, nicht weiter definiertKurztitel, der in Kolumne verwandt wirdTextzeile(n) mit Angabe der Reihennummer – in Attribut n die Zahl aufnehmenTextzeile(n) mit Angabe der Bandnummer innerhalb der Reihe – in Attribut n die Zahl aufnehmenSection in Realindices (wird in METS/MODS-Transformation genutzt)Beispiel aus dem Polytechnischen Journal:
<text type="art_undef" n="1" xml:id="ar324001"><front><titlePart type="main" rendition="#center">Deutsche Verladevorrichtungen für Kohlen und Erz.</titlePart><titlePart type="sub" rendition="#center">Von Ingenieur <hi rendition="#bold">K. Drews</hi>, Posen.</titlePart><titlePart type="column">Deutsche Verladevorrichtungen für Kohlen und Erz.</titlePart></front>...</text>
Projektspezifische Restriktionen/Definitionen:Klassifizierung der Titelinformationen der einzelnen Artikel über definierte Werte auf obiger Liste.In der Druckvorlage unleserliche TextbereicheIn der Druckvorlage fehlerhaft gedruckte TextbereicheIn der Druckvorlage beschädigte TextbereicheBeispiel aus dem Polytechnischen Journal:
In der Vorlage unleserliche Stellen
<p>Die um <unclear reason="damage"><gap/></unclear> 50 Minuten angeheizte
Maschine wurde von 10 Uhr 16 Minuten bis
<unclear reason="damage"><gap/></unclear> Uhr 16 Minuten mit einer
<hi rendition="#italic">Brauer'</hi>schen Bremse nach Abstellung des
<unclear reason="illegible">Regu</unclear>lators gebremst. Die Beschickung des
Ofens erfolgte durch einen französischen Heizer mit abgewogenem Brennstoff.</p>
Projektspezifische Restriktionen/Definitionen:das Element wurde projektübergreifend genutzt um unleserliche/beschädigte Stellen in der Druckvorlage zu kennzeichnen und über die gelisteten Attributwerte näher zu klassifizieren.DanksagungDiese Datei basiert auf den Errungenschaften der TEI Guidelines und der hier angebotenen Tools und Mailinglisten.Many thanks to the institutions and individuals responsible for sharing
their experience and expertise for the benefit of the TEI community at large.