Information

Wo online ist der Text von Zeitungsartikeln aus dem 19. Jahrhundert transkribiert?


Ich versuche zu recherchieren und ein Korpus daraus zu erstellen, das in Englisch für durchschnittliche Laien vor 1900 geschrieben wurde und in Kanada, den USA oder Großbritannien veröffentlicht wurde. Als Stellvertreter für das gewöhnliche Schreiben habe ich Zeitungen gewählt.

Viele werden online gescannt, aber der Text belastet normalerweise das Auge beim Lesen. Gibt es Websites wie 100 Full Text Saskatchewan News Stories von 1884 - 2000, die den Text transkribiert und digitalisiert haben?

Ich brauche nicht alle Zeitungsartikel, da ich mich mit den wichtigsten begnügen würde.


Ein guter Ausgangspunkt wäre Ihre örtliche öffentliche oder wissenschaftliche Bibliothek. Es gibt eine Reihe von Herausgebern von Sammlungen historischer Zeitungen, die eine Textdurchsuchbarkeit bieten, was bedeutet, dass die Zeitungen gescannt und mit OCR bearbeitet wurden.

Eines davon ist das Zeitungsarchiv, das möglicherweise in Ihrer Bibliothek verfügbar ist und sich nicht auf das 19. Jahrhundert beschränkt, sondern die von Ihnen aufgeführten geografischen und chronologischen Parameter abdeckt.

Als Beispiel für eine hervorragende Quelle für das 19. Jahrhundert veröffentlicht die Gale Group, ein Unternehmen von Cengage Learning, eine Sammlung von Primärquellen mit dem Titel US-Zeitungen des 19. Jahrhunderts. Der Zugang ist nur per Abonnement möglich; Ihre örtliche öffentliche oder wissenschaftliche Bibliothek kann jedoch ein Abonnement haben, das sie den Inhabern des Bibliotheksausweises zur Verfügung stellt.

Gales Katalog der Primärquellen umfasst eine ganze Reihe von englischsprachigen Titeln des 19. Jahrhunderts. Ich habe mich für dieses entschieden, weil ich damit vertraut bin, es schon einmal benutzt habe und meine öffentliche Bibliothek den Zugang bietet.

Die Beschreibung von US-Zeitungen des 19. Jahrhunderts lautet:

Als im 19. Jahrhundert eine neue amerikanische Nation entstand, wurde der erste Entwurf der Geschichte von denen geschrieben, die sie erlebten, und sie von Küste zu Küste in Zeitungsseiten festgehalten. Die US-Zeitungen des neunzehnten Jahrhunderts bieten ein aktuelles Fenster zu Ereignissen, Kultur und dem täglichen Leben im Amerika des neunzehnten Jahrhunderts, das sowohl für professionelle als auch für allgemeine Forscher von Interesse ist. Auf 1,8 Millionen Seiten umfasst die Sammlung Publikationen aller Art, von den Parteizeitungen zu Beginn des 19. Große Zeitungen stehen neben denen, die von Afroamerikanern, amerikanischen Ureinwohnern, Frauenrechtsgruppen, Arbeitergruppen und der Konföderation herausgegeben werden. Die Titel wurden von führenden Wissenschaftlern der amerikanischen Presse des 19. Jahrhunderts ausgewählt, und die einzelnen Titel wurden mit Kopfnoten versehen.

Die Sammlung wurde mit OCR bearbeitet und der Text der Sammlung ist durchsuchbar. Forscher können auch nach Titel und/oder Veröffentlichungsdatum suchen oder die erweiterte Suche oder andere Recherchetools verwenden. Leser können ein Dokumentbild mit hervorgehobenem Suchtext, OCR-ed Klartext oder beides nebeneinander anzeigen.

Eine Suche nach "Baseball" findet beispielsweise diese 1859 New York Herald Artikel "Cricket versus Base Ball", dargestellt mit seinem OCRed-Klartext in diesem Bild:

Ich empfehle Ihnen, Ihre Suche in der Bibliothek zu beginnen. Viele Bibliotheken haben einen virtuellen Referenzdienst, einen AKA-Chat mit einem Bibliothekar oder Sie können ihnen eine E-Mail mit Ihrem Vorhaben senden.

Hinweis: Der Versuch, ein Korpus durch Massendownload von Text zu erstellen, kann urheberrechtliche oder andere rechtliche Beschränkungen beinhalten. Probenahme kann eine praktikable Alternative sein.


Schau das Video: How to Translate Text Online (November 2021).