Digitalisierung des Wissens - Teil 1: Urheberrechte und Google Books
tags: google, digitalisierung, e-books, downloads, archive.org, proxy1 Das Urheberrecht: gemeinfrei nach 70 Jahren und die Regel für Fotografien
Mittlerweile ist es in der breiten Öffentlichkeit angekommen, dass Google Bücher und Zeitschriften scannt und (noch) kostenlos zur Verfügung stellt. Im allgemeinen sind das Werke die gemeinfrei bzw. sich nach z.B. US-Recht in "public domain" (aus dem Copyright) befinden. In den meisten Europäischen Ländern wird ein Werk 70 Jahre nach dem Tod des letzten Urhebers gemeinfrei.
Beispiel:
Karl Wanderer starb 1945. Nach deutschem Recht wird sein Bestimmungsbuch "Die wichtigsten Tierversteinerungen aus der Kreide des Königreiches Sachsen" von 1909 ab dem 1.1.2016 gemeinfrei, d.h. für jeden frei verwendbar. Es beteht die Möglichkeit einen Reprint zu veröffentlichen, ohne irgendwelche Rechte Dritter beachten zu müssen. Das gilt natürlichen auch für seine anderen veröffentlichten Arbeiten.Ein bekannter Reprint eines gemeinfreien Werkes ist die Neuauflage der "Cephalopoden der oberen deutschen Kreide"[1], im Original von Clemens Schlüter (*1835 - †1906). Allerdings wurden dem Reprint Notizen und Überarbeitungen hinzugefügt. Das Urheberrecht dieser Ergänzungen haben die beiden Autoren (Scheer & Riegraf).
Die 70-Jahre Regel bei Büchern & Co. sowie bei sogenannten "Lichtbildwerken" bezieht sich also auf das Todesdatum des letztlebenden Autors (Urhebers), nicht dem etwaigen Erscheinungsdatum des Werkes. Es gibt jedoch eine Sonderregelung zu sogennanten "nachgelassenen Werken", bei denen es eine zusätzliche Schutzfrist nach einer (nachweislichen) Erstveröffentlichung gibt, obwohl der eigentliche Urheber bereits mehr als 70 Jahre verstorben sein kann.
Bei Bildern gibt es im deutschen Recht eine Unterscheidung in "Lichtbildwerk" und "Lichtbild". Je nach Schöpfungshöhe werden bis zu 70 Jahre (Lichtbildwerk; genügend hohe Schöpfungshöhe) nach Tod des Urhebers oder lediglich nur bis zu 50 Jahre (einfaches Lichtbild) nach Veröffentlichung (!) bzw. nach Erstellung veranschlagt. Ist bei einem Werk der Urheber nicht zu ermitteln ist es verwaist.
2. Google Books
Google Bücher/Buchsuche entstand 2004 und ist "eine Dienstleistung des US-amerikanischen Unternehmens Google Inc. mit dem Ziel, das in Büchern gespeicherte Wissen der Welt vorwiegend durch Digitalisierung für die Volltextsuche verfügbar zu machen" [2].
In Kooperation mit Bibliotheken hat der Internetriese bereits Millionen von Seiten gescannt bzw. zugänglich gemacht. Zwischenzeitlich Kooperieren Verlage und stellen nicht gemeinfreie Werke der Plattform zur Verfügung - allerdings oftmals nur in einem eingeschränkten Umfang.
Ein großes Plus ist die teilweise sehr gute Durchsuchbarkeit des gesamten Werkes, sofern dieses Google digital vorliegt, d.h. die Möglichkeit für Google bestand, an den Titeln eine Texterkennung durchzuführen (engl: OCR von Optical Character Recognition). Es scheint auch Einträge in der Datenbank zu geben, die lediglich von Katalogen übernommen wurden, ohne dass ein Digitalisat vorliegt. Der Download einer PDF oder (neuerdings) einer EPUB-Datei ist da natürlich nicht möglich. Die gleiche Einschränkung gilt für Titel die lediglich eingeschränkt sichtbar sind (Snippet-Ansicht) oder bei denen nur wenige Seiten - im Sinne einer "Leseprobe" - eingesehen werden können.
Zahlreiche, wöchentlich in der Rubrik "e-Book der Woche" erschienen gemeinfreien Werke auf kreidefossilien.de stammen aus den Beständen der Google Buchsuche. Wie jedoch einige Besucher sicherlich bemerkt haben, führen einige auf Google Books verlinkte Quellenangaben lediglich zum Katalogeintrag. Zumindest aus Deutschland (Europa) kann das (eigentlich digital vorliegende) Werk nicht betrachtet oder gar heruntergeladen werden. Leider ist die Politik von Google in dieser Sache sehr undurchsichtig und (in Grenzen) offenbar willkürlich.
Allerdings kann man das Problem umgehen, indem ein Proxy benutzt wird, der in den USA steht. Die Unterscheidung, ob ein Besucher aus Deutschland oder aus den USA zugreift, wird mithilfe der IP-Adresse gemacht. Bestimmte IP-Adressen werden nur in bestimmten Ländern zugewiesen. Ein normaler Benutzer aus Europa, wird sicherlich nie eine "US-amerikanische" IP-Adresse erhalten. Benutzer von Google Books aus den USA sehen also bei gemeinfreien bzw. sich im Public-Domain-Status befindlichen Werke unterschiedliche Seiten.
Beispiel #1
Das Werk von Karl Deninger (1878-1917) "Die Gastropoden der sächsischen Kreideformation" von 1905 von einer "deutschen" IP-Adresse aus auf Google Books[3]:Google sperrt den deutschen (europäischen) Besucher aus. Der Eintrag zu dem am 1.1.1988 (=1917+70 Jahre bzw. zum 1.1. des 71. Jahres) gemeinfrei gewordenem Werk ist mit "Keine Vorschau verfügbar" deklariert. Im Screenshot unten, derselbe Katalogeintrag von einer US-IP-Adresse aus aufgerufen. Das Buch ist vollständig einsehbar und als steht als PDF zur Verfügung.
2.1 Proxy-Server
Da sich an der "geografisch festgelegten" IP-Adresse eines normalen Benutzers nicht viel machen lässt, kann man mit einem Proxy ("Vermittler-Rechner") dennoch an die PDF eines solchen Werkes kommen. Eine Möglichkeit, ohne Einstellungen am Browser vornehmen zu müssen sind "Webproxy". Solche Webproxy sind im Prinzip normale Seiten mit einer Eingabemaske für Internetadressen. Diese Seiten fungieren als Vermittler zwischen dem eigenen Anschluss und in unserem Fall Google Books. Der gesamte Datenstrom des Benutzers verläuft über den Proxy. Natürlich nur solange man über diesen Webproxy surft - erkennbar an der regulären URL-Leiste des eigenen Browsers.
DIe Schwierigkeit besteht dabei allerdings, einen Server zu finden der a) relativ sicher ("vertrauenswürdig") zu seinen scheint und b) den Benutzern einen kontinuierlichen Datenstrom erlaubt, der nun mal bei einem Download einer 20MB-Datei entsteht. Viele kostenlose Proxy sind allerdings mit Werbung zugefplastert, sowie nach einigen Wochen bereits wieder vom Netz, also unbrauchbar. Die Verwendung von Download-Managern kann die Beschaffung der PDF-Dateien erleichtern.
Eine (aktuelle) Liste solcher Proxy finden sich bei http://de.wikisource.org/wiki/Benutzer:Konrad_Stein.
- Liste aufrufen
- Proxy auswählen (ggf. durchprobieren)
- URL von Google Books im Eingabefeld der Proxy-Seite eingeben.
- schauen, ob der Titel als PDF verfügbar ist
- downloaden
- anschließend Webproxy schließen bzw. die Seite verlassen (!)
Anmerkung: Man sollte es tunlichst vermeiden vertrauliche Daten bei Proxies unbekannter Herkunft zu einzugeben. Am besten man beschränkt sich auf die Umgehung der Sperre von Google.
Die Grenze, ab wann Google Titel vollständig zur Verfügung stellt, ist wohl auf 140 Jahre nach Erscheinen (im Internet u.a. als "moving wall" bezeichnet) festgelegt. Andere Anbieter digitaler Sammlungen (z.B. HathiTrust) verhalten sich im Übrigen ebenso wie Google - Benutzer werden mit der gleichen Methode ausgesperrt. Für Benutzer in den USA ist die Grenze 1923. Alle Werke, die nach 1923 erschienen sind, können auch aus den USA nicht heruntergeladen werden, zumindest nicht auf Google Books.
2.2 Alternativen zu Google Books
Das wohl größte Archiv digitalisierter gemeinfreier Werke neben dem von Google, befindet sich auf archive.org. Neben kompletter Webseiten und Musik enthält das Archiv zahlreiche, ebenfalls in Kooperation gescannte Bücher und Zeitschriften. Während Google neben einer Webansicht (gute Volltextsuche) nur PDF-Dateien (jedoch ohne die Volltextsuche) bzw. EPUB-Dateien zur Verfügung stellt, können von archive.org die Digitalisate in unterschiedlichsten Formaten heruntergeladen werden. Je nach gewünschter Qualität und/oder Beschränkung der eigenen Bandbreite.
Beispiel #2
Deninger, 1905. Die Gastropoden der sächsischen Kreideformation erschien in der Zeitschrift "Beiträge zur Paläontologie und Geologie Österreich-Ungarns und des Orients: Mitteilungen des Geologischen und Paläontologischen Institutes der Universität Wien".Unter http://www.archive.org/details/beitrgezurpal18univ findet sich der gescannte Band 18. Der Titel ist zugänglich ohne jegliche Beschränkung seitens des Anbieters (siehe oben).
Die Seiten können ebenfalls mit einem Klick auf "Read Online" im linken Kasten sofort betrachtet werden. Eine Volltextsuche ist ebenfalls möglich. Allerdings ist die Qualität im Vergleich zu der von Google Books schlechter. Bei Frakturschriften versagen beide Anbieter. Unter "All Files: HTTP" finden sich sogar die Originaldateien. In den ZIP-Dateien befinden sich die (unbearbeiteten) Bilder in sehr hoher Qualität. Ideal um Tafeln oder Abbildungen in bester Auflösung zu betrachten.
Bemerkung: Der Zeitschriftenband ist mit der Biodiversity Heritage Library (BHL) verknüpft ("The book is avaible with additional data"). Mit einem Klick darauf lassen sich einige andere Bände finden.
Auf archive.org finden sich außerdem zahlreiche Kopien, die sonst nur unter Google Books zu finden sind, ohne Zugangs-Beschränkung für europäische Nutzer.
Quellen:
- C.A. Schlüters' Cephalopoden der oberen deutschen Kreide von 1871-1876 als e-Book
- Wikipediaartikel über Google Bücher
- K. Deninger's Gastropoden der sächsischen Kreideformation bei Google, bei archive.org und direkt als e-Book (PDF)
Beim Nutzen des Hilfsdienst https://xyz2bbox.kreidefossilien.de bin ich auf das Problem gestoßen,… vor 1 Jahr, 3 Monaten
Blatt 42 (4840) Borna ist leider nicht korrekt verlinkt. vor 1 Jahr, 6 Monaten
Der Kockelsbergtunnel wird südlich wieder in die Strecke Berlin-Dresden einbinden, nicht auf… vor 2 Jahren, 9 Monaten
Sehr schöne Anleitung, danke! vor 3 Jahren, 7 Monaten
Digitalisat von Tafel II aus Schulze, 1770 in guter Qualität hinzugefügt. Quelle: https://books.google.de/books?id=nHJlAAAAcAAJ&pg=PA37 vor 4 Jahren, 6 Monaten