Erstellt:
Aktualisiert:
Permalink: kreidefossilien.de/1677

Hathi Download Helper: Bücher von der Hathi Trust Library herunterladen

tags: hathitrust library, proxy, hathi download helper
Bild: Open Access (storefront) von Gideon Burton (flickr.com - wakingtiger); Lizenz: CC-BY-Sa 2.0 - http://creativecommons.org/licenses/by-sa/2.0/
Bild: Open Access (storefront) von Gideon Burton (flickr.com - wakingtiger); Lizenz: CC-BY-Sa 2.0 - http://creativecommons.org/licenses/by-sa/2.0/
Seit die Hathi Trust Library ihr Internetangebot umgestellt hat, ist es mit den gängigen CGI-Proxies nicht mehr möglich, Public-Domain-Bücher mit einem US-Proxy durchzublättern. Als Ergänzung zu den bisherigen Artikeln (1, 2, 3, 4 und 5) nun eine Anleitung, wie man automatisiert die gewünschte Veröffentlichung herunterladen kann. Vorraussetzung ist natürlich, dass Diese durch die Hathi Trust Library freigegeben wurde.

Kurzum zur Anleitung, wie man an ein Buch herankommt, ohne jede Einzelne Seite manuel einzeln abspeichern zu müssen. Zwar bietet die Hathi Trust Library den Download einzelner Seiten an, das komplette Werk kann jedoch nur über von Leuten heruntergeladen werden, die einer Partnereinrichtungen angehören. Durch die Möglichkeit einen Proxy zu benutzen, können mit dem Programm auch Bücher heruntergeladen werden, die in den USA Public-Domain sind, d.h. eigentlich alles, was vor 1923 erstmals veröffentlicht wurde. Viele dieser Werke sind jedoch nicht über eine nicht-US-amerikanische IP abrufbar.

1. Installation des Hathi Download Helpers

https://www.linux-apps.com/p/1131898

2. Auswahl eines passenden kostenfreien US-Proxies

eine große Auswahl ist hier zu finden: https://hidemyass.com/proxy-list/

Hidemyass Proxy Liste

Bei mir hat bisher nur die Verwendung eines Socks4/5 Proxy wirklich reibungslos funktioniert.

3. den passenden Katalogeintrag auf catalog.hathitrust.org aufrufen

Hathi Trust Katalog

Die URL, die in der Brower-Adressleiste angezeigt wird kopieren und Hathi Download Helper öffnen

4. passenden Proxy-Server und Port im Hathi Download Helper unter Tools/Proxy eintragen

... das Häkchen bei "use proxy server" setzen und rechts auf get book info drücken. Gegebenfalls müssen mehrere Proxies ausprobiert werden, falls es nicht klappt.

5. Download der gewünschten Seiten

Hathi DOwnload Helper: Download

Jetzt heißt es warten - es dauert mitunter (sehr) lange bis alle Seiten heruntergeladen werden.

6. fast Fertig

in diesem Beispiel fehlen noch viele Seiten

Die Bilder werden unter /images abgespeichert. In den Standardeinstellungen des Programms wird die PDF automatisch erstellt und ein "Speichern unter..." Dialog erscheint automatisch.

7. Fertig






Erlaubte Tags: Kommentar hinzufügen: