Stand:
persistente URL: kreidefossilien.de/1677

Hathi Download Helper: Bücher von der Hathi Trust Library herunterladen

tags: hathitrust library, proxy, hathi download helper
Bild: Open Access (storefront) von Gideon Burton (flickr.com - wakingtiger); Lizenz: CC-BY-Sa 2.0 - http://creativecommons.org/licenses/by-sa/2.0/
Bild: Open Access (storefront) von Gideon Burton (flickr.com - wakingtiger); Lizenz: CC-BY-Sa 2.0 - http://creativecommons.org/licenses/by-sa/2.0/
Seit die Hathi Trust Library ihr Internetangebot umgestellt hat, ist es mit den gängigen CGI-Proxies nicht mehr möglich, Public-Domain-Bücher mit einem US-Proxy durchzublättern. Als Ergänzung zu den bisherigen Artikeln (1, 2, 3, 4 und 5) nun eine Anleitung, wie man automatisiert die gewünschte Veröffentlichung herunterladen kann. Vorraussetzung ist natürlich, dass Diese durch die Hathi Trust Library freigegeben wurde.

Kurzum zur Anleitung, wie man an ein Buch herankommt, ohne jede Einzelne Seite manuel einzeln abspeichern zu müssen. Zwar bietet die Hathi Trust Library den Download einzelner Seiten an, das komplette Werk kann jedoch nur über von Leuten heruntergeladen werden, die einer Partnereinrichtungen angehören. Durch die Möglichkeit einen Proxy zu benutzen, können mit dem Programm auch Bücher heruntergeladen werden, die in den USA Public-Domain sind, d.h. eigentlich alles, was vor 1923 erstmals veröffentlicht wurde. Viele dieser Werke sind jedoch nicht über eine nicht-US-amerikanische IP abrufbar.

1. Installation des Hathi Download Helpers

https://www.linux-apps.com/p/1131898

2. Auswahl eines passenden kostenfreien US-Proxies

eine große Auswahl ist hier zu finden: https://hidemyass.com/proxy-list/

Hidemyass Proxy Liste

Bei mir hat bisher nur die Verwendung eines Socks4/5 Proxy wirklich reibungslos funktioniert.

3. den passenden Katalogeintrag auf catalog.hathitrust.org aufrufen

Hathi Trust Katalog

Die URL, die in der Brower-Adressleiste angezeigt wird kopieren und Hathi Download Helper öffnen

4. passenden Proxy-Server und Port im Hathi Download Helper unter Tools/Proxy eintragen

... das Häkchen bei "use proxy server" setzen und rechts auf get book info drücken. Gegebenfalls müssen mehrere Proxies ausprobiert werden, falls es nicht klappt.

5. Download der gewünschten Seiten

Hathi DOwnload Helper: Download

Jetzt heißt es warten - es dauert mitunter (sehr) lange bis alle Seiten heruntergeladen werden.

6. fast Fertig

in diesem Beispiel fehlen noch viele Seiten

Die Bilder werden unter /images abgespeichert. In den Standardeinstellungen des Programms wird die PDF automatisch erstellt und ein "Speichern unter..." Dialog erscheint automatisch.

7. Fertig

Kommentare (9)

  1. Maniax:
    13. Juli 2013, 00:18 Uhr

    Als Alternative zu einem Proxy kann man auch "Hotspot Shield" benutzen, um auf US-Seiten zugreifen zu können. Dabei entfällt die lästige Suche nach einem funktionierenden Proxy und die Bandbreite ist i.d.R. auch besser.

    Antworten

  2. Markus:
    13. Juli 2013, 11:20 Uhr

    Ja unter 3. auf http://www.kreidefossilien.de/konglomerat/google-books-mit-us-proxy wurde bereits auf diese Variante hingewiesen.

    Also VPN aktivieren, HathiDownload Helper starten und ohne Häkchen bei "use proxy server" den Download starten.
    Wobei ich aber darauf hinweisen möchte, dass über diese VPN-Verbindung die KOMPLETTE Internetkommunikation "geschickt" wird - das also eine Frage des Vertrauens in den Anbieter ist. Für mich persönlich kommt das nicht in Frage.

    Antworten

  3. Markus:
    16. Juli 2013, 23:38 Uhr

    Die Scans können doch im neuen Design über einen Proxy angeschaut werden (Einzelbildmodus). Einfach auf das Dollarzeichen ($) klicken.
    siehe https://commons.wikimedia.org/wiki/File:Hathitrust_relaunch1.jpg

    Vorwärts und Rückwärts mit Klick auf den Button 2 und 3

    Antworten

  4. anynoym:
    27. Januar 2014, 14:42 Uhr

    Ein kostenfreier VPN-Dienst mit US-Server im Angebot ist unter http://www.vpnbook.com/ zu finden.
    Nach erfoglreicher VPN-Verbindung natürlich das Häkchen in "use proxy server" NICHT setzen.
    Mit diese Methode ist der Download schneller - es werden aber bei bestehender Verbindung ALLE Daten über den Server geschickt, also ggfl. das "private" Surfen im Internet einstellen. So ein (kostenfreier) Dienst ist nur bedingt vertrauenswürdig.

    Antworten

  5. OS:
    28. September 2015, 11:59 Uhr

    Bei mir geht Hathi Download Helper seid geraumer Zeit und auf verschiedenen Rechnern nicht mehr (Autoproxy produziert nur noch fails). Besteht das Problem auch bei anderen Usern und hat jemand eine Lösung dafür gefunden?

    Antworten

  6. Markus:
    30. September 2015, 10:09 Uhr

    Zur Zeit scheint HathiTrust auch bei den Webproxy nicht zu funktionieren - z.B. http://ipconceal.com Woran das liegt weiß ich nicht.

    Antworten

  7. Maniax:
    8. Juni 2016, 22:22 Uhr

    Es gibt eine neue Version des Hathi Download Helpers. Die Downloads funktionieren wieder.

    http://qt-apps.org/content/show.php/Hathi+Download+Helper?content=158702

    Antworten

    1. Markus:
      10. Juni 2016, 12:52 Uhr

      Danke ich schau es mir mal an.

      Antworten






Erlaubte Tags: Kommentar hinzufügen: