| Beteiligte Institutionen und andere Indikatoren zur Funktionsfähigkeit des Open-Source Projektes
|
| Name des Systems: |
HathiTrust Digital Library |
| Aktuelle Version: |
HathiTrust beinhaltet zahlreiche Anwendungen, jede mit eigenen versionierten Komponenten (z.B. Perl, MySQL, Linux). Bis Januar 2010 gab es noch keine kompletten Versionen dieser Anwendungen bzw. von HathiTrust als Ganzes. |
| Getestete Version: |
Siehe oben. |
| URL der Projekt-Homepage: |
http://www.hathitrust.org |
| Beteiligte Institutionen: |
Institutionengemeinschaft (http://www.hathitrust.org/partnership) |
| Projektlaufzeit seit: |
gegründet im Oktober 2009 |
| Langzeitverfügbarkeit: |
HathiTrust ist eine Kollaboration von 26 us-amerikanischen Forschungsinstituten (http://www.hathitrust.org/partnership). Es erhält von den Partnerinstitutionen eine Basisförderung und wird nicht aus Subventionen oder anderen zeitlich begrenzten Fördermitteln finanziert. Die anfängliche Finanzierung war für 5 Jahre vorgesehen (Januar 2008 bis Dezember 2012) einhergehend mit einem formalen Bericht über die Steuerung und dem bis 2011 laufenden Betrieb. Für Institutionen, die Inhalte im Repositorium gespeichert haben, ist es eine Möglichkeit der Langzeitarchivierung. Sitz des Repositoriums ist die Universität von Michigan inklusive einer Full-Mirror-Site mit Lastverteilung auf den Indianapolis Campus der Universität von Indiana. |
| Entwicklungsgrad: |
ausgereift |
| Lizenzierungsmodell: |
HathiTrust hat selbst keine Open Source-Lizenz, wurde aber unter Zuhilfenahme von Open Source-Technologie entwickelt (z.B. Pearl, MySQL, Solr, Linux). Derzeit konfiguriert HathiTrust eine Entwickler-Zone, in der alle Partner Zugriff auf den Quellcode haben und Modifikationen und Erweiterungen vornehmen können. |
| Weitere Dokumentation(Webliographie): |
Informationen über HathiTrust, inklusive Ziel und Zweck, Steuerung, Partnerinformationen, Aufsätze und Präsentationen, die Rechtsgrundlage, Konservierungsmöglichkeiten und -wege, API's und Gesichtspunkte zum Thema Haftung und technische Infrastruktur sind auf der Webseite http://www.hathitrust.org dargelegt. |
|
|
| Technische Anforderungen, Wartung, Skalierbarkeit und dokumentierte API's |
| Lokale Installation oder ASP: |
Eine Ausführung von HathiTrust mit Mirror in Indiana vorhanden. |
| Unterstützte Betriebssysteme: |
Linux |
| Hardware-Anforderungen: |
Herkömmliche Intel-basierte Server |
| Applikationsserver Anforderungen: |
N/A |
| Webserver Anforderungen: |
Apache |
| Primäre Programmiersprache: |
Perl |
| Weitere Programmiersprachen: |
Java |
| Datenbankserver Anforderungen: |
MySQL |
| Anwendungsframework: |
Die System- und Softwareentwicklung bei HathiTrust sind auf die Lösung spezieller Probleme angepasst (im Gegensatz zu ausführungsorientierter Software). So entstand eine modularisierte Architektur, in der seperate OAIS-Systeme verschiedene Funktionen ausführen (z.B. Objektaufnahme, Speicherung, Metadatenmanagement, Indexierung oder Weitergabe), aber als Einheit kommunizieren und interagieren. Die Aufteilung der funktionalen Komponenten des Repositoriums erlaubt ein schnelles Reagieren auf mögliche Probleme (bei Problemen mit der Aufnahme, der Speicherung oder dem Systemzugang werden die zuständigen Systeme lokalisiert und direkt kontaktiert) sowie eine Verteilung der Entwicklungskompetenzen unter den Partnerinstituten. Obwohl viele Repositoriensysteme und -services zentrale Server haben, bieten die modularisierte Architektur und die Orientierung an offenen Standards und Systemen Partnerinstituten die Möglichkeit, Services und Kernstücke für die Funktionalität des Repositoriums zu entwickeln. |
| Weitere Software-Anforderungen: |
Perl modules and libraries: Apache::Session Apache::Session::Generate::MD5 Apache::Session::Lock::MySQL Apache::Session::MySQL Apache::Session::Serialize::Storable Apache::Session::Store::DBI Apache::Session::Store::MySQL Archive::Zip Attribute::Handlers CGI::Carp::DebugScreen Compress::Zlib Config::Tiny Data::Page Date::Calc DBI DBI::Const::GetInfo::ANSI DBI::Const::GetInfo::ODBC DBI::Const::GetInfoType File::Slurp Geo::IP HTML::Template HTTP::Date HTTP::Headers HTTP::Message HTTP::Request HTTP::Response HTTP::Status Image::Magick LWP LWP::Debug LWP::MemberMixin LWP::Protocol LWP::Protocol::http LWP::UserAgent Mail::Mailer Net::HTTP Net::HTTP::Methods Term::ReadLine Term::ReadLine::Perl URI URI::Escape URI::_generic URI::_query URI::_server URI::http XML::LibXML XML::LibXML::Boolean XML::LibXML::Common XML::LibXML::Literal XML::LibXML::NodeList XML::LibXML::Number XML::LibXSLT XML::SAX::Exception XML::LibXML XML::LibXSLT |
| Erforderliche personelle Fähigkeiten: |
Wesentliche Kenntnisse über UNIX, Perl, Apache, MySQL |
| Interne Backup- und Wiederherstellungsfunktionen: |
Backup- und Wiederherstellungsfunktionalität wird auf der Systemebene bereit gestellt und besteht aus a) Dateisystem-Backup und b) Datenbank-Backup. Die Backup-Services werden derzeit vom Tivoli Storage Manager bereitgestellt. |
| Skalierbarkeit der Anwendung: |
Die Anwendungen sind schlank und werden durch zahlreiche Webserver bedient. Es können weitere Webserver installiert werden, um die Performance zu erhöhen. |
| Skalierbarkeit der Daten: |
HathiTrust verwendet als Speicher ein geclustertes Speichersystem, dass bis zu 5.2 PB misst, wenn dem Cluster neue Knoten hinzugefügt werden |
| API: Code-Erweiterbarkeit: |
HathiTrust verwendet ein CVS-Repositorium. An Partnerinstituten können Modifikationen von Entwicklern mit den erforderlichen Rechten vorgenommen werden. |
| API: Batch Ingest: |
Die Aufnahme wird durch GROOVE durchgeführt (Google Object-Oriented Validation Environment). GROOVE kann mehr als 500 000 Bände in einem Monat aufnehmen und es können zusätzliche Ingest Server hinzugefügt werden, um die Durchlaufleistung zu erhöhen. Obwohl es ursprünglich dazu geschrieben wurde Aufnahmen von Google aufzunehmen, fungiert GROOVE auch als für Inhalte anderer Anbieter. |
| API: Batch Ingest Formate: |
GROOVE kann derzeit TIFF, JPEG2000, UTF-8 OCR Text, und Koordinaten-OCR im HTML-Format von Google (hOCR), mit begefügten METS-Metadaten aufnehmen. |
| API: Batch Export: |
Die Daten-API von HathiTrust wird dazu genutzt Objektpakete vom Repositorium abzurufen, die Bilddateien und Metadaten für einzelne Bände oder Sammlungen von Bänden enthalten. Eine genaue Darstellung der API findet sich auf http://www.hathitrust.org/data_api. |
| API: Batch Export Formate: |
Formate, die im Repositorium gespeichert sind werden über die Daten-API exportiert. |
| API: Support von JSR 170: |
HathiTrust unterstützt JSR 170 nicht. |
| API: Support für OAI Harvesting (OAI-PMH): |
Öffentlich zugängliche Datensätze in HathiTrust können via OAI-PMH geharvested werden. Details finden sich auf http://www.hathitrust.org/data. |
| API: Support for eduSource Communication Layer (ECL): |
HathiTrust unterstützt kein ECL. |
| API: Support für weitere Web-Services: |
HathiTrust stellt limitierte Matadatenfiles für alle im Reposositorium befindlichen Bände im Netz zum Download zur Verfügung.( http://www.hathitrust.org/hathifiles). Die Metadaten können dazu verwendet werden, um vollständige bibliographische Datensätze von der OCLC oder der Universität von Michigan über Z39.50 abzurufen. |
|
|
| Einreichung, Peer-Reviewing und administrative Funktionen |
| Unterstützung von multiplen eigenständigen Zeitschriftentiteln: |
HathiTrust beinhaltet mehr als 5 Millionen einzelne Bände |
| Multiple Benutzerrollen (Rechtemanagement): |
Das Recht auf Änderungen im Repository-Code und -inhalt liegt bei einer kleinen Gruppe von Entwicklern und Administratoren und wird mit Unix-Zugangsrechten geregelt. |
| Konfigurierbare Rechtevergabe: |
Die Rechtevergabe ist hinsichtlich der Unix-Zugangsrechte konfigurierbar. |
| Autoreninitiierte Einreichung (Submission) |
N/A |
| Metadatenfelder konfigurierbar: |
N/A |
| Bearbeitungsworkflow (Editorial) konfigurierbar pro Zeitschriftentitel: |
N/A |
| Automatische eMail-Benachrichtigung für (Autoren, Herausgeber, Gutachter, etc.): |
N/A |
| Anpassbares Stylesheet-Design pro Zeitschriftentitel: |
Die Schnittstellen zum PageTurner und Collection Builder werden über XSL style sheets realisiert. Obwohl HathiTrust zurzeit eine einheitliche Schnittstelle für den gesamten Inhalt besitzt, können einige Sammlungen je nach Vorlieben der Nutzer gestaltet werden. Ein Beispiel dafür ist die Sammlung der University of Michigan Press: http://babel.hathitrust.org/cgi/mb?a=listis;c=622231186. |
| Versionierung: |
Im Repository werden keine Versionen des Inhalts gespeichert. Werden neue Inhalte hinzugefügt, werden die bestehenden gelöscht und anstelle des alten wird ein neues Objekt mit dem selben Modifier hinzugefügt. Diese Aktion jedoch wird in die PREMIS-Metadaten aufgenommen. |
| Archivierung: |
HathiTrust bietet Langzeitarchivierung und kuratorische Dienstleistungen für hinterlegte Inhalte an. Das beinhaltet die Repositoryadministration, die Metadatenverwaltung sowie die Speicherung und Migration von Inhalten. |
|
|
| Zugang, Formate und E-Commerce-Funktionen |
| Zugänglichkeit des Systems: |
Das HathiTrust-System und die Schnittstelle sind so entworfen, dass alle digitalisierten Materialien (ungeachtet des Copyrights) auch für Nutzer mit Handicaps (z.B. Sehschwächen oder Lernbehinderungen) zugänglich sind. Zusätzlich zu den zugänglichen Schnittstellen für die Anwendungen, aus denen HathiTrust besteht (den vorläufigen Katalog, Collection Builder und PageTurner) gibt es textbasierte Schnittstellen für den PageTurner und den Collection Builder, die wiederum auf die speziellen Bedürfnisse von Nutzern mit Behinderungen abgestimmt sind ( diese beinhalten Navigationstasten, Abschnittsmarker, beschreibende Metadaten an Stellen mit Bildern oder leeren Seiten und den adäquaten Gebrauch von Überschriften und Bezeichnungen). HathiTrust ist darüber hinaus so konfiguriert, dass es autorisierten Nutzern Volltextzugang gewährt (zur Unterstützung der Usability mit Screenreadern, digitalen Braillewerkzeugen etc.) ungeachtet des Copyrightstatus eines Werkes. HathiTrust ist im Internet frei verfügbar unter http://www.hathitrust.org. |
| Zugänglichkeit der Dokumentenausgabe: |
--- |
| Sprachunterstützung: |
In den Repositoryanwendungen und den dazugehörigen Datenbanken( Katalog, PageTurner, Collection Builder, erweiterte Suchfunktion) wird die Unicode-Kodierung (utf-8 basic multilingual plane) unterstützt. |
| Ausgabe in multiple Dokumentenformate: |
HathiTrust gibt Inhalte im User Interface als Page Images, OCR-Text oder im PDF Format aus. |
| Unterstützte Dokumentenformate: |
TIFF ITU G4, JPEG2000, UTF-8 Text |
| Plug-in-Anforderungen: |
--- |
| Usability: |
--- |
| Zitationslink: |
Jeder Band hat einer permanente URL, die durch den Handle-Service (http://handle.net/) generiert wird. |
| OpenURL-Wandler: |
HathiTrust wird derzeit als Ziel für SFX konfiguriert. |
| RSS feed: |
Ein RSS Feed der Suchergebnisse aus dem Katalog soll seit Februar 2010 verfügbar sein. |
| Digitales Rechtemanagement: |
HathiTrust führt eine automatische Überprüfung der Rechte bei Neueinträgen durch, die auf bibliographischen Daten basiert. Diese Rechte werden bei einem Update der bibliographischen Daten oder der Open-Access-Freigabe von Bänden durch den Rechteinhaber ggf. überschrieben nachdem der Copyright-Rieview stattgefunden hat. Der Gewährvertrag über die Open-Access-Freigabe von Bänden findet sich unter http://www.hathitrust.org/rights_management. Alle weiteren Informationen zum Thema "Rechte" ist in einer "Rechte"-Datenbank gespeichert (http://www.hathitrust.org/rights_database). |
| Volltextsuche und Auffindbarkeit: |
Die Volltextsuche für das gesamte Repository wurde am 19. November 2009 eingeführt. Sie ist unter http://catalog.hathitrust.org zu finden. |
| Verbundene Suche: |
HathiTrust arbeitet eng mit der OCLC zusammen, um einen Katalog für die Produktionsebene zu entwerfen. Dort soll es möglich sein, ganze HathiTrust-Sammlungen zu durchsuchen und die Suche auf allgemeine WorldCat-Sammlungen auszuweiten. |
| Authentifizierungsmechanismen: |
Authentifikation wird bei HathiTrust aus zwei Gründen vorgenommen: Für die Personalisierung (z.B. die Collection-Builder-Anwendung ) und für den Gebrauch oder Services, die eine Autorisierung benötigen (Mitarbeiteranwendungen, wie der Zugang zu den Werken für den Rechte-Review und Services für autorisierte Nutzer mit Behinderungen). Die Authentifikation wird derzeit für Angehörige von Partneruniversitäten über Shibboleth (http://www.hathitrust.org/shibboleth) realisiert. Nicht-Partner können die CoSign-Implementierung der University of Michigan nutzen, um permanente Sammlungen mit dem Collection Builder (http://babel.hathitrust.org/cgi/mb) zu erzeugen. |
| Abonnement-Service: |
Derzeit ist kein Abonnement-Service verfügbar. |
| E-Commerce Funktion: |
Bände, die von der University of Michigan Press beigesteuert werden, sind über die UM Press Website zum Print-on-Demand verfügbar. Lizenzfreie Bände, die von der University of Michigan digitalisiert wurden, sind für Print-on-Demand über Amazon.com und Expresso Book Machine verfügbar. |
| Kontextueller Support-Service: |
Feedback-Links und eine Kontakt-E-Mail-Adresse sind auf der Website zu finden. Die Nutzer werden an die entsprechenden Hilfedienste weitergeleitet(z.B. Copyright Informationen, technischer Support, Hilfe mit dem Metadaten-Download etc.). |
|
|
| Zusätzliche programmspezifische Kriterien: Sicherheit, Archivierung, Aggregation |
| Zugangskontrolle: |
Der Zugriff auf die Einträge wird über den Copyright-Status geregelt und den HathiTrust PageTurner gehandhabt. Eine Beschreibung der PageTurner Anwendung findet sich auf http://www.hathitrust.org/pageturner. |
| Nutzerverwaltung: |
HathiTrust führt Verzeichnisse von Mitarbeitern, die privilegierte Zugriffsrechte zu Inhalten im Repositorium haben und Listen mit User-Id's für personenbezogene Services (z.B. Collection Builder). Userprofile und weitere Informationen werden derzeit von der University of Michigan verwaltet, werden aber auf die jeweiligen Partner verteilt, wenn ein Shibboleth-Server installiert wird (siehe unter Authentifikationsmechanismen). |
| Policy: |
HathiTrust hält sich an die IT-Sicherheitsrichtlinien der Universitätsbibliothek von Michigan, wo es auch gehostet wird. Die Universitätsbibliothek ist Teil eines dezentralisierten Organisationsmodells, in dem die über die Universität verteilten Einheiten (von denen es eine ist) die hauptsächliche Verantwortung für die Planung und Gestaltung der Sicherheit innerhalb ihrer Einheit haben, jedoch von den übergeordneten Universitäts-IT-Security-Services (ITSS) koordiniert werden. |
| Dateneingabe: |
Inhalte werden bei HathiTrust via GROOVE (Google Return (Object-oriented) Validation Environment) eingegeben. GROOVE bearbeitet auch die Aufnahme und Validierung von Materialien, die nicht aus Google stammen. |
| Datenzugriff: |
Der Zugriff auf Inhalte wird über den HathiTrust PageTurner realisiert. Lizenzfreie Bände und Werke, deren Open-Access-Publikation durch die Rechteinhaber genehmigt wurde sind für jeden Nutzer mit einem Webbrowser zugänglich. Werke mit Copyright und jene mit undefinierbarem Copyright-Status können lediglich im Suchindex angezeigt werden (die Suchfunktion gibt Informationen über den Ort an dem sich Schlagwörter im Werk befinden wieder). Die HathiTrust Daten-API ist eine weitere Art, Zugang zu Inhalten in HathiTrust (http://www.hathitrust.org/data_api) zu bekommen. |
| Datenentfernung: |
Die Dateien, die digitale Inhalte abfassen, befinden sich in einem Ablagesystem innerhalb eines Verzeichnisses. Werden Objekte gelöscht (was nur ein einziges Mal bei einem Eintrag auf Wunsch eines Rechteinhabers geschehen ist) wird die Inhaltsdatei gelöscht und an ihrer Stelle ein "Grabstein" erstellt, als Markierung für einen einst existierenden Inhalt. |
| Metadatenverwaltung: |
Bibliographische Metadaten werden mit einem Integrated Library System (Aleph) verwaltet. Informationen zu Rechten wird in einer Rechte-Datenbank (http://www.hathitrust.org/rights_management) verwaltet. Konservierungs-, technische und strukturelle Metadaten sind für jedes Objekt in einer METS-Datei enthalten. Konservierungsmetadaten (PREMIS) werden geupdated wenn Veränderungen an einem Objekt vorgenommen werden. |
| Anlegen von Aggregationen: |
HathiTrust aggregiert für Verwaltungszwecke Objekte basierend auf Namensräumen, die verschiedene Materialquellen identifizieren (z.B., Objekte der Indiana University, der University of Michigan, Wisconsin, California, etc.). Der Collection Builder erlaubt den Nutzern die Erzeugung ihrer eigenen Objektaggregationen, ungeachtet dessen, wie diese im Repository strukturiert sind. |
| Entfernen von Aggregationen: |
Objekte können als Aggregate (als Teile davon oder getrennt von der Aggregation) vom Repository entfernt werden. Persönliche Sammlungen von Bänden, die mit dem Collection Builder generiert wurden, können gelöscht werden. Es ist auch möglich, einzelne Bände oder Gruppen von Bänden innerhalb dieser Sammlungen zu löschen. |
| Wechsel der Aggregationsgruppe: |
Eine Verbindung zu einem neuen Aggregat kann nur hergestellt werden, wenn ein Object Identifier geändert wird. Objekte können von einer Collection Builder-Sammlung in eine andere kopiert oder verschoben werden. |
| Aggregationseinträge finden: |
Die gesamte Objektsuche baut auf dem Namensraum des Objektes auf, wobei es möglich ist, die Identifier innerhalb eines Namensraumes aufzulisten oder den Namensraum zu finden, der zu einem Objekt gehört. Weiterhin gibt es die Möglichkeit, Suchergebnisse im HathiTrust-Katalog aufzufächern, um die Ergebnisse für Objekte einer bestimmten Institution zu begrenzen, was in den meisten Fällen auch mit den Namensräumen korrespondiert. Über das Webinterface können Collection Builder-Sammlungen gesucht und gefunden werden. |
| Sperren: |
Das Integrated-Library-System, welches derzeit arbeitet (Aleph) sperrt Beiträge, die sich in der Edition befinden. |
| Virtuelle Objektdarstellung: |
TIFF- und JPEG2000-Bilder, die sich im Repository befinden, werden dynamisch in das PNG-Format konvertiert, damit sie mit dem PageTurner betrachtet werden können. |
| Transaktionen: |
HathiTrust ist so konfiguriert, dass es große Transaktionen bezüglich seines Inhaltes erlaubt. Einige von diesen, die bereits stattgefunden haben sind die Modifikation von METS und PREMIS in Objektpaketen des gesamten Repositories. Objekte werden für Aufnahmezwecke routinemäßig ge- und entpackt und auf dem HathiTrust Interface angezeigt. |
|
| Zusammenfassung |
| Stärken: |
|
| Schwächen: |
|