Projektlogo

Titel
Darmstadt Knowledge Processing Software Repository (DKPro Core)
Kurzbeschreibung
DKPro Core ist eine Sammlung von Software-Komponenten zur Verarbeitung natürlicher Sprache (NLP) basierend auf dem Apache UIMA-Framework. Viele leistungsfähige NLP-Komponenten sind bereits frei verfügbar, und neue und verbesserte Komponenten werden kontinuierlich entwickelt und veröffentlicht. Diese Komponenten decken die gesamte Palette von Aufgaben in der Sprachtechnologie ab. DKPro Core enthält Wrapper für solche Drittanbieter-Tools ebenso wie NLP-Komponenten, die direkt am UKP Lab entwickelt wurden. DKPro Core bietet so NLP-Komponenten für eine Reihe von verschiedenen Anwendungsbereichen wie linguistische Vorverarbeitung, Information Retrieval oder semantische Textanalyse für Englisch und Deutsch. DKPro Core baut stark auf Hilfswerkzeugen wie uimaFIT, welches eine schnelle und einfache Entwicklung von NLP-Pipelines ermöglicht.
DKPro Core ist in zwei Lizensierungsvarianten verfügbar: Apache Software License (ASL) Version 2 sowie GNU Public License Version 3, wobei letztere Version zusätzliche Komponenten enthält.
Typ
Software
Software
Lizensierungsmodell
GNU Public License Version 3, Apache Software License Version 2
Nutzungsentgelt
kostenlos
Support vorhanden
Ja
Download (URL)
http://code.google.com/p/dkpro-core-gpl/, http://code.google.com/p/dkpro-core-asl/
Informations Website (URL)
http://www.ukp.tu-darmstadt.de/research/current-projects/dkpro/
Dokumentation (URL)
http://code.google.com/p/dkpro-core-asl/
Oder fachbereichsspezifisch? (Falls nicht generisch)
* generisch *
Anwendungsspezifische Funktion(en)
Technologie Apache UIMA, ASCII-Text (TXT), HTML, uimaFIT, XML
Modifizierungsmöglichkeit(en)
Der Quellcode kann (abhängig vom Lizensierungsmodell) modifiziert und erweitert werden.
Programmiersprache(n) Java
Dokumentenformat(e)
Nutzung externen Softwaresysteme / Dienstleistungen
DKPro Core nutzt (abhängig von der Lizenz) Tools und Bibliotheken von Drittanbietern.
Nachnutzung
DKPro Core bildet die Grundlage für diverse Projekte bei UKP und steht grundsätzlich allen Interessierten zur Verfügung.
Architektur (Text)
Apache UIMA bietet eine komponentenbasierte Architektur, in der Dokumente eingelesen und durch eine konfigurierbare Verarbeitungspipeline analysiert werden können. DKPro Core bietet einen Baukasten aufeinander abgestimmter Verarbeitungskomponenten, mit denen eine Vielzahl von Analyseszenarien abgebildet werden können.
Projekt