• +49-(0)721-402485-12
Ihre Experten für XML, XQuery und XML-Datenbanken

Octopus – die innovative Transformation Engine

Ein Büromitarbeiter zeigt seine Zufriedenheit über verschiedene Dokumentformate wie Word, PDF, ePub und HTML, die von einem lächelnden Octopus präsentiert werden.

Octopus ist eine innovative Plattform, die aus vielen Jahren gemeinsamer Entwicklungszusammenarbeit zwischen der parsQube GmbH und ihrer Schwesterfirma data2type GmbH hervorgegangen ist.

Sie besteht aus mehreren Komponenten, bietet eine Vielzahl von Funktionen und gilt als umfassendes Werkzeug für die Dokumentenverarbeitung. So ermöglicht die Plattform beispielsweise 

  • die Umwandlung von etwa 200 verschiedenen Formaten (z.B. PDF, Word, Excel usw.) in XML und andere Formate (z.B. ePub, WebBook, Word, DITA, HTML, Scorm usw.)
  • die Erzeugung und Auslesung von Texten sowie deren semantische Anreicherung

Weitere Kernfunktionen sind Übersetzungsdienste, Spracherkennung, OCR-Dienste und verschiedene KI-Anwendungen.

Octopus zeichnet sich vor allem durch seine Flexibilität bei der Verarbeitung von Dokumenten aus. Inhalte können unabhängig von ihrer ursprünglichen Formatierung oder Semantik verarbeitet werden, was eine einheitliche Handhabung gewährleistet. Die Plattform ermöglicht die Analyse von PDF-Dokumenten und erfasst Informationen, die später in das Originaldokument zurückgeschrieben werden können. Dabei werden Strukturen wie Listen, Tabellen, Bilder und Verweise in XML abgebildet. Octopus bietet auch KI-gestützte Funktionen wie Keyword-Generierung, Textzusammenfassungen, Link-Erkennung und Bildbeschreibungen, die vor allem für redaktionelle Prozesse hilfreich sind.

Die Plattform ist zudem in der Lage, externe Dienste einzubinden und auszuführen, was ihre Einsatzmöglichkeiten erweitert. Die Anwendungsbereiche sind vielfältig und umfassen unter anderem die Erstellung von Chatbots, das Feintuning von KI-Modellen und Regex-basierte Unterstützung. Die vielseitige Octopus-Suite ist darauf ausgelegt, stabile und gut funktionierende Prozesse zu automatisieren und stellt REST-APIs bereit, die eine einfache Integration in andere Systeme ermöglichen. Die verschiedenen, abtrennbaren Bereiche der Suite können auch unabhängig voneinander genutzt werden.