Dokumente & Medien
Wissen steckt oft in Dateien, die eine KI nicht direkt verarbeiten kann – PDFs, Office-Dokumente, Bilder oder Audioaufnahmen. Die Dokument- und Medien-Dienste verwandeln dieses Material in sauberen, nutzbaren Text und in maschinell verstehbare Beschreibungen.
Was sind die Dokument- & Medien-Dienste?
Diese Servicefamilie extrahiert und konvertiert Inhalte aus Dateien aller Art. Aus einem Dokument wird strukturierter Text (z. B. Markdown), aus einem gescannten Blatt wird durchsuchbarer Text, aus einem Bild eine Beschreibung und aus einer Audioaufnahme ein Transkript. So macht ihr eure Dateien anschlussfähig für alle weiteren Dienste im Hub.
Funktionen und Möglichkeiten
- Dokumente zu Markdown/Text: Hochwertige Umwandlung von PDF, Word, PowerPoint und Excel – inklusive Tabellen und Bildern.
- Texterkennung (OCR): Text aus gescannten Dokumenten und Bildern herauslösen.
- Seitenweise Extraktion: Einzelne Seiten oder Abschnitte gezielt auslesen.
- Audio transkribieren: Gesprochene Sprache in Text umwandeln – auch bei längeren Aufnahmen.
- Bilder beschreiben (Alt-Text): Visuelle Inhalte automatisch in Worte fassen und damit auffindbar machen.
- Bilder erzeugen: Auf Basis einer Textbeschreibung neue Bilder generieren.
- Produktkataloge erschließen: Strukturierte Informationen aus Katalog-Dokumenten gewinnen.
Typische Einsatzszenarien
- Eure PDF-Sammlungen für die semantische Suche vorbereiten.
- Gescannte Altdokumente durchsuchbar machen.
- Meetings oder Interviews als Text verfügbar machen.
- Bildmaterial barrierearm und auffindbar bereitstellen.
Zusätzliche Hinweise
- Diese Dienste bilden häufig den ersten Schritt: Erst nach der Aufbereitung folgen die semantische Anreicherung und die Recherche.
- Aufwendige Konvertierungen laufen typischerweise im Hintergrund und melden ihr Ergebnis per Rückmeldung (Webhook), siehe Integration & Betrieb.
Weiter: Wissen aus dem Web