Frühjahrstagung 2024 Doku Ex Machina - Nutzung von künstlicher Intelligenz und Automatisierung in der Mediendokumentation - 22.04.2024 - 24.04.2024 () - © iStock / imaginima
© iStock / imaginima

Künstliche Intelligenz trifft auf Mediendokumentation

Künstliche Intelligenz trifft auf Mediendokumentation

Erfahrungen und Perspektiven aus dem TIB AV-Portal

Die Mediendokumentation hat sich durch den technologischen Fortschritt stark verändert; von anfänglich aufwendiger manueller Arbeit hin zu modernen KI-Methoden, die Genauigkeit und Effizienz in der Medienanalyse deutlich verbessern und menschliche Arbeit bei Routineaufgaben reduzieren. Das Videoportal der TIB vereint KI-Techniken und Automatisierung, um die Erfassung, Indexierung und Suche von audiovisuellen Inhalten zu optimieren. Zu den Funktionen gehören eine Shot Boundary Detection für die Videosegmentierung, eine automatische Sprach- und Texterkennung für die Transkription gesprochener und eingeblendeter Texte, eine visuelle Konzepterkennung für die Annotation von Objekten sowie ein Named Entity Linking für die Verknüpfung der Metadaten mit einem kontrollierten Vokabular. Am Beispiel der automatischen Spracherkennung "Whisper" von OpenAI wird illustriert, wie ein Videoportal durch den Einsatz künstlicher Intelligenz seine Services verbessern kann. Es sollen aber auch Herausforderungen und Probleme erörtert werden, die mit der Implementierung einer solchen Lösung einhergehen.