KIGVI: AUTOMATISCHE KI-GESTÜTZTE GENERIERUNG VON VIDEOREPORTAGEN
Auf einen Blick
Forschungsprojekt |
KIGVI: Automatische KI-gestützte Generierung von Videoreportagen |
---|---|
Fachbereich |
Ingenieurwissenschaften |
Leitung |
|
Beteiligte |
Jori Hinderfeld Prof. Dr. Till Dannewald Prof. Dr. Matthias Kowald |
Ansprechpartner Forschungsförderung |
Dr. Michael Anton |
Projektpartner |
Qvest Media GmbH |
Fördermittelgeber |
BMBF (FH-Kooperativ 2019) |
Laufzeit |
01.05.2021 – 31.10.2025 |
Projektbeschreibung
Ziel des Projekts ist eine innovative Lösung zur KI-basierten Erstellung von Reportagen, die aus Videosequenzen geeignete Abschnitte extrahiert und zu einem sendefähigen Beitrag komponiert. In sozialen Netzwerken, aber auch auf Nachrichtenportalen, ersetzen zunehmend kurze Videoreportagen konventionelle Textbeiträge, um die Aufmerksamkeit der Nutzer zu gewinnen. Für Anbieter von Videoinhalten ist daher eine kostengünstige und effiziente Produktion kurzer Videoreportagen besonders wichtig. Die Erstellung von Videoreportagen erfolgt bisher manuell, was mit großem Zeitaufwand und hohen Kosten verbunden ist.
Im Rahmen des Projektes soll daher ein System entwickelt werden, das die Qualitätsbewertung und die Komposition zu einer sendefähigen Reportage automatisch durchführen kann. Dabei lässt sich die Entwicklung in zwei Kernthemen unterteilen. Zum einen ein KI-Modell, mit dem aus vorliegenden Videosequenzen geeignete Videoabschnitte extrahiert werden und zum anderen ein weiteres Modell, das aus den extrahierten Abschnitten die Videoreportage erzeugt. Dazu sollen für die extrahierten Videoabschnitte automatisch geeignete Parameter geschätzt werden, die relevante Qualitätsmerkmale beschreiben. Neben rein technischen Merkmalen, wie Bildauflösung und Konformität zu Videostandards, sollen auch inhaltliche und stilistische Merkmale definiert und entsprechende Parameter geschätzt werden. Hierzu zählen zum Beispiel die Kategorisierung der Abschnitte in „Hintergrundmaterial“, „Mitschnitt“, „Interview“ oder „Original-Ton-Sequenz“, oder die Einhaltung des „Goldenen Schnittes“ im Bild. Anhand der geschätzten Parameter sollen die zugehörigen Videoabschnitte mit dem zweiten KI-Modell zu einer sendefähigen Reportage komponiert werden. Dabei sollen insbesondere Genre-abhängige Musterabläufe für Reportagen berücksichtigt werden, die in der Regel unterschiedlich sind, wie etwa für Sport-Nachrichten, Produktvorstellungen oder Politik-Beiträge.