VideoAnalyse

So sieht eine Analyse aus

Aus Ihrer Aufnahme entsteht ein annotiertes Video plus Diagramme, in denen Sie Blickkontakt, Körperhaltung, Sprechtempo und mehr nachvollziehen können.

Was ist VideoAnalyse?

VideoAnalyse zeigt Ihnen anhand Ihrer eigenen Aufnahme, wie Ihr Vortrag wirkt: Blickkontakt, Gestik, Körperhaltung, Stimme und der Bezug zur Präsentation werden sichtbar gemacht – und in verständliches Feedback übersetzt.

Ein Forschungs- und Lernwerkzeug des Zentrums für Hochschullehre der Universität Bayreuth – für Lehrende und Studierende, die ihre Vortrags- und Rhetorikkompetenz weiterentwickeln möchten. Optional ist auch eine KI-gestützte Emotionserkennung verfügbar.

So funktioniert die Analyse

1. Aufnehmen oder hochladen

Sie nehmen Ihren Vortrag per Webcam auf oder laden ein bestehendes Video hoch. Optional können Sie den Bildschirm parallel aufzeichnen.

2. Automatisch analysieren

Das System erkennt Blickkontakt, Gestik, Körperhaltung, Pausen, Lautstärke und Sprechtempo. Sobald die Analyse fertig ist, erhalten Sie den Ergebnislink per E-Mail – Sie können die Seite zwischendurch schließen.

3. Feedback ansehen

Sie erhalten per E-Mail einen Link zu Ihren Ergebnissen mit interaktiven Diagrammen, einer transkribierten Textversion und optional einem KI-Coaching-Bericht.

So sieht Ihr Feedback aus

Nach der Analyse erhalten Sie ein interaktives Feedback-Dashboard. Hier sehen Sie beispielhaft die verschiedenen Auswertungsbereiche:

Annotiertes Video

Skelett-Overlay zeigt Körperhaltung, Gestik und Blickrichtung in Echtzeit

Sehen, wann etwas passiert

Interaktive Zeitleiste: springen Sie direkt zu Momenten mit viel Gestik, wenig Blickkontakt oder veränderter Stimme.

Rhetorische Analyse

Hinweise zu Verständlichkeit, Struktur und Wirkung Ihres Vortrags.

KI-Rhetorik-Check

Farbcodierte Verbesserungsvorschläge direkt im Transkript

Ihre wichtigsten Werte auf einen Blick

Blickkontakt, Sprechtempo, Gestik und Pausen – verständlich zusammengefasst in ein- und ausklappbaren Karten.

KI-Coaching

Verständliche Hinweise in Alltagssprache: was bereits gut wirkt und woran Sie konkret arbeiten können.

Sicherheits-Analyse (multimodal)

Kombinierte Bewertung aus Stimme, Blick, Sprache, Gestik und Mimik — mit Moment-Highlights für souveräne Stellen und Verbesserungspotenzial

Kommentiertes Video

Video mit Texteinblendungen an Schlüsselmomenten — zeigt, wann Sicherheit steigt oder sinkt

Blickkontakt-Kalibrierung

Kurze Kalibrierung, damit Ihr Blickkontakt zuverlässiger erkannt wird.

Video-Trimming beim Upload

Start- und Endzeit setzen, damit nur der relevante Ausschnitt analysiert wird — keine verzerrten Daten durch das Reinlaufen

Nutzer-Feedback

Pro Analyse-Abschnitt Daumen hoch/runter + Kommentare. Ihr Feedback hilft uns, die Software zu verbessern

Weitere Impressionen

Gestik-Aktivität (linke/rechte Hand)

Blickkontakt-Anteil im Zeitverlauf

Stimmanalyse (Tonhöhe, Lautstärke, Jitter, Shimmer, HNR)

Sprechtempo (Wörter/Minute)

Mimik (Lächeln, Überraschung etc.)

Emotionsanalyse (Freude, Neutral, Traurigkeit, Ärger)

Datenlöschung / Datenschutz

Emotionsanalyse

Die optionale Emotionsanalyse nutzt ein neuronales Netz (HSEmotion), um aus Gesichtsausdrücken emotionale Zustände wie Freude, Überraschung, Konzentration oder Anspannung zu erkennen. Diese Daten werden ausschließlich statistisch aggregiert dargestellt und dienen der Selbstreflexion.

Wichtig: Die Emotionserkennung ist ein Näherungsverfahren. Sie bildet keine inneren Gefühlszustände ab, sondern interpretiert sichtbare Gesichtsausdrücke. Die Ergebnisse sind als Orientierungshilfe zu verstehen, nicht als psychologische Diagnose.

Rechtliche Einordnung (EU/DSGVO)

Die Verordnung (EU) 2024/1689 (AI Act) stuft Emotionserkennungssysteme am Arbeitsplatz und in Bildungseinrichtungen als besonders sensibel ein (Art. 5 Abs. 1 lit. f). Der Einsatz ist nur unter strengen Bedingungen zulässig.

Im Rahmen dieses Projekts gelten folgende Schutzmaßnahmen:

Freiwilligkeit: Die Emotionsanalyse ist standardmäßig deaktiviert und muss vom Nutzenden bewusst aktiviert werden. Es besteht keinerlei Pflicht zur Nutzung.
Einwilligung: Durch das aktive Ankreuzen der Option erteilen Sie Ihre informierte Einwilligung gemäß Art. 6 Abs. 1 lit. a DSGVO.
Keine biometrische Identifizierung: Es findet keine Identifizierung oder Kategorisierung von Personen statt. Die Analyse wertet ausschließlich Gesichtsausdrücke innerhalb eines einzelnen Videos aus.
Zweckbindung: Die Daten werden ausschließlich für individuelles Feedback zur Vortragskompetenz verwendet.
Transparenz: Alle Analyseergebnisse sind für Sie einsehbar. Es erfolgt keine automatisierte Entscheidungsfindung.

Datenschutz und Freiwilligkeit

Freiwillig · automatische Löschung nach 14 Tagen · kein Tracking · Video & Audio bleiben auf deutscher Uni-Infrastruktur · KI-Coaching nur optional.

Vollständig freiwillig

Die Nutzung dieses Angebots ist vollständig freiwillig. Es gibt keine Verpflichtung, Videos aufzunehmen oder zur Analyse hochzuladen. Alle optionalen Funktionen (Emotionsanalyse, KI-Coaching) müssen aktiv zugeschaltet werden.

Löschung Ihrer Daten

Alle hochgeladenen Videos und Analyseergebnisse werden spätestens nach 14 Tagen automatisch gelöscht. Danach sind weder das Video noch die Analysedaten abrufbar. Eine sofortige Löschung können Sie jederzeit selbst auslösen – über den Button „Daten löschen“ auf Ihrer persönlichen Feedback-Seite. Dabei werden alle Dateien sofort entfernt; eine etwaige Kopie auf dem Analyse-Server wird innerhalb von etwa 15 Minuten ebenfalls gelöscht.

Verarbeitung, Speicherung und KI-Coaching

Die gesamte Videoanalyse läuft auf einem dedizierten Server im Zentrum für Hochschullehre (ZHL) der Universität Bayreuth. Die Webseite sowie die hochgeladenen Dateien und Ergebnisse werden auf einem in unserem Auftrag betriebenen Server der Hetzner Online GmbH in einem deutschen Rechenzentrum (Falkenstein) gehostet – als Auftragsverarbeiter nach Art. 28 DSGVO, der die Daten ausschließlich nach Weisung der Universität und nicht für eigene Zwecke verarbeitet. Beide Server stehen in Deutschland; Ihr Video, einzelne Bilder und die Audiospur verlassen diese Infrastruktur nicht. Eine Übermittlung an einen externen Anbieter findet ausschließlich dann statt, wenn Sie das optionale KI-Coaching mit dem Anbieter „Claude“ (Anthropic, USA) aktiv auswählen. Übermittelt werden dann ein Auszug des Transkripts sowie die berechneten Messwerte (z. B. Sprechtempo, Blickkontakt in Prozent) – niemals das Video, einzelne Bilder, die Audiodatei oder Ihr Name bzw. Ihre E-Mail-Adresse. Anthropic verarbeitet diese Daten unter einer Zero-Data-Retention-Vereinbarung (keine Speicherung, keine Nutzung für KI-Training). Alternativ können Sie für das Coaching ein lokales, auf dem Uni-Server betriebenes KI-Modell wählen – dann verlässt kein Datum die Universität.

Kein Tracking, keine Weitergabe an Dritte

Diese Webseite verwendet kein Tracking, keine Werbe- oder Analyse-Cookies und keine externen Analysedienste. Alle Gestaltungs- und Skript-Bibliotheken werden direkt vom Uni-Server ausgeliefert – es werden keine Inhalte von externen Servern (z. B. CDNs) nachgeladen, sodass auch Ihre IP-Adresse nicht an Dritte gelangt. Technisch notwendig sind lediglich ein Cookie für Ihre Sprachauswahl sowie ein Sitzungs-Cookie zur Absicherung von Formularen. Darüber hinaus werden keine personenbezogenen Daten erhoben, die über die für die Rückmeldung notwendige E-Mail-Adresse hinausgehen.

Verwendete Technologien

Die Analyse kombiniert Video-, Sprach- und Stimmmerkmale. Die Ergebnisse dienen der Selbstreflexion und ersetzen keine Bewertung durch Lehrende. Technische Details:

Technische Details anzeigen

Bereich	Technologie	Aufgabe
Körperhaltung & Gestik	MediaPipe (Google)	Körper-Pose (Skelett-Punkte), Gesichts-Netz (468 Punkte), Iris-Tracking
Spracherkennung	faster-whisper (Systran)	Sprache-zu-Text (Transkript), Wort-basierte Füllworterkennung
Emotionserkennung	HSEmotion (HSE)	Emotionsklassifikation aus Gesichtsausdrücken (Freude, Neutral, Trauer, Ärger u. a.)
Blickrichtung	L2CS-Net (ResNet-34)	Blickwinkel-Schätzung (Yaw = Drehung um senkrechte Achse, Pitch = Neigung nach oben/unten) aus dem Gesichtsausschnitt
Mimik (Action Units)	py-feat (Cosanlab)	Action Units = kleinste sichtbare Gesichtsmuskel-Bewegungen nach dem Facial Action Coding System (FACS); py-feat erkennt sie automatisch
Stimmanalyse	openSMILE (audEERING)	Akustische Merkmale nach eGeMAPS-Standard (extended Geneva Minimalistic Acoustic Parameter Set): Tonhöhe, Lautstärke, Jitter = Tonhöhen-Schwankung, Shimmer = Lautstärke-Schwankung, HNR = Harmonics-to-Noise Ratio (Verhältnis harmonischer Anteile zu Rauschen)
Stimmqualität	Parselmouth/Praat	Stimmqualitätsmetriken auf Basis von Praat (Standard-Software der Sprechwissenschaft)
Füllwörter (Audio)	Eigenes Verfahren (ZHL UBT, auf eGeMAPS-Basis)	Eigenes Verfahren: erkennt „ähm“ / „uh“ aus akustischen Merkmalen (eGeMAPS) statt aus dem Transkript — zuverlässiger als reine Wort-Erkennung
Akzent & Drei-Kanal-Kohärenz	Eigenes Verfahren (ZHL UBT)	Eigenes Verfahren: misst, ob Stimm-Akzent, Gestik und Pause beim Sprechen zusammenpassen (Drei-Kanal-Kohärenz)
Hinwendung zur Präsentation	Eigenes Verfahren (ZHL UBT)	Eigenes Verfahren: erkennt aus Hand-, Blick- und Körperrichtung, wann sich die sprechende Person zum Publikum bzw. zur Präsentation (Folien/Tafel) zuwendet
KI-Coaching	Claude (Anthropic)	Sprachqualitätsanalyse und persönliches Coaching auf Basis von übermitteltem Text und Messwerten (kein Video/Audio) – vertraglich unter einer Zero-Data-Retention-Vereinbarung (engl. für „keine Daten-Speicherung“): die Inhalte werden nicht gespeichert und nicht für KI-Training verwendet.
Videoverarbeitung	OpenCV + FFmpeg	Einzelbild-Verarbeitung, Video-Kodierung
Diagramme	Chart.js	Interaktive Zeitverlaufs-Visualisierung
GPU-Beschleunigung (Grafikkarten-Rechnen)	NVIDIA CUDA 12.1	Beschleunigung der KI-Berechnung auf NVIDIA-Grafikkarten
Framework	FastAPI + Python	Backend-Schnittstelle (API = Programmierschnittstelle)

Impressum

Träger

Universität Bayreuth

Zentrum für Hochschullehre (ZHL)

Universitätsstraße 30

95447 Bayreuth

Kontakt

paul.doelle@uni-bayreuth.de

www.zhl.uni-bayreuth.de

Verantwortlich für den Inhalt

Zentrum für Hochschullehre (ZHL)
Universität Bayreuth

Rechtsform

Die Universität Bayreuth ist eine Körperschaft des öffentlichen Rechts. Sie wird gesetzlich vertreten durch den Präsidenten.

Zuständige Aufsichtsbehörde

Bayerisches Staatsministerium für Wissenschaft und Kunst