Aus Ihrer Aufnahme entsteht ein annotiertes Video plus Diagramme, in denen Sie Blickkontakt, Körperhaltung, Sprechtempo und mehr nachvollziehen können.
VideoAnalyse ist ein Forschungswerkzeug des Zentrums für Hochschullehre der Universität Bayreuth. Es ermöglicht Lehrenden und Studierenden, Videoaufnahmen von Präsentationen oder simulierten Prüfungsgesprächen automatisiert auswerten zu lassen.
Die Analyse umfasst unter anderem Körpersprache, Gestik, Blickkontakt, Sprechverhalten und optional eine KI-gestützte Emotionserkennung. Ziel ist es, konstruktives Feedback zur Verbesserung der eigenen Vortragskompetenz zu erhalten.
Webcam und optional Bildschirm aufzeichnen, dann zur Analyse hochladen.
Keine Software-Installation nötig. Der Kompatibilitäts-Check prüft vorab, ob Kamera, Mikrofon und Browser-Audio funktionieren.
Aufnahme startenBereits vorhandene Aufnahme (MP4, WebM, MOV) zur Analyse einreichen.
Laden Sie eine bestehende Videodatei hoch. Die Analyse startet automatisch und Sie erhalten Ihr Feedback per E-Mail.
Video hochladenSie nehmen Ihren Vortrag per Webcam auf oder laden ein bestehendes Video hoch. Optional können Sie den Bildschirm parallel aufzeichnen.
Automatische Auswertung von Körperhaltung, Gestik, Blickrichtung, Sprechpausen, Lautstärke und optional Mimik/Emotionen. Die Verarbeitung dauert wenige Minuten.
Sie erhalten per E-Mail einen Link zu Ihren Ergebnissen mit interaktiven Diagrammen, einer transkribierten Textversion und optional einem KI-Coaching-Bericht.
Nach der Analyse erhalten Sie ein interaktives Feedback-Dashboard. Hier sehen Sie beispielhaft die verschiedenen Auswertungsbereiche:
Skelett-Overlay zeigt Körperhaltung, Gestik und Blickrichtung in Echtzeit
Interaktive Charts mit Zoom, Video-Cursor und Kalibrierung
Evidenzbasierte Bewertung nach wissenschaftlichen Normen
Farbcodierte Verbesserungsvorschläge direkt im Transkript
Detaillierte Metriken mit Benchmark-Vergleich
Persönliches Coaching-Feedback von Claude (Anthropic)
Kombinierte Bewertung aus Stimme, Blick, Sprache, Gestik und Mimik — mit Moment-Highlights für souveräne Stellen und Verbesserungspotenzial
Video mit Texteinblendungen an Schlüsselmomenten — zeigt, wann Sicherheit steigt oder sinkt
10 diverse Frames labeln, damit die Software Ihre individuelle Blickrichtung exakt erkennt
Start- und Endzeit setzen, damit nur der relevante Ausschnitt analysiert wird — keine verzerrten Daten durch das Reinlaufen
Pro Analyse-Abschnitt Daumen hoch/runter + Kommentare. Ihr Feedback hilft uns, die Software zu verbessern
Die optionale Emotionsanalyse nutzt ein neuronales Netz (HSEmotion), um aus Gesichtsausdrücken emotionale Zustände wie Freude, Überraschung, Konzentration oder Anspannung zu erkennen. Diese Daten werden ausschließlich statistisch aggregiert dargestellt und dienen der Selbstreflexion.
Wichtig: Die Emotionserkennung ist ein Näherungsverfahren. Sie bildet keine inneren Gefühlszustände ab, sondern interpretiert sichtbare Gesichtsausdrücke. Die Ergebnisse sind als Orientierungshilfe zu verstehen, nicht als psychologische Diagnose.
Die Verordnung (EU) 2024/1689 (AI Act) stuft Emotionserkennungssysteme am Arbeitsplatz und in Bildungseinrichtungen als besonders sensibel ein (Art. 5 Abs. 1 lit. f). Der Einsatz ist nur unter strengen Bedingungen zulässig.
Im Rahmen dieses Projekts gelten folgende Schutzmaßnahmen:
Die Nutzung dieses Angebots ist vollständig freiwillig. Es gibt keine Verpflichtung, Videos aufzunehmen oder zur Analyse hochzuladen. Alle optionalen Funktionen (Emotionsanalyse, KI-Coaching) müssen aktiv zugeschaltet werden.
Alle hochgeladenen Videos und Analyseergebnisse werden nach 14 Tagen automatisch gelöscht. Danach sind weder das Video noch die Analysedaten abrufbar. Eine vorzeitige Löschung kann jederzeit über das Admin-Panel angefordert werden.
Die Verarbeitung erfolgt auf einem dedizierten Server der Universität Bayreuth. Es werden keine Daten an Dritte weitergegeben. Die KI-Coaching-Funktion (optional) nutzt die Claude API von Anthropic; dabei wird ausschließlich der transkribierte Text übermittelt, keine Videoaufnahmen.
Diese Webseite verwendet keine Cookies, kein Tracking und keine externen Analysedienste. Es werden keine personenbezogenen Daten erhoben, die über die für den Upload notwendige E-Mail-Adresse hinausgehen.
VideoAnalyse kombiniert spezialisierte KI-Modelle und Open-Source-Bibliotheken für eine umfassende Analyse:
| Bereich | Technologie | Aufgabe |
|---|---|---|
| Körperhaltung & Gestik | MediaPipe (Google) | Körper-Pose (Skelett-Punkte), Gesichts-Netz (468 Punkte), Iris-Tracking |
| Spracherkennung | faster-whisper (Systran) | Sprache-zu-Text (Transkript), Wort-basierte Füllworterkennung |
| Emotionserkennung | HSEmotion (HSE) | Emotionsklassifikation aus Gesichtsausdrücken (Freude, Neutral, Trauer, Ärger u. a.) |
| Blickrichtung | L2CS-Net (ResNet-34) | Blickwinkel-Schätzung (Yaw = Drehung um senkrechte Achse, Pitch = Neigung nach oben/unten) aus dem Gesichtsausschnitt |
| Mimik (Action Units) | py-feat (Cosanlab) | Action Units = kleinste sichtbare Gesichtsmuskel-Bewegungen nach dem Facial Action Coding System (FACS); py-feat erkennt sie automatisch |
| Stimmanalyse | openSMILE (audEERING) | Akustische Merkmale nach eGeMAPS-Standard (extended Geneva Minimalistic Acoustic Parameter Set): Tonhöhe, Lautstärke, Jitter = Tonhöhen-Schwankung, Shimmer = Lautstärke-Schwankung, HNR = Harmonics-to-Noise Ratio (Verhältnis harmonischer Anteile zu Rauschen) |
| Stimmqualität | Parselmouth/Praat | Stimmqualitätsmetriken auf Basis von Praat (Standard-Software der Sprechwissenschaft) |
| Füllwörter (Audio) | Eigenes Verfahren (ZHL UBT, auf eGeMAPS-Basis) | Eigenes Verfahren: erkennt „ähm“ / „uh“ aus akustischen Merkmalen (eGeMAPS) statt aus dem Transkript — zuverlässiger als reine Wort-Erkennung |
| Akzent & Drei-Kanal-Kohärenz | Eigenes Verfahren (ZHL UBT) | Eigenes Verfahren: misst, ob Stimm-Akzent, Gestik und Pause beim Sprechen zusammenpassen (Drei-Kanal-Kohärenz) |
| Hinwendung zur Präsentation | Eigenes Verfahren (ZHL UBT) | Eigenes Verfahren: erkennt aus Hand-, Blick- und Körperrichtung, wann sich die sprechende Person zum Publikum bzw. zur Präsentation (Folien/Tafel) zuwendet |
| KI-Coaching | Claude (Anthropic) | Sprachqualitätsanalyse, persönliches Coaching — mit Zero-Data-Retention-Vereinbarung (engl. für „keine Daten-Speicherung“): die Inhalte werden nicht gespeichert und nicht für KI-Training verwendet |
| Videoverarbeitung | OpenCV + FFmpeg | Einzelbild-Verarbeitung, Video-Kodierung |
| Diagramme | Chart.js | Interaktive Zeitverlaufs-Visualisierung |
| GPU-Beschleunigung (Grafikkarten-Rechnen) | NVIDIA CUDA 12.1 | Beschleunigung der KI-Berechnung auf NVIDIA-Grafikkarten |
| Framework | FastAPI + Python | Backend-Schnittstelle (API = Programmierschnittstelle) |
Universität Bayreuth
Zentrum für Hochschullehre (ZHL)
Universitätsstraße 30
95447 Bayreuth
Zentrum für Hochschullehre (ZHL)
Universität Bayreuth
Die Universität Bayreuth ist eine Körperschaft des öffentlichen Rechts. Sie wird gesetzlich vertreten durch den Präsidenten.
Bayerisches Staatsministerium für Wissenschaft und Kunst