Demonstrationen pro Monat
Alle bei der Berliner Versammlungsbehörde angemeldeten Versammlungen, aggregiert pro Monat.
Demos nach Postleitzahl
Verteilung nach Postleitzahl der Anmeldung. Zuordnung zu Bezirken über PLZ-Mapping.
Top-Themen pro Jahr
Top-15 Themen pro Jahr. Gruppierung via HDBSCAN-Clustering (min_cluster_size 20) auf text-embedding-3-large Vektoren (1536D). Labels: GPT-4o.
Wochentag-Verteilung
Verteilung aller Versammlungen auf Wochentage, basierend auf dem angemeldeten Startdatum.
Uhrzeitverteilung
Verteilung der angemeldeten Startuhrzeiten über den Tag (volle Stunden).
Demo-Dauer-Verteilung
Dauer berechnet aus angemeldeter Start- und Endzeit.
Wochenende vs. Werktag
Jahresvergleich: Anzahl Versammlungen an Werktagen vs. Wochenenden.
Jahresvergleich — Monatsmuster
Monatsweise Überlagerung aller Jahre zum Erkennen saisonaler Muster.
Saisonale Muster
Demos pro Kalendertag (alle Jahre summiert)
Heatmap: Versammlungen pro Kalendertag, über alle Jahre summiert.
Aktivste Wochen
Versammlungen pro Kalenderwoche. Top-5-Peaks hervorgehoben.
Häufigste Demo-Orte
Die 25 häufigsten Versammlungsorte (Ort-Feld der Anmeldung) als Treemap.
Anmeldezeit vor Event
Zeitspanne zwischen Ersterfassung im Versammlungsregister und dem Veranstaltungsdatum.
Themenanalyse
Politische Themencluster und deren Verteilung
Nahost-Cluster seit 2021
Keyword-Filter: gaza, palästina, palestin, palestine, israel, hamas, zionist, zionismus, nakba, intifada, westbank. Monatliche Zählung aller Treffer (jedes Event wird nur einmal gezählt, auch bei mehreren Keyword-Treffern).
Themen-Cluster im Zeitverlauf
Keyword-basierte Zuordnung zu frei definierbaren Themenclustern. Nicht vom Global Filter betroffen.
Bezirk × Thema
Welche Themen dominieren in welchem Bezirk?
Heatmap: HDBSCAN-Themencluster × 12 Berliner Bezirke. Logarithmische Farbskala. Gleiche Cluster wie Themenlandkarte (UMAP).
Neue vs. wiederkehrende Themen
Wie viele unique Thementexte sind neu vs. aus Vorjahren bekannt?
Pro Jahr: erstmalige vs. aus Vorjahren bekannte unique Thementexte (exakter Stringvergleich).
Semantische Analyse
KI-basierte Themengruppierung via Embeddings (UMAP + HDBSCAN)
Themenlandkarte
Jeder Punkt = eine Versammlung. Nähe = thematische Ähnlichkeit. Farben = automatisch erkannte Cluster.
2D/3D-Projektion via UMAP (cosine, n_neighbors 15) auf text-embedding-3-large Embeddings (1536D). Clustering: HDBSCAN (min_cluster_size 20, min_samples 5), Noise per Nearest-Centroid zugeordnet. Labels: GPT-4o. Hinweis: Die Cluster basieren auf semantischer Ähnlichkeit der Texte — thematisch unterschiedliche Demos können im selben Cluster landen, wenn ihre Beschreibungen ähnliche Begriffe verwenden.