POLIZEI STRESSI — Daten & Statistiken

Demonstrationen pro Monat

Alle bei der Berliner Versammlungsbehörde angemeldeten Versammlungen, aggregiert pro Monat.

Demos nach Postleitzahl

PLZ-Gebiete

Verteilung nach Postleitzahl der Anmeldung. Zuordnung zu Bezirken über PLZ-Mapping.

Top-Themen pro Jahr

Top-15 Themen pro Jahr. Gruppierung via HDBSCAN-Clustering (min_cluster_size 20) auf text-embedding-3-large Vektoren (1536D). Labels: GPT-4o.

Wochentag-Verteilung

Verteilung aller Versammlungen auf Wochentage, basierend auf dem angemeldeten Startdatum.

Uhrzeitverteilung

Verteilung der angemeldeten Startuhrzeiten über den Tag (volle Stunden).

Demo-Dauer-Verteilung

Dauer berechnet aus angemeldeter Start- und Endzeit.

Wochenende vs. Werktag

Jahresvergleich: Anzahl Versammlungen an Werktagen vs. Wochenenden.

Jahresvergleich — Monatsmuster

Monatsweise Überlagerung aller Jahre zum Erkennen saisonaler Muster.

Saisonale Muster

Demos pro Kalendertag (alle Jahre summiert)

Heatmap: Versammlungen pro Kalendertag, über alle Jahre summiert.

Aktivste Wochen

Versammlungen pro Kalenderwoche. Top-5-Peaks hervorgehoben.

Häufigste Demo-Orte

Die 25 häufigsten Versammlungsorte (Ort-Feld der Anmeldung) als Treemap.

Anmeldezeit vor Event

Zeitspanne zwischen Ersterfassung im Versammlungsregister und dem Veranstaltungsdatum.

Themenanalyse

Politische Themencluster und deren Verteilung

Nahost-Cluster seit 2021

Keyword-Filter: gaza, palästina, palestin, palestine, israel, hamas, zionist, zionismus, nakba, intifada, westbank. Monatliche Zählung aller Treffer (jedes Event wird nur einmal gezählt, auch bei mehreren Keyword-Treffern).

Themen-Cluster im Zeitverlauf

Keyword-basierte Zuordnung zu frei definierbaren Themenclustern. Nicht vom Global Filter betroffen.

Bezirk × Thema

Welche Themen dominieren in welchem Bezirk?

Heatmap: HDBSCAN-Themencluster × 12 Berliner Bezirke. Logarithmische Farbskala. Gleiche Cluster wie Themenlandkarte (UMAP).

Neue vs. wiederkehrende Themen

Wie viele unique Thementexte sind neu vs. aus Vorjahren bekannt?

Pro Jahr: erstmalige vs. aus Vorjahren bekannte unique Thementexte (exakter Stringvergleich).

Semantische Analyse

KI-basierte Themengruppierung via Embeddings (UMAP + HDBSCAN)

Themenlandkarte

Jeder Punkt = eine Versammlung. Nähe = thematische Ähnlichkeit. Farben = automatisch erkannte Cluster.

2D/3D-Projektion via UMAP (cosine, n_neighbors 15) auf text-embedding-3-large Embeddings (1536D). Clustering: HDBSCAN (min_cluster_size 20, min_samples 5), Noise per Nearest-Centroid zugeordnet. Labels: GPT-4o. Hinweis: Die Cluster basieren auf semantischer Ähnlichkeit der Texte — thematisch unterschiedliche Demos können im selben Cluster landen, wenn ihre Beschreibungen ähnliche Begriffe verwenden.