Schuldaten

Woher kommen unsere Daten?

Grunddaten der Schulen

Die Basis aller Schuldaten stammt aus dem offiziellen Schulverzeichnis des Landes Berlin und wird automatisch aktualisiert.

Hauptdatenquelle

URL: https://www.bildung.berlin.de/Schulverzeichnis/

Was wird extrahiert:
  • Schulname und Adresse
  • Schulart (Gymnasium, Sekundarschule, Gemeinschaftsschule)
  • Kontaktdaten (Telefon, E-Mail, Website)
  • Bezirk und Schulnummer
  • Öffnungszeiten der Verwaltung

Nachfragestatistiken

Um die Beliebtheit und Nachfrage nach Schulen zu verstehen, sammeln wir Daten aus verschiedenen Quellen.

Datenquellen für Nachfragestatistiken:
Sekundarschulen Berlin

URL: https://www.sekundarschulen-berlin.de/nachfrage

Verfügbare Plätze vs. Erstwünsche für das aktuelle Schuljahr
Gymnasium Berlin

URL: https://www.gymnasium-berlin.net

Nachfragestatistiken für Gymnasien
Was wird extrahiert:
  • Anzahl verfügbarer Plätze
  • Anzahl Erstwünsche (Erstwahl)
  • Nachfragequote (Verhältnis Bewerber zu Plätzen)
  • Historische Daten der letzten Jahre

Tage der offenen Tür

Wir durchsuchen automatisch die Schulwebsites nach Terminen für Tage der offenen Tür. Unser System läuft täglich um 03:00 Uhr und durchsucht automatisch alle verfügbaren Quellen.

Scraping-Methoden:
Phase 1: Strukturierte Suche

Schnelle Extraktion von Terminen aus strukturierten Seiten der Schulbezirke.
Quellen: Bezirksseiten mit standardisierten Terminlisten

Phase 2: Regex-basierte Suche

Fallback-Methode für individuelle Schulwebsites mit verschiedenen Formaten.
Technik: KI-gestützte Datumserkennung und -parsing

Gesuchte Begriffe:
  • "Tag der offenen Tür"
  • "Tage der offenen Tür"
  • "Tag der offenen Türe"
  • "Offene Tür"
  • "Informationstag"
  • "Schnuppertag"