Schuldaten
Woher kommen unsere Daten?
Grunddaten der Schulen
Die Basis aller Schuldaten stammt aus dem offiziellen Schulverzeichnis des Landes Berlin und wird automatisch aktualisiert.
Hauptdatenquelle
URL: https://www.bildung.berlin.de/Schulverzeichnis/
Was wird extrahiert:
- Schulname und Adresse
- Schulart (Gymnasium, Sekundarschule, Gemeinschaftsschule)
- Kontaktdaten (Telefon, E-Mail, Website)
- Bezirk und Schulnummer
- Öffnungszeiten der Verwaltung
Nachfragestatistiken
Um die Beliebtheit und Nachfrage nach Schulen zu verstehen, sammeln wir Daten aus verschiedenen Quellen.
Datenquellen für Nachfragestatistiken:
Sekundarschulen Berlin
Verfügbare Plätze vs. Erstwünsche für das aktuelle SchuljahrGymnasium Berlin
Nachfragestatistiken für GymnasienWas wird extrahiert:
- Anzahl verfügbarer Plätze
- Anzahl Erstwünsche (Erstwahl)
- Nachfragequote (Verhältnis Bewerber zu Plätzen)
- Historische Daten der letzten Jahre
Tage der offenen Tür
Wir durchsuchen automatisch die Schulwebsites nach Terminen für Tage der offenen Tür. Unser System läuft täglich um 03:00 Uhr und durchsucht automatisch alle verfügbaren Quellen.
Scraping-Methoden:
Phase 1: Strukturierte Suche
Schnelle Extraktion von Terminen aus strukturierten Seiten der Schulbezirke.
Quellen:
Bezirksseiten mit standardisierten Terminlisten
Phase 2: Regex-basierte Suche
Fallback-Methode für individuelle Schulwebsites mit verschiedenen Formaten.
Technik:
KI-gestützte Datumserkennung und -parsing
Gesuchte Begriffe:
- "Tag der offenen Tür"
- "Tage der offenen Tür"
- "Tag der offenen Türe"
- "Offene Tür"
- "Informationstag"
- "Schnuppertag"