Zum Inhalt

ML-Generator aus Datenbank-Metadaten

Diese Anleitung beschreibt den End-to-End-Flow: ML-Trainings-DSL-Artefakte aus Datenbank-Metadaten erzeugen, Training ausführen, persistierte Versionen in der ML-Generator-Ansicht prüfen und anschließend in der DATAMIMIC-DSL wiederverwenden.

Voraussetzungen

  1. Konfiguriere eine Datenbank-Umgebung unter Environments.
  2. Führe den Metadaten-Scan für diese Umgebung aus.
  3. Öffne die Datenbankansicht und stelle sicher, dass Tabellen/Spalten verfügbar sind.

1. ML-Trainings-Artefakt in der Datenbankansicht erstellen

  1. Wähle im Bereich Database workbench → Planning den Scope.
  2. Führe Plan subset aus (Preset-basierte Closure + Relationship-Validierung).
  3. Prüfe den Preflight-Status.
  4. Klicke in Generate artifacts auf Create ML.
  5. Setze Namensoptionen und erstelle das Modell-Artefakt.
  6. Führe das erzeugte DSL-Modell (mit <ml-train>-Knoten) aus, um Training zu starten und Modellversionen zu persistieren.

Details zu Planung und Scope findest du unter Automatisches Generieren eines Modells aus einer Datenbank.

Note

Die Trainingsdauer hängt von Tabellengröße, Feature-Komplexität und Runtime ab. Größere Trainingsläufe können mehr CPU/RAM und je nach Setup auch GPU-Ressourcen (zum Beispiel NVIDIA-Karten) benötigen.

2. Qualität und Versionen trainierter Modelle in der ML-Generator-Ansicht prüfen

Öffne ML-Gen über die obere Navigation.

Nur Modelle mit abgeschlossenem und persistiertem Training werden hier mit Versionen und Statistiken angezeigt.

Dort kannst du:

  • Generatoren links suchen und auswählen,
  • zwischen Versionen wechseln,
  • eine Version als Default setzen,
  • veraltete Versionen löschen,
  • Status, Utility/Privacy-KPIs und Drift-Indikatoren prüfen,
  • Full report, Export und Model metadata verwenden.
ML-Generator-Ansicht
ML-Generator-Ansicht: Qualitätsübersicht, Versionsauswahl und Versionsaktionen

3. ML-Generatoren in der DATAMIMIC-DSL wiederverwenden

Nach Training/Persistierung kannst du Modelle als Quelle in <generate> mit ml://... referenzieren.

1
2
3
4
5
<setup>
    <generate name="accounts_stage" count="1000" pageSize="200" source="ml://accounts_model" target="mapping">
        <key name="account_id" generator="IncrementGenerator(start=1)"/>
    </generate>
</setup>
DATAMIMIC-DSL mit ML-Generatoren
DSL-Flow: Modelle pro Tabelle trainieren und als ML-Quelle in Generate-Knoten nutzen

Operative Hinweise

  • Nutze stabile Subset-Planungsinputs für reproduzierbares Trainingsverhalten.
  • Pflege pro Generator eine validierte Default-Version für nachgelagerte DSL-Nutzung.
  • Trainiere neu, wenn sich Schema oder Datenverteilung relevant ändern.
  • Prüfe Utility/Privacy-Status, bevor du eine Version als Default setzt.
  • Betrachte erzeugte Empfehlungen und Modelle als Baseline, die projektspezifisch nachjustiert werden muss.

Verwandte Referenzen