Zum Inhalt

Konfigurations-/Basis-Modell

Das Konfigurations-/Basis-Modell ist eine grundlegende Komponente deines DATAMIMIC-Projekts und dient als Basis für die Einrichtung und Konfiguration verbundener Systeme, einschließlich der Festlegung systemweiter Einstellungen, Umgebungsdetails und eingebundener externer Dateien.

Beispiel Konfigurationsmodell

Betrachte das folgende Beispiel eines DATAMIMIC Konfigurationsmodells:

datamimic.xml
1
2
3
4
5
6
7
8
9
<setup multiprocessing="True">
    <database id="sourceDB" system="source_oracle" />
    <database id="targetDB" system="target_postgres" />
    <mongodb id="target_mongodb" />

    <!-- Das folgende Modell erstellt Beispieldatensätze in der MongoDB -->
    <include uri="1_select_subset.xml" />
    <include uri="2_obfuscate.xml" />
</setup>

In diesem Beispiel:

  • multiprocessing="True" zeigt die Verwendung von Multiprocessing für die gleichzeitige Datengenerierung an.
  • <database>-Elemente werden verwendet, um Datenbankkonfigurationen für Quell- und Zielsysteme zu definieren, einschließlich "source_oracle" und "target_postgres".
  • <mongodb> wird verwendet, um die MongoDB-Konfiguration zu definieren.
  • <include>-Elemente verweisen auf externe XML-Dateien (1_select_subset.xml und 2_obfuscate.xml) zur Definition von Datengenerierungs- und Verarbeitungsaufgaben.

Dieses Konfigurationsmodell bereitet die Bühne für dein DATAMIMIC-Projekt, indem es dir ermöglicht, verschiedene Systeme zu konfigurieren und zu verbinden, Umgebungsdetails anzugeben und bei Bedarf externe Konfigurationen einzubinden.

Es ist wichtig, das 'Konfigurations-/Basis-Modell' an die spezifischen Anforderungen deines Projekts anzupassen und es an die Systeme und Datenbanken anzupassen, mit denen du arbeitest.

<setup>

Das <setup>-Element ist die Wurzel des Konfigurations-/Basis-Modells und definiert die allgemeine Einrichtung für den Datengenerierungsprozess.

Attribute

  • multiprocessing: Gibt an, ob Multiprocessing aktiviert ist. Werte können "True" oder "False" sein. Standard ist "False".
  • defaultSeparator: Definiert den Standardtrenner beim Lesen der Datenquelle (wie csv). Übliche Werte sind "|", ";", oder ",". Standard ist "|".
  • defaultDataset: Gibt das Standard-Dataset an (z