Software

❌ Testdaten für TDM ❌ Umfassendes Testdatenmanagement-Framework für DevOps, MLOps und DataOps bereitstellen ❗

Testdatenmanagement: Erzeugen von authentischen Daten! In diesem Artikel wird gezeigt, wie man realitätsnahe Daten synthetisiert, um ein vollständiges Datenbankschema mit referenzieller Integrität in einem einzigen Schritt zu befüllen.

IRI RowGen generiert Datensätze in verschiedenen Formaten, darunter Flat-Files, Datenbanktabellen und Berichte. Dies geschieht entweder durch zufällige Erzeugung von Werten in bestimmten Datentypen, Bereichen und Verteilungen oder durch die zufällige Auswahl von Daten aus Nachschlagetabellen oder externen "Set-Dateien". Die Wahl zwischen diesen beiden Methoden kann ad hoc getroffen werden oder basierend auf Spaltenregeln, die über verschiedene Tabellen hinweg gelten.

Die Verwendung von Set-Dateien ermöglicht die Erzeugung realistischer Daten für Spalten, die Namen, Orte, Adressen und andere nicht-numerische Werte enthalten. IRI stellt einige vorgefertigte Set-Dateien bereit, aber sie können auch leicht beschafft oder selbst erstellt werden.

Eine sichere und schnelle Lösung für das Testdatenmanagement (TDM): IRI führte im Jahr 2004 das Produkt RowGen ein und erweiterte es später, um strukturierte und referenziell korrekte Datenbankschemata aus DDL-Details zu analysieren, zu synthetisieren und zu laden. RowGen kann nun auch neue Datenformate generieren, rechnerisch gültige Kennnummern und Identifikationsnummern erstellen, Sätze für die Bearbeitung von All-Pairs generieren, Nullen und realistische Wertverteilungen erzeugen sowie in ETL- und CI/CD-Pipelines arbeiten. Es kann auch Testdaten in halb- und unstrukturierten Quellen wie EDI- und Excel-Dateien, PDFs und Word-Dokumente sowie Bilder mit eingebetteten Testdaten auffüllen, wenn es zusammen mit der IRI DarkShield-Such-/Masken-API verwendet wird.

Testdaten für DevOps (TestOps): DevOps zielt darauf ab, den Softwareentwicklungszyklus zu optimieren und die Bereitstellung von Software zu beschleunigen. Entwickler nutzen häufig CI/CD-Pipelines, um Software-Releases agiler und kontinuierlicher zu gestalten. Mit den Datenmaskierungs-, Subsetting- und Synthesetools von IRI Voracity erstellte Testdaten können in Jenkins, Amazon CodePipeline, Azure DevOps, GitLab und anderen Tools ausgeführt und genutzt werden, um die Funktionalität und Leistung der Software bei jedem Build zu überprüfen.

Die aufkommende Disziplin des TestOps konzentriert sich auf die operativen Aspekte des Testens im Softwareentwicklungszyklus. Dazu gehört die Sammlung, Vorbereitung und Sicherung von Testdaten, Produktionsdaten und Testfallquellen, um die Testabdeckung, Mitarbeiter und Aktivitäten zu skalieren und die Qualität der Software sicherzustellen. Die intelligente Datenintegration und Anonymisierung dieser Quellen in Voracity spielen eine Schlüsselrolle für TestOps und tragen gleichzeitig zur Verbesserung der DevOps-Qualität bei und minimieren Datenschutzrisiken.

Testdaten für MLOps: Reichhaltige, anonymisierte Daten sind auch für das Testen im Bereich maschinelles Lernen (MLOps) von großer Bedeutung. Hierbei geht es um das Speichern, Laden, Transformieren und Testen von Daten sowie die Validierung von Modellen. IRI RowGen kann beispielsweise große, realistische Dateien in Bulk-Load-Formaten wie CSV und ML-Modellformaten wie PMML/XML und PFA/JSON schnell synthetisieren. Alternativ können die Datenerkennungs- und Maskierungswerkzeuge IRI FieldShield und DarkShield in Voracity Datenbanken, Dateien oder Datenströme durchsuchen und bereinigen, die für das maschinelle Lernen verwendet werden sollen.

Testdaten für DataOps: Bei der Umsetzung eines DataOps-Testansatzes für ETL-Projekte geht es darum, Tests für Quell- und Ziel-Datensätze zu automatisieren und sicherzustellen, dass diese Datensätze die Eigenschaften von Daten widerspiegeln, die in echten Analysemodellen verwendet werden, ohne dabei Personen zu identifizieren. IRI-Software erleichtert die Datenintegration und Automatisierung von Analysetests auf verschiedene Weisen. Eine Möglichkeit besteht darin, Datentransformation und -verarbeitung mit Datenmaskierung oder -synthese zu kombinieren. Einzigartig an Voracity ist die Unterstützung von Metadaten und Engine für diese Aufgabenkonsolidierung im Hintergrund. In einem einzigen Durchlauf durch das SortCL-Datenverarbeitungsprogramm von Voracity können Benutzer gleichzeitig Testdaten synthetisieren, transformieren und in mehrere künstliche, aber realistische Analyseziele formatieren. Alternativ kann das Programm Produktionsdatenquellen lesen, integrieren, transformieren, Daten bereinigen, maskieren und in die gewünschten Formate umwandeln.

Weltweite Referenzen: Seit über 40 Jahren nutzen unsere Kunden wie die NASA, American Airlines, Walt Disney, Comcast, Universal Music, Reuters, das Kraftfahrtbundesamt, das Bundeskriminalamt, die Bundesagentur für Arbeit, Rolex, Commerzbank, Lufthansa, Mercedes Benz, Osram,.. aktiv unsere Software für Big Data Wrangling und Schutz! Sie finden viele unserer weltweiten Referenzen hier und eine Auswahl deutscher Referenzen hier.

Partnerschaft mit IRI: Seit 1993 besteht unsere Kooperation mit IRI (Innovative Routines International Inc.) aus Florida, USA. Damit haben wir unser Portfolio um die Produkte CoSort, Voracity, DarkShield, FieldShield, RowGen, NextForm, FACT und CellShield erweitert. Nur die JET-Software GmbH besitzt die deutschen Vertriebsrechte für diese Produkte. Weitere Details zu unserem Partner IRI Inc. hier.

Über die JET-Software GmbH

Das Unternehmen JET-Software GmbH wurde 1986 in Deutschland gegründet. Seit fast 4 Jahrzehnten entwickeln wir Software für Big Data Management und Schutz! Unsere Produkte sind für alle gängigen Betriebssysteme: Mainframe (BS2000/OSD, z/OS + z/VSE) und Open Systems (UNIX & Derivate, Linux + Windows).

Wir bieten Lösungen für schnellstes Datenmanagement (Datenprofilierung, Bereinigung, Integration, Migration und Reporting sowie Beschleunigung der BI/DB/ETL-Plattform von Drittanbietern) und datenzentrierten Schutz (PII/PHI-Klassifizierung, -Erkennung und -Deidentifizierung, sowie Re-ID-Risikobewertung und Generierung synthetischer Testdaten).

Zu unseren langjährigen Referenzen zählen deutsche Bundes- und Landesbehörden, Sozial- und Privatversicherungen, Landes-, Privat- und Großbanken, nationale und internationale Dienstleister, der Mittelstand sowie Großunternehmen.

Firmenkontakt und Herausgeber der Meldung:

JET-Software GmbH
Edmund-Lang-Straße 16
64832 Babenhausen
Telefon: +49 (6073) 711-403
Telefax: +49 (6073) 711-405
https://www.jet-software.com

Ansprechpartner:
Amadeus Thomas
Telefon: +49 (6073) 711403
Fax: +49 (6073) 711405
E-Mail: amadeus.thomas@jet-software.com
Für die oben stehende Pressemitteilung ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel