KI im Engineering: Wie aus statischen STEP-Dateien parametrische CATIA-Modelle generiert werden.
Der in der modernen Produktentwicklung gängige Datenaustausch über das neutrale STEP-Format stellt Ingenieure vor die Herausforderung, dass importierte Modelle meist ohne ihre ursprüngliche Konstruktionshistorie ankommen. Da Parameter und logische Verknüpfungen bei der Übertragung entfallen, ist für Änderungen an solchen Bauteilen oft ein zeitaufwendiges manuelles Nachmodellieren notwendig. Ziel der Abschlussarbeit war es, diesen manuellen Aufwand durch einen KI-gestützten Automatisierungsprozess zu ersetzen.
Ein entscheidender Faktor für den Erfolg generativer KI ist die Qualität der Trainingsdaten. Im ersten Schritt der Arbeit wurden daher CAD-Modelle geometrischer Grundkörper analysiert und in ein für Sprachmodelle verständliches Format überführt. Dies bildete die Grundvoraussetzung für die anschließende Tokenisierung, bei der die Daten mithilfe des Tokenizers des verwendeten Modells LlaMa 3.1 8B Instruct in verarbeitbare Einheiten aus Buchstaben, Zahlen und Sonderzeichen zerlegt wurden.
Um das vortrainierte Modell spezifisch auf die Syntax von CATIA-Makros (VBA) und die Struktur von STEP-Dateien anzupassen, wurde ein gezieltes Fine-Tuning durchgeführt. Da das Training von Large Language Models rechenintensiv ist, setzte die Arbeit auf fortschrittliche Optimierungsmethoden: Zum einen kam die Methode der Low-Rank Adaptation (LoRA) zum Einsatz. Diese Technik erlaubt es, das Modell effizient an neue Aufgaben anzupassen, indem die Anzahl der zu trainierenden Parametern drastisch reduziert wird, ohne das ursprüngliche Wissen des Modells zu überschreiben. Zum anderen wurde DeepSpeed verwendet, eine Bibliothek zur Optimierung von Deep-Learning-Training, um die Speicher- und Recheneffizienz weiter zu steigern.
Durch diese Kombination aus strukturierter Datenaufbereitung und ressourceneffizientem Training konnte das Modell erfolgreich darauf trainiert werden, die geometrischen Zusammenhänge einer STEP-Datei zu interpretieren. Das System ist in der Lage, basierend auf den trainierten Daten Muster zu erkennen und entsprechenden Programmcode zu generieren. Die Arbeit liefert damit den Nachweis, dass Large Language Models prinzipiell geeignet sind, die Brücke zwischen statischen Austauschformaten und parametrischer Konstruktion zu schlagen, und eröffnet neue Perspektiven für die Automatisierung im Engineering.
