Die Machine-Learning-Community wird mit Version 2.18 von TensorFlow in den Genuss neuer Funktionen und Optimierungen kommen. Neben der Integration von NumPy 2.0 als Standard und dem Einsatz von Hermetic CUDA stehen vor allem erweiterte GPU-Unterstützung im Fokus.
NumPy 2.0: Fortschritt mit Anpassungen
Ein bedeutender Schritt ist die Umstellung auf NumPy 2.0, das nun standardmäßig in TensorFlow 2.18 integriert und kompiliert wird. Das Team betont, dass die meisten APIs bei der Migration problemlos funktionieren. Dennoch sollten Entwicklerinnen und Entwickler sich mit möglichen Änderungen vertraut machen, da es in einigen Fällen zu Fehlermeldungen kommen kann, beispielsweise bei Out-of-Boundary-Conversion oder der Darstellung von NumPy-Skalaren. Um historische Kompatibilität zu gewährleisten, wurde das Python-Verhalten von NumPy 1 beibehalten. Wichtig ist zudem die Kenntnis neuer Type-Promotion-Regeln in NumPy 2, die Auswirkungen auf TensorFlow-Ergebnisse haben können und zu Fehlern oder ungenauen Skalaren führen könnten. TensorFlow unterstützt NumPy 1.26 nur noch bis 2025, um Entwicklerinnen und Entwicklern den Übergang zum neuen Standard zu ermöglichen.
Hermetic CUDA für reproduzierbare Builds
Ein weiterer wichtiger Aspekt ist die Einführung von Hermetic CUDA bei der Quellenausgabe von TensorFlow. Anstelle einer lokalen CUDA-Installation lädt TensorFlow nun CUDNN und NCCL aus dem Netzwerk. Dieser Ansatz verfolgt das Ziel, reproduzierbarere Builds für Googles eigene Machine-Learning-Projekte zu ermöglichen. Als Nebenwirkung wurde TensorRT in CUDA-Builds entfernt, um die Code-Qualität zu verbessern.
Erweiterter GPU-Support
TensorFlow 2.18 bringt Unterstützung für neuere GPUs mit Compute Capability 8.9 im Nvidia-Raster. Diese Architektur findet sich auf Hardware wie der NVIDIA RTX 40 Series (RTX 40 , L4 oder L40). Im Gegenzug wird die Unterstützung für GPUs vor der Pascal-Generation (Compute Capability 6.0) eingestellt. Nutzerinnen und Nutzer mit älteren GPUs sollten bei Version 2.16 bleiben oder TensorFlow selbst für ihre Plattform kompilieren.
TensorFlow Lite und RTLite
Das Team plant bis Ende des Jahres die vollständige Umstellung von TensorFlow Lite auf das neue Format RTLite (Runtime for Lite). Entwicklerinnen und Entwickler können bereits jetzt an dem neuen Standard mitarbeiten und sich mit den kommenden Veränderungen vertraut machen.
Zusammenfassend liefert TensorFlow 2.18 wertvolle Updates für Machine-Learning-Projekte, die modernes GPU-Computing, verbesserte Reproduzierbarkeit und eine moderne NumPy-Integration bieten.
Schlagwörter: TensorFlow + NumPy + Hermetic CUDA
Wie bewerten Sie den Schreibstil des Artikels?
