TensorFlow Guide 🔶

Complete guide to using MLPotion with TensorFlow - the production-ready ML framework.

Why TensorFlow + MLPotion? 🤔

Production Ready: Industry-standard deployment
Ecosystem: Rich tooling (TensorBoard, TFX, TFLite)
Performance: Optimized for TPUs and GPUs
Scalability: Distributed training built-in
MLPotion Benefits: Type-safe, modular components

Installation 📥

poetry add mlpotion -E tensorflow

This installs: - tensorflow>=2.15 - keras>=3.0 - All TensorFlow-specific MLPotion components

Quick Example 🚀

from mlpotion.frameworks.tensorflow import (
    CSVDataLoader,
    ModelTrainer,
    ModelTrainingConfig,
)
import tensorflow as tf

# Load data
loader = CSVDataLoader("data.csv", label_name="target")
dataset = loader.load()

# Create model
model = tf.keras.Sequential([...])

# Train
trainer = ModelTrainer()
config = ModelTrainingConfig(epochs=10, learning_rate=0.001)
result = trainer.train(model, dataset, config)

Data Loading 📊

CSV Data Loader

from mlpotion.frameworks.tensorflow import CSVDataLoader

loader = CSVDataLoader(
    file_pattern="data/*.csv",      # Supports glob patterns
    label_name="target",            # Column to use as label
    column_names=None,              # Auto-detect or specify list[str]
    batch_size=32,
    # Extra options passed to tf.data.experimental.make_csv_dataset
    config={
        "shuffle": True,
        "shuffle_buffer_size": 10000,
        "num_parallel_reads": 4,
        "compression_type": None,
        "header": True,
        "field_delim": ",",
        "use_quote_delim": True,
        "na_value": "",
        "select_columns": None,
    }
)

dataset = loader.load()  # Returns tf.data.Dataset

Features: - Automatic type inference - Parallel reading for performance - Memory-efficient streaming - Glob pattern support for multiple files

Dataset Optimization

from mlpotion.frameworks.tensorflow import DatasetOptimizer

optimizer = DatasetOptimizer(
    batch_size=32,
    shuffle_buffer_size=10000,      # Set to enable shuffling
    cache=True,                     # Cache in memory
    prefetch=True,                  # Prefetch for performance
)

optimized = optimizer.optimize(dataset)

Performance Tips: - Use cache=True for datasets that fit in memory - Enable prefetch=True to overlap data loading with training - Set shuffle_buffer_size to a large enough value for good randomization

Model Training 🎓

Basic Training

from mlpotion.frameworks.tensorflow import ModelTrainer, ModelTrainingConfig

config = ModelTrainingConfig(
    epochs=10,
    learning_rate=0.001,
    batch_size=32,
    optimizer="adam",  # Can be string or optimizer instance
    loss="mse",
    metrics=["mae"],
    verbose=1,
)

trainer = ModelTrainer()
result = trainer.train(model, train_dataset, config)

print(f"Final loss: {result.metrics['loss']:.4f}")
print(f"Training time: {result.training_time:.2f}s")

Advanced Training Configuration

import keras

# Using string optimizer name
config = ModelTrainingConfig(
    epochs=100,
    learning_rate=0.001,
    batch_size=32,
    optimizer="adam",
    loss="mse",
    metrics=["mae"],
)

# Using custom optimizer instance
custom_optimizer = keras.optimizers.Adam(
    learning_rate=0.001,
    beta_1=0.9,
    beta_2=0.999,
    clipnorm=1.0,
)

config = ModelTrainingConfig(
    epochs=100,
    batch_size=32,
    optimizer=custom_optimizer,  # Pass optimizer instance
    loss="mse",
    metrics=["mae"],
)

# Using custom loss and metrics
custom_loss = keras.losses.Huber(delta=1.0)
custom_metric = keras.metrics.MeanAbsoluteError(name="mae")

config = ModelTrainingConfig(
    epochs=100,
    learning_rate=0.001,
    batch_size=32,
    optimizer="adam",
    loss=custom_loss,  # Custom loss instance
    metrics=[custom_metric, "mse"],  # Mix of instances and strings
)

Callbacks and TensorBoard

import keras

# Method 1: Pass callback instances directly
early_stopping = keras.callbacks.EarlyStopping(
    monitor="val_loss",
    patience=5,
    restore_best_weights=True,
)

csv_logger = keras.callbacks.CSVLogger("training.log")

config = ModelTrainingConfig(
    epochs=100,
    learning_rate=0.001,
    callbacks=[early_stopping, csv_logger],  # Pass instances
    use_tensorboard=True,  # TensorBoard enabled by default
    tensorboard_log_dir="logs/my_experiment",  # Optional custom path
)

# Method 2: Pass callback configs as dicts
config = ModelTrainingConfig(
    epochs=100,
    learning_rate=0.001,
    callbacks=[
        {
            "name": "EarlyStopping",
            "params": {
                "monitor": "val_loss",
                "patience": 5,
                "restore_best_weights": True,
            }
        },
        {
            "name": "ReduceLROnPlateau",
            "params": {
                "monitor": "val_loss",
                "factor": 0.5,
                "patience": 3,
            }
        },
    ],
    use_tensorboard=True,
)

# Method 3: Mix of instances and dicts
config = ModelTrainingConfig(
    epochs=100,
    learning_rate=0.001,
    callbacks=[
        early_stopping,  # Instance
        {"name": "CSVLogger", "params": {"filename": "training.log"}},  # Dict
    ],
)

# Disable TensorBoard if needed
config = ModelTrainingConfig(
    epochs=10,
    learning_rate=0.001,
    use_tensorboard=False,  # Disable TensorBoard
    callbacks=[early_stopping],
)

# Custom TensorBoard configuration
config = ModelTrainingConfig(
    epochs=100,
    learning_rate=0.001,
    use_tensorboard=True,
    tensorboard_log_dir="logs/experiment_1",
    tensorboard_params={
        "histogram_freq": 1,
        "write_graph": True,
        "write_images": True,
        "update_freq": "epoch",
        "profile_batch": "10,20",
    },
)

Distributed Training

import tensorflow as tf
from mlpotion.frameworks.tensorflow import ModelTrainer, ModelTrainingConfig

# Create distribution strategy
strategy = tf.distribute.MirroredStrategy()

with strategy.scope():
    # Create model within strategy scope
    model = tf.keras.Sequential([...])

    # Train as usual
    trainer = ModelTrainer()
    result = trainer.train(model, dataset, config)

Model Evaluation 📊

from mlpotion.frameworks.tensorflow import ModelEvaluator, ModelEvaluationConfig

config = ModelEvaluationConfig(
    batch_size=32,
    verbose=1,
    return_dict=True,
)

evaluator = ModelEvaluator()
result = evaluator.evaluate(model, test_dataset, config)

print(f"Test loss: {result.metrics['loss']:.4f}")
print(f"Test MAE: {result.metrics['mae']:.4f}")

Model Persistence 💾

Saving Models

from mlpotion.frameworks.tensorflow import ModelPersistence

# Save in TensorFlow format (recommended)
persistence = ModelPersistence(
    path="models/my_model",
    model=model,
)
persistence.save(save_format=".keras")

# Save in H5 format
persistence_h5 = ModelPersistence(
    path="models/my_model.h5",
    model=model,
)
persistence_h5.save(save_format="h5")

Loading Models

# Load full model
persistence = ModelPersistence(
    path="models/my_model",
    model=None,  # Will be loaded
)
loaded_model, metadata = persistence.load()

# Load with custom objects
persistence_custom = ModelPersistence(
    path="models/my_model",
    model=None,
)
loaded_model, metadata = persistence_custom.load(
    custom_objects={"CustomLayer": CustomLayer}
)

Model Export 📤

SavedModel Format (Recommended for Serving)

from mlpotion.frameworks.tensorflow import ModelExporter, ModelExportConfig

exporter = ModelExporter()

config = ModelExportConfig(
    format="saved_model",
    include_optimizer=False,  # Smaller size for inference
    signatures=None,  # Auto-detect
)

result = exporter.export(model, "exports/saved_model", config)
print(f"Exported to: {result.export_path}")

TFLite (Mobile/Edge Devices)

config = ModelExportConfig(
    format="tflite",
    optimization="default",  # or "float16", "int8"
    representative_dataset=None,  # For int8 quantization
)

result = exporter.export(model, "exports/model.tflite", config)

TensorFlow.js (Web Deployment)

config = ModelExportConfig(
    format="tfjs",
    quantization_dtype="float16",  # Smaller model size
)

result = exporter.export(model, "exports/tfjs_model", config)

Model Inspection 🔍

from mlpotion.frameworks.tensorflow import ModelInspector

inspector = ModelInspector()
info = inspector.inspect(model)

print(f"Model name: {info.name}")
print(f"Backend: {info.backend}")
print(f"Trainable: {info.trainable}")
print(f"Total params: {info.parameters['total']}")
print(f"Trainable params: {info.parameters['trainable']}")

# Inspect inputs
for inp in info.inputs:
    print(f"Input: {inp['name']}, shape: {inp['shape']}, dtype: {inp['dtype']}")

# Inspect outputs
for out in info.outputs:
    print(f"Output: {out['name']}, shape: {out['shape']}, dtype: {out['dtype']}")

# Inspect layers
for layer in info.layers:
    print(f"Layer: {layer['name']}, type: {layer['type']}, params: {layer['params']}")

Common Patterns 🎯

Pattern: Train-Val-Test Pipeline

from mlpotion.frameworks.tensorflow import (
    CSVDataLoader,
    DatasetOptimizer,
    ModelTrainer,
    ModelEvaluator,
    ModelTrainingConfig,
)

# Load splits
train_loader = CSVDataLoader("train.csv", label_name="target")
val_loader = CSVDataLoader("val.csv", label_name="target")
test_loader = CSVDataLoader("test.csv", label_name="target")

train_data = train_loader.load()
val_data = val_loader.load()
test_data = test_loader.load()

# Optimize
optimizer = DatasetOptimizer(batch_size=32, cache=True, prefetch=True)
train_data = optimizer.optimize(train_data)
val_data = optimizer.optimize(val_data)
test_data = optimizer.optimize(test_data)

# Train
trainer = ModelTrainer()
config = ModelTrainingConfig(
    epochs=50,
    learning_rate=0.001,
)

result = trainer.train(model, train_data, config, validation_dataset=val_data)

# Evaluate
evaluator = ModelEvaluator()
test_metrics = evaluator.evaluate(result.model, test_data, config)

print(f"Best epoch: {result.best_epoch}")
print(f"Test accuracy: {test_metrics.metrics['accuracy']:.2%}")

Pattern: Hyperparameter Tuning

from itertools import product

# Define hyperparameters to try
learning_rates = [0.0001, 0.001, 0.01]
batch_sizes = [16, 32, 64]
optimizers = ["adam", "rmsprop"]

best_val_loss = float('inf')
best_params = {}

for lr, bs, opt in product(learning_rates, batch_sizes, optimizers):
    print(f"\nTrying: lr={lr}, batch_size={bs}, optimizer={opt}")

    # Create fresh model
    model = create_model()

    # Configure training
    config = ModelTrainingConfig(
        epochs=30,
        learning_rate=lr,
        batch_size=bs,
        optimizer=opt,
        verbose=0,
        callbacks=[
            {"name": "EarlyStopping", "params": {"patience": 5}},
        ],
    )

    # Optimize dataset with new batch size
    optimizer = DatasetOptimizer(batch_size=bs)
    train_opt = optimizer.optimize(train_data)
    val_opt = optimizer.optimize(val_data)

    # Train
    result = trainer.train(model, train_opt, config, validation_dataset=val_opt)

    # Check if best
    val_loss = result.history['val_loss'][-1]
    if val_loss < best_val_loss:
        best_val_loss = val_loss
        best_params = {'lr': lr, 'batch_size': bs, 'optimizer': opt}
        # Save best model
        persistence.save(result.model, "models/best_model")
        print(f"✨ New best! Val loss: {val_loss:.4f}")

print(f"\n🏆 Best params: {best_params}")
print(f"🏆 Best val loss: {best_val_loss:.4f}")

Pattern: Mixed Precision Training

import tensorflow as tf

# Enable mixed precision
policy = tf.keras.mixed_precision.Policy('mixed_float16')
tf.keras.mixed_precision.set_global_policy(policy)

# Create model (automatically uses mixed precision)
model = create_model()

# Train as usual
config = ModelTrainingConfig(
    epochs=10,
    learning_rate=0.001,
    optimizer="sgd",
)

result = trainer.train(model, dataset, config)

Pattern: Custom Training Loop

from mlpotion.frameworks.tensorflow import ModelTrainer

class CustomTrainer(ModelTrainer):
    def train_step(self, model, batch):
        """Custom training step logic."""
        features, labels = batch

        with tf.GradientTape() as tape:
            predictions = model(features, training=True)
            loss = self.loss_fn(labels, predictions)

            # Add custom regularization
            regularization_loss = sum(model.losses)
            total_loss = loss + regularization_loss

        # Compute gradients
        gradients = tape.gradient(total_loss, model.trainable_variables)

        # Custom gradient clipping
        gradients, _ = tf.clip_by_global_norm(gradients, 1.0)

        # Apply gradients
        self.optimizer.apply_gradients(zip(gradients, model.trainable_variables))

        return {'loss': loss, 'total_loss': total_loss}

# Use custom trainer
custom_trainer = CustomTrainer()
result = custom_trainer.train(model, dataset, config)

Integration with TensorFlow Ecosystem 🔧

TensorBoard Integration

from mlpotion.frameworks.tensorflow import ModelTrainer, ModelTrainingConfig

# TensorBoard is enabled by default
config = ModelTrainingConfig(
    epochs=50,
    learning_rate=0.001,
    use_tensorboard=True,  # Default is True
    tensorboard_log_dir="logs/my_experiment",  # Optional
)

trainer = ModelTrainer()
result = trainer.train(model, dataset, config)

# View results in terminal:
# tensorboard --logdir=logs

# Advanced TensorBoard configuration
config = ModelTrainingConfig(
    epochs=50,
    learning_rate=0.001,
    use_tensorboard=True,
    tensorboard_log_dir="logs/advanced",
    tensorboard_params={
        "histogram_freq": 1,
        "write_graph": True,
        "write_images": True,
        "update_freq": "epoch",
        "profile_batch": "10,20",
        "embeddings_freq": 1,
    },
)

result = trainer.train(model, dataset, config)

TensorFlow Datasets Integration

import tensorflow_datasets as tfds
from mlpotion.frameworks.tensorflow import DatasetOptimizer

# Load from TFDS
(train_ds, val_ds, test_ds), info = tfds.load(
    'mnist',
    split=['train[:80%]', 'train[80%:]', 'test'],
    with_info=True,
    as_supervised=True,
)

# Optimize with MLPotion
optimizer = DatasetOptimizer(batch_size=32, cache=True, prefetch=True)
train_ds = optimizer.optimize(train_ds)

# Train as usual
result = trainer.train(model, train_ds, config)

Best Practices 💡

Use Dataset Optimization: Always use DatasetOptimizer for better performance
Enable Prefetching: Set prefetch=True to overlap data loading with training
Cache Small Datasets: Use cache=True if dataset fits in memory
Early Stopping: Enable to prevent overfitting
SavedModel Format: Use for production deployment
Mixed Precision: Enable for faster training on modern GPUs

Troubleshooting 🔧

Issue: Out of Memory

Solution: Reduce batch size or use gradient accumulation

config = ModelTrainingConfig(
    batch_size=16,  # Smaller batches
    # Or use gradient accumulation
)

Issue: Slow Data Loading

Solution: Enable optimization and parallel reading

loader = CSVDataLoader(
    file_pattern="data.csv",
    num_parallel_reads=8,  # More parallel readers
)

optimizer = DatasetOptimizer(
    prefetch=True,
    num_parallel_calls=tf.data.AUTOTUNE,
)

Next Steps 🚀

PyTorch Guide → - Compare with PyTorch
ZenML Integration → - Add MLOps
API Reference → - Detailed API docs

TensorFlow + MLPotion = Production ML Made Easy! 🔶