Benchmarks Examples

This section provides comprehensive examples for running benchmarks and performance tests using Torchium’s benchmarking tools.

Quick Benchmarks

Simple Regression Benchmark

import torch
import torch.nn as nn
import torchium
from torchium.benchmarks import QuickBenchmark

# Initialize benchmark
benchmark = QuickBenchmark()

# Run simple regression benchmark
results = benchmark.simple_regression_benchmark()

# Print results
print("Simple Regression Benchmark Results:")
for optimizer_name, metrics in results.items():
    print(f"{optimizer_name}:")
    print(f"  Final Loss: {metrics['final_loss']:.6f}")
    print(f"  Convergence Time: {metrics['convergence_time']:.2f}s")
    print(f"  Memory Usage: {metrics['memory_usage']:.2f}MB")

# Compare specific optimizers
optimizers_to_test = ['adam', 'adamw', 'sam', 'ranger', 'lion', 'adabelief']
results = benchmark.compare_optimizers(optimizers_to_test)

# Print comparison results
print("\nOptimizer Comparison Results:")
for optimizer_name, metrics in results.items():
    print(f"{optimizer_name}:")
    print(f"  Final Loss: {metrics['final_loss']:.6f}")
    print(f"  Convergence Time: {metrics['convergence_time']:.2f}s")
    print(f"  Memory Usage: {metrics['memory_usage']:.2f}MB")

Classification Benchmark

# Run classification benchmark
results = benchmark.classification_benchmark()

# Print results
print("Classification Benchmark Results:")
for optimizer_name, metrics in results.items():
    print(f"{optimizer_name}:")
    print(f"  Final Accuracy: {metrics['final_accuracy']:.2f}%")
    print(f"  Final Loss: {metrics['final_loss']:.6f}")
    print(f"  Convergence Time: {metrics['convergence_time']:.2f}s")

# Compare specific optimizers for classification
optimizers_to_test = ['adam', 'adamw', 'sam', 'ranger', 'lion', 'adabelief']
results = benchmark.compare_optimizers(optimizers_to_test, task='classification')

# Print comparison results
print("\nClassification Optimizer Comparison Results:")
for optimizer_name, metrics in results.items():
    print(f"{optimizer_name}:")
    print(f"  Final Accuracy: {metrics['final_accuracy']:.2f}%")
    print(f"  Final Loss: {metrics['final_loss']:.6f}")
    print(f"  Convergence Time: {metrics['convergence_time']:.2f}s")

Comprehensive Benchmarks

Multi-Task Benchmarking

from torchium.benchmarks import OptimizerBenchmark

# Initialize comprehensive benchmark
benchmark = OptimizerBenchmark()

# Test on different tasks
tasks = ['regression', 'classification', 'computer_vision', 'nlp']

for task in tasks:
    print(f"\nBenchmarking {task}...")
    results = benchmark.benchmark_task(task)

    # Analyze results
    best_optimizer = min(results.items(), key=lambda x: x[1]['final_loss'])
    print(f"Best optimizer for {task}: {best_optimizer[0]}")
    print(f"Final loss: {best_optimizer[1]['final_loss']:.6f}")

# Compare all optimizers across all tasks
all_results = benchmark.benchmark_all_tasks()

# Print summary
print("\nOverall Results Summary:")
for task, task_results in all_results.items():
    print(f"\n{task.upper()}:")
    sorted_results = sorted(task_results.items(), key=lambda x: x[1]['final_loss'])
    for i, (optimizer, metrics) in enumerate(sorted_results[:5]):  # Top 5
        print(f"  {i+1}. {optimizer}: {metrics['final_loss']:.6f}")

Domain-Specific Benchmarks

Computer Vision Benchmark

def computer_vision_benchmark():
    # Test optimizers on computer vision tasks
    optimizers = {
        'ranger': torchium.optimizers.Ranger,
        'lookahead': torchium.optimizers.Lookahead,
        'sam': torchium.optimizers.SAM,
        'adamw': torchium.optimizers.AdamW
    }

    results = {}

    for optimizer_name, optimizer_class in optimizers.items():
        print(f"Benchmarking {optimizer_name} on computer vision...")

        # Create model
        model = nn.Sequential(
            nn.Conv2d(3, 64, 3, padding=1),
            nn.ReLU(),
            nn.AdaptiveAvgPool2d(1),
            nn.Flatten(),
            nn.Linear(64, 10)
        )

        # Create optimizer
        optimizer = optimizer_class(model.parameters(), lr=1e-3)
        criterion = nn.CrossEntropyLoss()

        # Training loop
        start_time = time.time()
        model.train()

        for epoch in range(100):
            total_loss = 0
            correct = 0
            total = 0

            for batch in dataloader:
                optimizer.zero_grad()
                output = model(batch.images)
                loss = criterion(output, batch.labels)
                loss.backward()
                optimizer.step()

                total_loss += loss.item()
                _, predicted = torch.max(output.data, 1)
                total += batch.labels.size(0)
                correct += (predicted == batch.labels).sum().item()

            if epoch % 20 == 0:
                accuracy = 100 * correct / total
                print(f"  Epoch {epoch}, Loss: {total_loss/len(dataloader):.4f}, Accuracy: {accuracy:.2f}%")

        training_time = time.time() - start_time
        final_accuracy = 100 * correct / total

        results[optimizer_name] = {
            'final_accuracy': final_accuracy,
            'final_loss': total_loss / len(dataloader),
            'training_time': training_time
        }

    return results

# Run computer vision benchmark
results = computer_vision_benchmark()

# Print results
print("\nComputer Vision Benchmark Results:")
sorted_results = sorted(results.items(), key=lambda x: x[1]['final_accuracy'], reverse=True)
for i, (optimizer, metrics) in enumerate(sorted_results):
    print(f"{i+1}. {optimizer}:")
    print(f"   Final Accuracy: {metrics['final_accuracy']:.2f}%")
    print(f"   Final Loss: {metrics['final_loss']:.6f}")
    print(f"   Training Time: {metrics['training_time']:.2f}s")

NLP Benchmark

def nlp_benchmark():
    # Test optimizers on NLP tasks
    optimizers = {
        'lamb': torchium.optimizers.LAMB,
        'novograd': torchium.optimizers.NovoGrad,
        'adamw': torchium.optimizers.AdamW,
        'sam': torchium.optimizers.SAM
    }

    results = {}

    for optimizer_name, optimizer_class in optimizers.items():
        print(f"Benchmarking {optimizer_name} on NLP...")

        # Create model
        model = nn.Sequential(
            nn.Embedding(10000, 128),
            nn.LSTM(128, 64, batch_first=True),
            nn.Linear(64, 2)
        )

        # Create optimizer
        optimizer = optimizer_class(model.parameters(), lr=1e-3)
        criterion = nn.CrossEntropyLoss()

        # Training loop
        start_time = time.time()
        model.train()

        for epoch in range(100):
            total_loss = 0
            correct = 0
            total = 0

            for batch in dataloader:
                optimizer.zero_grad()
                output, _ = model(batch.input_ids)
                output = output[:, -1, :]  # Use last hidden state
                loss = criterion(output, batch.labels)
                loss.backward()

                # Gradient clipping
                torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

                optimizer.step()

                total_loss += loss.item()
                _, predicted = torch.max(output.data, 1)
                total += batch.labels.size(0)
                correct += (predicted == batch.labels).sum().item()

            if epoch % 20 == 0:
                accuracy = 100 * correct / total
                print(f"  Epoch {epoch}, Loss: {total_loss/len(dataloader):.4f}, Accuracy: {accuracy:.2f}%")

        training_time = time.time() - start_time
        final_accuracy = 100 * correct / total

        results[optimizer_name] = {
            'final_accuracy': final_accuracy,
            'final_loss': total_loss / len(dataloader),
            'training_time': training_time
        }

    return results

# Run NLP benchmark
results = nlp_benchmark()

# Print results
print("\nNLP Benchmark Results:")
sorted_results = sorted(results.items(), key=lambda x: x[1]['final_accuracy'], reverse=True)
for i, (optimizer, metrics) in enumerate(sorted_results):
    print(f"{i+1}. {optimizer}:")
    print(f"   Final Accuracy: {metrics['final_accuracy']:.2f}%")
    print(f"   Final Loss: {metrics['final_loss']:.6f}")
    print(f"   Training Time: {metrics['training_time']:.2f}s")

Generative Models Benchmark

def generative_models_benchmark():
    # Test optimizers on generative models
    optimizers = {
        'adam': torchium.optimizers.Adam,
        'rmsprop': torchium.optimizers.RMSprop,
        'lion': torchium.optimizers.Lion
    }

    results = {}

    for optimizer_name, optimizer_class in optimizers.items():
        print(f"Benchmarking {optimizer_name} on generative models...")

        # Create generator
        generator = nn.Sequential(
            nn.Linear(100, 256),
            nn.ReLU(),
            nn.Linear(256, 512),
            nn.ReLU(),
            nn.Linear(512, 784),
            nn.Tanh()
        )

        # Create discriminator
        discriminator = nn.Sequential(
            nn.Linear(784, 512),
            nn.LeakyReLU(0.2),
            nn.Linear(512, 256),
            nn.LeakyReLU(0.2),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

        # Create optimizers
        g_optimizer = optimizer_class(generator.parameters(), lr=2e-4)
        d_optimizer = optimizer_class(discriminator.parameters(), lr=2e-4)

        # Training loop
        start_time = time.time()
        generator.train()
        discriminator.train()

        for epoch in range(100):
            g_loss_total = 0
            d_loss_total = 0

            for batch in dataloader:
                real_images = batch.images
                batch_size = real_images.size(0)

                # Train Discriminator
                d_optimizer.zero_grad()

                # Real images
                real_pred = discriminator(real_images)
                real_target = torch.ones_like(real_pred)

                # Fake images
                noise = torch.randn(batch_size, 100)
                fake_images = generator(noise)
                fake_pred = discriminator(fake_images.detach())
                fake_target = torch.zeros_like(fake_pred)

                d_loss = nn.BCELoss()(fake_pred, fake_target) + nn.BCELoss()(real_pred, real_target)
                d_loss.backward()
                d_optimizer.step()

                # Train Generator
                g_optimizer.zero_grad()

                fake_pred = discriminator(fake_images)
                real_target = torch.ones_like(fake_pred)

                g_loss = nn.BCELoss()(fake_pred, real_target)
                g_loss.backward()
                g_optimizer.step()

                g_loss_total += g_loss.item()
                d_loss_total += d_loss.item()

            if epoch % 20 == 0:
                print(f"  Epoch {epoch}, G Loss: {g_loss_total/len(dataloader):.4f}, D Loss: {d_loss_total/len(dataloader):.4f}")

        training_time = time.time() - start_time

        results[optimizer_name] = {
            'final_g_loss': g_loss_total / len(dataloader),
            'final_d_loss': d_loss_total / len(dataloader),
            'training_time': training_time
        }

    return results

# Run generative models benchmark
results = generative_models_benchmark()

# Print results
print("\nGenerative Models Benchmark Results:")
for optimizer, metrics in results.items():
    print(f"{optimizer}:")
    print(f"   Final G Loss: {metrics['final_g_loss']:.6f}")
    print(f"   Final D Loss: {metrics['final_d_loss']:.6f}")
    print(f"   Training Time: {metrics['training_time']:.2f}s")

Performance Analysis

Memory Usage Analysis

import psutil
import torch

def analyze_memory_usage(model, optimizers, dataloader, num_batches=100):
    process = psutil.Process()
    results = {}

    for optimizer_name, optimizer_class in optimizers.items():
        print(f"Analyzing memory usage for {optimizer_name}...")

        # Create model and optimizer
        model = model_class()
        optimizer = optimizer_class(model.parameters(), lr=1e-3)
        criterion = nn.MSELoss()

        # Measure initial memory
        initial_memory = process.memory_info().rss / 1024 / 1024  # MB

        # Training loop
        max_memory = initial_memory
        model.train()

        for i, batch in enumerate(dataloader):
            if i >= num_batches:
                break

            optimizer.zero_grad()
            output = model(batch.input)
            loss = criterion(output, batch.target)
            loss.backward()
            optimizer.step()

            # Measure current memory
            current_memory = process.memory_info().rss / 1024 / 1024  # MB
            max_memory = max(max_memory, current_memory)

        # Calculate memory usage
        memory_usage = max_memory - initial_memory

        results[optimizer_name] = {
            'memory_usage': memory_usage,
            'max_memory': max_memory
        }

    return results

# Run memory analysis
results = analyze_memory_usage(CustomModel, optimizers, dataloader)

# Print results
print("\nMemory Usage Analysis Results:")
sorted_results = sorted(results.items(), key=lambda x: x[1]['memory_usage'])
for i, (optimizer, metrics) in enumerate(sorted_results):
    print(f"{i+1}. {optimizer}:")
    print(f"   Memory Usage: {metrics['memory_usage']:.2f}MB")
    print(f"   Max Memory: {metrics['max_memory']:.2f}MB")

Convergence Analysis

def analyze_convergence(model, optimizers, dataloader, num_epochs=100):
    results = {}

    for optimizer_name, optimizer_class in optimizers.items():
        print(f"Analyzing convergence for {optimizer_name}...")

        # Create model and optimizer
        model = model_class()
        optimizer = optimizer_class(model.parameters(), lr=1e-3)
        criterion = nn.MSELoss()

        # Training loop
        losses = []
        model.train()

        for epoch in range(num_epochs):
            total_loss = 0
            for batch in dataloader:
                optimizer.zero_grad()
                output = model(batch.input)
                loss = criterion(output, batch.target)
                loss.backward()
                optimizer.step()
                total_loss += loss.item()

            avg_loss = total_loss / len(dataloader)
            losses.append(avg_loss)

        # Analyze convergence
        final_loss = losses[-1]
        convergence_epoch = None
        for i, loss in enumerate(losses):
            if loss < final_loss * 1.1:  # Within 10% of final loss
                convergence_epoch = i
                break

        results[optimizer_name] = {
            'final_loss': final_loss,
            'convergence_epoch': convergence_epoch,
            'losses': losses
        }

    return results

# Run convergence analysis
results = analyze_convergence(CustomModel, optimizers, dataloader)

# Print results
print("\nConvergence Analysis Results:")
sorted_results = sorted(results.items(), key=lambda x: x[1]['final_loss'])
for i, (optimizer, metrics) in enumerate(sorted_results):
    print(f"{i+1}. {optimizer}:")
    print(f"   Final Loss: {metrics['final_loss']:.6f}")
    print(f"   Convergence Epoch: {metrics['convergence_epoch']}")
    print(f"   Total Epochs: {len(metrics['losses'])}")

Visualization

Loss Curve Visualization

import matplotlib.pyplot as plt

def plot_loss_curves(results):
    plt.figure(figsize=(12, 8))

    for optimizer_name, metrics in results.items():
        losses = metrics['losses']
        plt.plot(losses, label=optimizer_name, linewidth=2)

    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.title('Loss Curves Comparison')
    plt.legend()
    plt.grid(True)
    plt.yscale('log')
    plt.show()

# Plot loss curves
plot_loss_curves(results)

Performance Comparison Table

def create_performance_table(results):
    import pandas as pd

    # Create DataFrame
    data = []
    for optimizer, metrics in results.items():
        data.append({
            'Optimizer': optimizer,
            'Final Loss': f"{metrics['final_loss']:.6f}",
            'Convergence Epoch': metrics['convergence_epoch'],
            'Memory Usage (MB)': f"{metrics.get('memory_usage', 0):.2f}",
            'Training Time (s)': f"{metrics.get('training_time', 0):.2f}"
        })

    df = pd.DataFrame(data)
    df = df.sort_values('Final Loss')

    print("\nPerformance Comparison Table:")
    print(df.to_string(index=False))

# Create performance table
create_performance_table(results)

Statistical Analysis

Statistical Significance Testing

from scipy import stats
import numpy as np

def statistical_analysis(results, num_runs=5):
    # Run multiple times for statistical significance
    all_results = {}

    for optimizer_name, optimizer_class in optimizers.items():
        print(f"Running statistical analysis for {optimizer_name}...")

        final_losses = []
        for run in range(num_runs):
            # Create model and optimizer
            model = model_class()
            optimizer = optimizer_class(model.parameters(), lr=1e-3)
            criterion = nn.MSELoss()

            # Training loop
            model.train()
            for epoch in range(100):
                total_loss = 0
                for batch in dataloader:
                    optimizer.zero_grad()
                    output = model(batch.input)
                    loss = criterion(output, batch.target)
                    loss.backward()
                    optimizer.step()
                    total_loss += loss.item()

                if epoch % 20 == 0:
                    print(f"    Run {run+1}, Epoch {epoch}, Loss: {total_loss/len(dataloader):.4f}")

            final_losses.append(total_loss / len(dataloader))

        all_results[optimizer_name] = {
            'mean': np.mean(final_losses),
            'std': np.std(final_losses),
            'values': final_losses
        }

    return all_results

# Run statistical analysis
statistical_results = statistical_analysis(results)

# Print statistical results
print("\nStatistical Analysis Results:")
for optimizer, metrics in statistical_results.items():
    print(f"{optimizer}:")
    print(f"  Mean: {metrics['mean']:.6f}")
    print(f"  Std: {metrics['std']:.6f}")
    print(f"  Values: {[f'{v:.6f}' for v in metrics['values']]}")

# Perform t-tests
print("\nT-test Results:")
optimizer_names = list(statistical_results.keys())
for i in range(len(optimizer_names)):
    for j in range(i+1, len(optimizer_names)):
        opt1, opt2 = optimizer_names[i], optimizer_names[j]
        values1 = statistical_results[opt1]['values']
        values2 = statistical_results[opt2]['values']

        t_stat, p_value = stats.ttest_ind(values1, values2)
        print(f"{opt1} vs {opt2}: t={t_stat:.4f}, p={p_value:.4f}")

These examples demonstrate comprehensive benchmarking and performance analysis methodologies for Torchium’s optimizers and loss functions. Use these tools to find the best combination for your specific use case and validate performance improvements.