Optimization Comparison Examples
================================

This section provides comprehensive examples for comparing different optimizers and loss functions using Torchium's benchmarking tools.

Quick Benchmarking
------------------

Simple Regression Benchmark
~~~~~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   import torch
   import torch.nn as nn
   import torchium
   from torchium.benchmarks import QuickBenchmark

   # Initialize benchmark
   benchmark = QuickBenchmark()

   # Run simple regression benchmark
   results = benchmark.simple_regression_benchmark()

   # Print results
   for optimizer_name, metrics in results.items():
       print(f"{optimizer_name}:")
       print(f"  Final Loss: {metrics['final_loss']:.6f}")
       print(f"  Convergence Time: {metrics['convergence_time']:.2f}s")
       print(f"  Memory Usage: {metrics['memory_usage']:.2f}MB")

   # Compare specific optimizers
   optimizers_to_test = ['adam', 'adamw', 'sam', 'ranger', 'lion', 'adabelief']
   results = benchmark.compare_optimizers(optimizers_to_test)

   # Print comparison results
   print("\nOptimizer Comparison Results:")
   for optimizer_name, metrics in results.items():
       print(f"{optimizer_name}:")
       print(f"  Final Loss: {metrics['final_loss']:.6f}")
       print(f"  Convergence Time: {metrics['convergence_time']:.2f}s")
       print(f"  Memory Usage: {metrics['memory_usage']:.2f}MB")

Comprehensive Benchmarking
--------------------------

Multi-Task Benchmarking
~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   from torchium.benchmarks import OptimizerBenchmark

   # Initialize comprehensive benchmark
   benchmark = OptimizerBenchmark()

   # Test on different tasks
   tasks = ['regression', 'classification', 'computer_vision', 'nlp']
   
   for task in tasks:
       print(f"\nBenchmarking {task}...")
       results = benchmark.benchmark_task(task)
       
       # Analyze results
       best_optimizer = min(results.items(), key=lambda x: x[1]['final_loss'])
       print(f"Best optimizer for {task}: {best_optimizer[0]}")
       print(f"Final loss: {best_optimizer[1]['final_loss']:.6f}")

   # Compare all optimizers across all tasks
   all_results = benchmark.benchmark_all_tasks()
   
   # Print summary
   print("\nOverall Results Summary:")
   for task, task_results in all_results.items():
       print(f"\n{task.upper()}:")
       sorted_results = sorted(task_results.items(), key=lambda x: x[1]['final_loss'])
       for i, (optimizer, metrics) in enumerate(sorted_results[:5]):  # Top 5
           print(f"  {i+1}. {optimizer}: {metrics['final_loss']:.6f}")

Custom Benchmarking
-------------------

Custom Model Benchmarking
~~~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   class CustomModel(nn.Module):
       def __init__(self, input_dim=10, hidden_dim=64, output_dim=1):
           super().__init__()
           self.net = nn.Sequential(
               nn.Linear(input_dim, hidden_dim),
               nn.ReLU(),
               nn.Linear(hidden_dim, hidden_dim),
               nn.ReLU(),
               nn.Linear(hidden_dim, output_dim)
           )

       def forward(self, x):
           return self.net(x)

   # Define custom benchmark
   def custom_benchmark(model_class, optimizers, dataloader, num_epochs=100):
       results = {}
       
       for optimizer_name, optimizer_class in optimizers.items():
           print(f"Benchmarking {optimizer_name}...")
           
           # Create model and optimizer
           model = model_class()
           optimizer = optimizer_class(model.parameters(), lr=1e-3)
           criterion = nn.MSELoss()
           
           # Training loop
           start_time = time.time()
           model.train()
           
           for epoch in range(num_epochs):
               total_loss = 0
               for batch in dataloader:
                   optimizer.zero_grad()
                   output = model(batch.input)
                   loss = criterion(output, batch.target)
                   loss.backward()
                   optimizer.step()
                   total_loss += loss.item()
               
               if epoch % 20 == 0:
                   print(f"  Epoch {epoch}, Loss: {total_loss/len(dataloader):.4f}")
           
           training_time = time.time() - start_time
           final_loss = total_loss / len(dataloader)
           
           results[optimizer_name] = {
               'final_loss': final_loss,
               'training_time': training_time
           }
       
       return results

   # Define optimizers to test
   optimizers = {
       'adam': torchium.optimizers.Adam,
       'adamw': torchium.optimizers.AdamW,
       'sam': torchium.optimizers.SAM,
       'ranger': torchium.optimizers.Ranger,
       'lion': torchium.optimizers.Lion,
       'adabelief': torchium.optimizers.AdaBelief,
       'lbfgs': torchium.optimizers.LBFGS
   }

   # Run custom benchmark
   results = custom_benchmark(CustomModel, optimizers, dataloader)

   # Print results
   print("\nCustom Benchmark Results:")
   sorted_results = sorted(results.items(), key=lambda x: x[1]['final_loss'])
   for i, (optimizer, metrics) in enumerate(sorted_results):
       print(f"{i+1}. {optimizer}:")
       print(f"   Final Loss: {metrics['final_loss']:.6f}")
       print(f"   Training Time: {metrics['training_time']:.2f}s")

Loss Function Comparison
------------------------

Classification Loss Comparison
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   def compare_classification_losses(model, dataloader, num_epochs=100):
       losses = {
           'cross_entropy': torchium.losses.CrossEntropyLoss(),
           'focal': torchium.losses.FocalLoss(alpha=0.25, gamma=2.0),
           'label_smoothing': torchium.losses.LabelSmoothingLoss(num_classes=10, smoothing=0.1),
           'class_balanced': torchium.losses.ClassBalancedLoss(num_classes=10)
       }
       
       results = {}
       
       for loss_name, criterion in losses.items():
           print(f"Testing {loss_name}...")
           
           # Create optimizer
           optimizer = torchium.optimizers.Adam(model.parameters(), lr=1e-3)
           
           # Training loop
           start_time = time.time()
           model.train()
           
           for epoch in range(num_epochs):
               total_loss = 0
               correct = 0
               total = 0
               
               for batch in dataloader:
                   optimizer.zero_grad()
                   output = model(batch.input)
                   loss = criterion(output, batch.target)
                   loss.backward()
                   optimizer.step()
                   
                   total_loss += loss.item()
                   _, predicted = torch.max(output.data, 1)
                   total += batch.target.size(0)
                   correct += (predicted == batch.target).sum().item()
               
               if epoch % 20 == 0:
                   accuracy = 100 * correct / total
                   print(f"  Epoch {epoch}, Loss: {total_loss/len(dataloader):.4f}, Accuracy: {accuracy:.2f}%")
           
           training_time = time.time() - start_time
           final_accuracy = 100 * correct / total
           
           results[loss_name] = {
               'final_loss': total_loss / len(dataloader),
               'final_accuracy': final_accuracy,
               'training_time': training_time
           }
       
       return results

   # Run classification loss comparison
   results = compare_classification_losses(model, dataloader)

   # Print results
   print("\nClassification Loss Comparison Results:")
   sorted_results = sorted(results.items(), key=lambda x: x[1]['final_accuracy'], reverse=True)
   for i, (loss_name, metrics) in enumerate(sorted_results):
       print(f"{i+1}. {loss_name}:")
       print(f"   Final Accuracy: {metrics['final_accuracy']:.2f}%")
       print(f"   Final Loss: {metrics['final_loss']:.6f}")
       print(f"   Training Time: {metrics['training_time']:.2f}s")

Segmentation Loss Comparison
~~~~~~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   def compare_segmentation_losses(model, dataloader, num_epochs=100):
       losses = {
           'dice': torchium.losses.DiceLoss(smooth=1e-5),
           'tversky': torchium.losses.TverskyLoss(alpha=0.3, beta=0.7),
           'focal_tversky': torchium.losses.FocalTverskyLoss(alpha=0.3, beta=0.7, gamma=2.0),
           'lovasz': torchium.losses.LovaszLoss(),
           'boundary': torchium.losses.BoundaryLoss()
       }
       
       results = {}
       
       for loss_name, criterion in losses.items():
           print(f"Testing {loss_name}...")
           
           # Create optimizer
           optimizer = torchium.optimizers.SAM(model.parameters(), lr=1e-3, rho=0.05)
           
           # Training loop
           start_time = time.time()
           model.train()
           
           for epoch in range(num_epochs):
               total_loss = 0
               
               for batch in dataloader:
                   # First forward pass
                   output = model(batch.images)
                   loss = criterion(output, batch.masks)
                   loss.backward()
                   
                   # SAM perturbation step
                   optimizer.first_step(zero_grad=True)
                   
                   # Second forward pass
                   output = model(batch.images)
                   loss = criterion(output, batch.masks)
                   loss.backward()
                   
                   # SAM update step
                   optimizer.second_step(zero_grad=True)
                   
                   total_loss += loss.item()
               
               if epoch % 20 == 0:
                   print(f"  Epoch {epoch}, Loss: {total_loss/len(dataloader):.4f}")
           
           training_time = time.time() - start_time
           
           results[loss_name] = {
               'final_loss': total_loss / len(dataloader),
               'training_time': training_time
           }
       
       return results

   # Run segmentation loss comparison
   results = compare_segmentation_losses(model, dataloader)

   # Print results
   print("\nSegmentation Loss Comparison Results:")
   sorted_results = sorted(results.items(), key=lambda x: x[1]['final_loss'])
   for i, (loss_name, metrics) in enumerate(sorted_results):
       print(f"{i+1}. {loss_name}:")
       print(f"   Final Loss: {metrics['final_loss']:.6f}")
       print(f"   Training Time: {metrics['training_time']:.2f}s")

Performance Analysis
--------------------

Memory Usage Analysis
~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   import psutil
   import torch

   def analyze_memory_usage(model, optimizers, dataloader, num_batches=100):
       process = psutil.Process()
       results = {}
       
       for optimizer_name, optimizer_class in optimizers.items():
           print(f"Analyzing memory usage for {optimizer_name}...")
           
           # Create model and optimizer
           model = model_class()
           optimizer = optimizer_class(model.parameters(), lr=1e-3)
           criterion = nn.MSELoss()
           
           # Measure initial memory
           initial_memory = process.memory_info().rss / 1024 / 1024  # MB
           
           # Training loop
           max_memory = initial_memory
           model.train()
           
           for i, batch in enumerate(dataloader):
               if i >= num_batches:
                   break
                   
               optimizer.zero_grad()
               output = model(batch.input)
               loss = criterion(output, batch.target)
               loss.backward()
               optimizer.step()
               
               # Measure current memory
               current_memory = process.memory_info().rss / 1024 / 1024  # MB
               max_memory = max(max_memory, current_memory)
           
           # Calculate memory usage
           memory_usage = max_memory - initial_memory
           
           results[optimizer_name] = {
               'memory_usage': memory_usage,
               'max_memory': max_memory
           }
       
       return results

   # Run memory analysis
   results = analyze_memory_usage(CustomModel, optimizers, dataloader)

   # Print results
   print("\nMemory Usage Analysis Results:")
   sorted_results = sorted(results.items(), key=lambda x: x[1]['memory_usage'])
   for i, (optimizer, metrics) in enumerate(sorted_results):
       print(f"{i+1}. {optimizer}:")
       print(f"   Memory Usage: {metrics['memory_usage']:.2f}MB")
       print(f"   Max Memory: {metrics['max_memory']:.2f}MB")

Convergence Analysis
~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   def analyze_convergence(model, optimizers, dataloader, num_epochs=100):
       results = {}
       
       for optimizer_name, optimizer_class in optimizers.items():
           print(f"Analyzing convergence for {optimizer_name}...")
           
           # Create model and optimizer
           model = model_class()
           optimizer = optimizer_class(model.parameters(), lr=1e-3)
           criterion = nn.MSELoss()
           
           # Training loop
           losses = []
           model.train()
           
           for epoch in range(num_epochs):
               total_loss = 0
               for batch in dataloader:
                   optimizer.zero_grad()
                   output = model(batch.input)
                   loss = criterion(output, batch.target)
                   loss.backward()
                   optimizer.step()
                   total_loss += loss.item()
               
               avg_loss = total_loss / len(dataloader)
               losses.append(avg_loss)
           
           # Analyze convergence
           final_loss = losses[-1]
           convergence_epoch = None
           for i, loss in enumerate(losses):
               if loss < final_loss * 1.1:  # Within 10% of final loss
                   convergence_epoch = i
                   break
           
           results[optimizer_name] = {
               'final_loss': final_loss,
               'convergence_epoch': convergence_epoch,
               'losses': losses
           }
       
       return results

   # Run convergence analysis
   results = analyze_convergence(CustomModel, optimizers, dataloader)

   # Print results
   print("\nConvergence Analysis Results:")
   sorted_results = sorted(results.items(), key=lambda x: x[1]['final_loss'])
   for i, (optimizer, metrics) in enumerate(sorted_results):
       print(f"{i+1}. {optimizer}:")
       print(f"   Final Loss: {metrics['final_loss']:.6f}")
       print(f"   Convergence Epoch: {metrics['convergence_epoch']}")
       print(f"   Total Epochs: {len(metrics['losses'])}")

Visualization
-------------

Loss Curve Visualization
~~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   import matplotlib.pyplot as plt

   def plot_loss_curves(results):
       plt.figure(figsize=(12, 8))
       
       for optimizer_name, metrics in results.items():
           losses = metrics['losses']
           plt.plot(losses, label=optimizer_name, linewidth=2)
       
       plt.xlabel('Epoch')
       plt.ylabel('Loss')
       plt.title('Loss Curves Comparison')
       plt.legend()
       plt.grid(True)
       plt.yscale('log')
       plt.show()

   # Plot loss curves
   plot_loss_curves(results)

Performance Comparison Table
~~~~~~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   def create_performance_table(results):
       import pandas as pd
       
       # Create DataFrame
       data = []
       for optimizer, metrics in results.items():
           data.append({
               'Optimizer': optimizer,
               'Final Loss': f"{metrics['final_loss']:.6f}",
               'Convergence Epoch': metrics['convergence_epoch'],
               'Memory Usage (MB)': f"{metrics.get('memory_usage', 0):.2f}",
               'Training Time (s)': f"{metrics.get('training_time', 0):.2f}"
           })
       
       df = pd.DataFrame(data)
       df = df.sort_values('Final Loss')
       
       print("\nPerformance Comparison Table:")
       print(df.to_string(index=False))

   # Create performance table
   create_performance_table(results)

Statistical Analysis
--------------------

Statistical Significance Testing
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

.. code-block:: python

   from scipy import stats
   import numpy as np

   def statistical_analysis(results, num_runs=5):
       # Run multiple times for statistical significance
       all_results = {}
       
       for optimizer_name, optimizer_class in optimizers.items():
           print(f"Running statistical analysis for {optimizer_name}...")
           
           final_losses = []
           for run in range(num_runs):
               # Create model and optimizer
               model = model_class()
               optimizer = optimizer_class(model.parameters(), lr=1e-3)
               criterion = nn.MSELoss()
               
               # Training loop
               model.train()
               for epoch in range(100):
                   total_loss = 0
                   for batch in dataloader:
                       optimizer.zero_grad()
                       output = model(batch.input)
                       loss = criterion(output, batch.target)
                       loss.backward()
                       optimizer.step()
                       total_loss += loss.item()
                   
                   if epoch % 20 == 0:
                       print(f"    Run {run+1}, Epoch {epoch}, Loss: {total_loss/len(dataloader):.4f}")
               
               final_losses.append(total_loss / len(dataloader))
           
           all_results[optimizer_name] = {
               'mean': np.mean(final_losses),
               'std': np.std(final_losses),
               'values': final_losses
           }
       
       return all_results

   # Run statistical analysis
   statistical_results = statistical_analysis(results)

   # Print statistical results
   print("\nStatistical Analysis Results:")
   for optimizer, metrics in statistical_results.items():
       print(f"{optimizer}:")
       print(f"  Mean: {metrics['mean']:.6f}")
       print(f"  Std: {metrics['std']:.6f}")
       print(f"  Values: {[f'{v:.6f}' for v in metrics['values']]}")

   # Perform t-tests
   print("\nT-test Results:")
   optimizer_names = list(statistical_results.keys())
   for i in range(len(optimizer_names)):
       for j in range(i+1, len(optimizer_names)):
           opt1, opt2 = optimizer_names[i], optimizer_names[j]
           values1 = statistical_results[opt1]['values']
           values2 = statistical_results[opt2]['values']
           
           t_stat, p_value = stats.ttest_ind(values1, values2)
           print(f"{opt1} vs {opt2}: t={t_stat:.4f}, p={p_value:.4f}")

These examples demonstrate comprehensive benchmarking and comparison methodologies for Torchium's optimizers and loss functions. Use these tools to find the best combination for your specific use case.