From 3c97e46cf876685b278b54ab3eb0205f6f1d8996 Mon Sep 17 00:00:00 2001
From: Bill Huang <bill.huang2001@gmail.com>
Date: Wed, 8 Jan 2025 16:26:15 +0800
Subject: [PATCH] Change to unittest framework

---
 .../problems/test_supervised_learning.py      | 636 +++++++++---------
 1 file changed, 324 insertions(+), 312 deletions(-)

diff --git a/unit_test/problems/test_supervised_learning.py b/unit_test/problems/test_supervised_learning.py
index e320d0a7e..1ad71dfd8 100644
--- a/unit_test/problems/test_supervised_learning.py
+++ b/unit_test/problems/test_supervised_learning.py
@@ -1,82 +1,151 @@
-import time
 import os
-import sys
-
-current_directory = os.getcwd()
-if current_directory not in sys.path:
-    sys.path.append(current_directory)
+import time
+import unittest
 
 import torch
 import torch.nn as nn
 import torchvision
 from torch.utils.data import DataLoader
 
-from src.utils import ParamsAndVector
-from src.core import jit_class, Algorithm, Parameter
-from src.algorithms import PSO
-from src.workflows import StdWorkflow, EvalMonitor
-from src.problems.neuroevolution import SupervisedLearningProblem
-
-
-if __name__ == "__main__":
-
-    class SimpleCNN(nn.Module):
-        def __init__(self):
-            super(SimpleCNN, self).__init__()
-            self.features = nn.Sequential(
-                nn.Conv2d(1, 3, kernel_size=3, padding=1),
-                nn.ReLU(),
-                nn.MaxPool2d(kernel_size=2, stride=2),
-                nn.Conv2d(3, 3, kernel_size=3),
-                nn.ReLU(),
-                nn.MaxPool2d(kernel_size=2, stride=2),
-                nn.Conv2d(3, 3, kernel_size=3),
-                nn.ReLU(),
-                nn.Conv2d(3, 3, kernel_size=3),
-                nn.ReLU(),
-            )
-            self.classifier = nn.Sequential(
-                nn.Flatten(),
-                nn.Linear(12, 10)
-            )
-        def forward(self, x):
-            x = self.features(x)
-            x = self.classifier(x)
-            return x
-
-    
-    def model_test(model, data_loader, device):
+from evox.algorithms import PSO
+from evox.core import Algorithm, Parameter, jit_class
+from evox.problems.neuroevolution import SupervisedLearningProblem
+from evox.utils import ParamsAndVector
+from evox.workflows import EvalMonitor, StdWorkflow
+
+
+class SimpleCNN(nn.Module):
+    def __init__(self):
+        super(SimpleCNN, self).__init__()
+        self.features = nn.Sequential(
+            nn.Conv2d(1, 3, kernel_size=3, padding=1),
+            nn.ReLU(),
+            nn.MaxPool2d(kernel_size=2, stride=2),
+            nn.Conv2d(3, 3, kernel_size=3),
+            nn.ReLU(),
+            nn.MaxPool2d(kernel_size=2, stride=2),
+            nn.Conv2d(3, 3, kernel_size=3),
+            nn.ReLU(),
+            nn.Conv2d(3, 3, kernel_size=3),
+            nn.ReLU(),
+        )
+        self.classifier = nn.Sequential(nn.Flatten(), nn.Linear(12, 10))
+
+    def forward(self, x):
+        x = self.features(x)
+        x = self.classifier(x)
+        return x
+
+
+class TestSupervisedLearningProblem(unittest.TestCase):
+    def setUp(self):
+        self.device = "cuda:0" if torch.cuda.is_available() else "cpu"
+        self.data_root = "./data"
+        os.makedirs(self.data_root, exist_ok=True)
+
+        # Set random seed
+        seed = 0
+        torch.manual_seed(seed)
+        torch.cuda.manual_seed_all(seed)
+        torch.backends.cudnn.benchmark = False
+        torch.backends.cudnn.deterministic = True
+
+        # Define dataset and data loader
+        BATCH_SIZE = 100
+        self.train_dataset = torchvision.datasets.MNIST(
+            root=self.data_root,
+            train=True,
+            download=True,
+            transform=torchvision.transforms.ToTensor(),
+        )
+        self.train_loader = DataLoader(
+            self.train_dataset,
+            batch_size=BATCH_SIZE,
+            shuffle=True,
+            collate_fn=None,
+        )
+        self.test_dataset = torchvision.datasets.MNIST(
+            root=self.data_root,
+            train=False,
+            download=True,
+            transform=torchvision.transforms.ToTensor(),
+        )
+        self.test_loader = DataLoader(
+            self.test_dataset,
+            batch_size=BATCH_SIZE,
+            shuffle=False,
+            collate_fn=None,
+        )
+
+        # Data preloading
+        self.pre_gd_train_loader = tuple(
+            [
+                (inputs.to(self.device), labels.to(self.device))
+                for inputs, labels in self.train_loader
+            ]
+        )
+        self.pre_ne_train_loader = tuple(
+            [
+                (
+                    inputs.to(self.device),
+                    labels.type(torch.float).unsqueeze(1).repeat(1, 10).to(self.device),
+                )
+                for inputs, labels in self.train_loader
+            ]
+        )
+        self.pre_test_loader = tuple(
+            [
+                (inputs.to(self.device), labels.to(self.device))
+                for inputs, labels in self.test_loader
+            ]
+        )
+
+        self.model = SimpleCNN().to(self.device)
+        self.adapter = ParamsAndVector(dummy_model=self.model)
+        self.model_params = dict(self.model.named_parameters())
+        self.pop_center = self.adapter.to_vector(self.model_params)
+        self.lower_bound = self.pop_center - 0.01
+        self.upper_bound = self.pop_center + 0.01
+
+    def model_test(self, model, data_loader, device):
         model.eval()
         with torch.no_grad():
             total = 0
             correct = 0
-            with torch.no_grad():
-                for inputs, labels in data_loader:
-                    inputs = inputs.to(device=device, non_blocking=True)
-                    labels = labels.to(device=device, non_blocking=True)
-        
-                    logits = model(inputs)
-                    _, predicted = torch.max(logits.data, dim=1)
-                    total += labels.size(0)
-                    correct += (predicted == labels).sum().item()
-                acc = 100 * correct / total
+            for inputs, labels in data_loader:
+                inputs = inputs.to(device=device, non_blocking=True)
+                labels = labels.to(device=device, non_blocking=True)
+
+                logits = model(inputs)
+                _, predicted = torch.max(logits.data, dim=1)
+                total += labels.size(0)
+                correct += (predicted == labels).sum().item()
+            acc = 100 * correct / total
         return acc
-    
-    
-    def model_train(model, data_loader, criterion, optimizer, max_epoch, device, print_frequent=-1):
+
+    def model_train(
+        self,
+        model,
+        data_loader,
+        criterion,
+        optimizer,
+        max_epoch,
+        device,
+        print_frequent=-1,
+    ):
         model.train()
         for epoch in range(max_epoch):
             running_loss = 0.0
             for step, (inputs, labels) in enumerate(data_loader, start=1):
                 inputs = inputs.to(device=device, non_blocking=True)
                 labels = labels.to(device=device, non_blocking=True)
-    
+
                 optimizer.zero_grad()
                 logits = model(inputs)
                 loss = criterion(logits, labels)
                 loss.backward()
                 optimizer.step()
-    
+
                 running_loss += loss.item()
                 if print_frequent > 0 and step % print_frequent == 0:
                     print(
@@ -85,275 +154,218 @@ def model_train(model, data_loader, criterion, optimizer, max_epoch, device, pri
                     )
                     running_loss = 0.0
         return model
-    
-    
+
     def neuroevolution_process(
-        workflow      : StdWorkflow, 
-        adapter       : ParamsAndVector, 
-        model         : nn.Module, 
-        test_loader   : DataLoader, 
-        device        : torch.device, 
-        best_acc      : float,
-        max_generation: int = 50,
-    ) -> None:
+        self, workflow, adapter, model, test_loader, device, best_acc, max_generation=50
+    ):
         for index in range(max_generation):
             print(f"In generation {index}:")
             t = time.time()
             workflow.step()
             torch.cuda.synchronize()
             print(f"\tTime elapsed: {time.time() - t: .4f}(s).")
-    
-            monitor: EvalMonitor = workflow.get_submodule("monitor")
+
+            monitor = workflow.get_submodule("monitor")
             print(f"\tTop fitness: {monitor.topk_fitness}")
             best_params = adapter.to_params(monitor.topk_solutions[0])
             model.load_state_dict(best_params)
-            acc = model_test(model, test_loader, device)
+            acc = self.model_test(model, test_loader, device)
             if acc > best_acc:
                 best_acc = acc
             print(f"\tBest accuracy: {best_acc:.4f} %.")
 
+    def test_gradient_descent_training(self):
+        print("Gradient descent training start.")
+        self.model_train(
+            self.model,
+            data_loader=self.pre_gd_train_loader,
+            criterion=nn.CrossEntropyLoss(),
+            optimizer=torch.optim.Adam(self.model.parameters(), lr=1e-2),
+            max_epoch=3,
+            device=self.device,
+            print_frequent=500,
+        )
+        gd_acc = self.model_test(self.model, self.pre_test_loader, self.device)
+        print(f"Accuracy after gradient descent training: {gd_acc:.4f} %.")
+        self.assertGreater(gd_acc, 90.0)
+
+    def test_population_based_neuroevolution(self):
+        class AccuracyCriterion(nn.Module):
+            def __init__(self, data_loader):
+                super().__init__()
+                self.data_loader = data_loader
+
+            def forward(self, logits, labels):
+                _, predicted = torch.max(logits, dim=1)
+                correct = (predicted == labels[:, 0]).sum()
+                fitness = -correct
+                return fitness
+
+        acc_criterion = AccuracyCriterion(self.pre_ne_train_loader)
+        loss_criterion = nn.MSELoss()
+
+        class WeightedCriterion(nn.Module):
+            def __init__(self, loss_weight, loss_criterion, acc_weight, acc_criterion):
+                super().__init__()
+                self.loss_weight = loss_weight
+                self.loss_criterion = loss_criterion
+                self.acc_weight = acc_weight
+                self.acc_criterion = acc_criterion
+
+            def forward(self, logits, labels):
+                weighted_loss = self.loss_weight * self.loss_criterion(logits, labels)
+                weighted_acc = self.acc_weight * self.acc_criterion(logits, labels)
+                return weighted_loss + weighted_acc
+
+        weighted_criterion = WeightedCriterion(
+            loss_weight=0.5,
+            loss_criterion=loss_criterion,
+            acc_weight=0.5,
+            acc_criterion=acc_criterion,
+        )
+
+        print("Population-based neuroevolution process start.")
+        POP_SIZE = 500
+        vmapped_problem = SupervisedLearningProblem(
+            model=self.model,
+            data_loader=self.pre_ne_train_loader,
+            criterion=weighted_criterion,
+            pop_size=POP_SIZE,
+            device=self.device,
+        )
+        vmapped_problem.setup()
+
+        pop_algorithm = PSO(
+            pop_size=POP_SIZE,
+            lb=self.lower_bound,
+            ub=self.upper_bound,
+            device=self.device,
+        )
+        pop_algorithm.setup()
+
+        pop_monitor = EvalMonitor(
+            topk=3,
+            device=self.device,
+        )
+        pop_monitor.setup()
+
+        pop_workflow = StdWorkflow()
+        pop_workflow.setup(
+            algorithm=pop_algorithm,
+            problem=vmapped_problem,
+            solution_transform=self.adapter,
+            monitor=pop_monitor,
+            device=self.device,
+        )
+        self.neuroevolution_process(
+            workflow=pop_workflow,
+            adapter=self.adapter,
+            model=self.model,
+            test_loader=self.pre_test_loader,
+            device=self.device,
+            best_acc=0.0,
+            max_generation=3,
+        )
 
-    # General setting
-    os.environ["CUDA_VISIBLE_DEVICES"] = "0"
-    device = "cuda:0" if torch.cuda.is_available() else "cpu"
-    data_root = "./data"
-    os.makedirs(data_root, exist_ok=True)
-
-    # Set random seed
-    seed = 0
-    torch.manual_seed(seed)
-    torch.cuda.manual_seed_all(seed)
-    torch.backends.cudnn.benchmark = False
-    torch.backends.cudnn.deterministic = True
-
-    # Define dataset and data loader
-    BATCH_SIZE = 100
-    train_dataset = torchvision.datasets.MNIST(
-        root      = data_root,
-        train     = True,
-        download  = True,
-        transform = torchvision.transforms.ToTensor(),
-    )
-    train_loader = DataLoader(train_dataset,
-        batch_size = BATCH_SIZE,
-        shuffle    = True,
-        collate_fn = None,
-    )
-    test_dataset = torchvision.datasets.MNIST(
-        root      = data_root,
-        train     = False,
-        download  = True,
-        transform = torchvision.transforms.ToTensor(),
-    )
-    test_loader = DataLoader(test_dataset,
-        batch_size = BATCH_SIZE,
-        shuffle    = False,
-        collate_fn = None,
-    )
-
-    # Data preloading
-    print("Data preloading start.")
-    import tqdm
-    pre_gd_train_loader = tuple([
-        (inputs.to(device), labels.to(device))
-        for inputs, labels in tqdm.tqdm(train_loader)
-    ])
-    pre_ne_train_loader = tuple([
-        (
-            inputs.to(device), 
-            labels.type(torch.float).unsqueeze(1).repeat(1, 10).to(device)
+    def test_single_run_neuroevolution(self):
+        class AccuracyCriterion(nn.Module):
+            def __init__(self, data_loader):
+                super().__init__()
+                self.data_loader = data_loader
+
+            def forward(self, logits, labels):
+                _, predicted = torch.max(logits, dim=1)
+                correct = (predicted == labels[:, 0]).sum()
+                fitness = -correct
+                return fitness
+
+        acc_criterion = AccuracyCriterion(self.pre_ne_train_loader)
+        loss_criterion = nn.MSELoss()
+
+        class WeightedCriterion(nn.Module):
+            def __init__(self, loss_weight, loss_criterion, acc_weight, acc_criterion):
+                super().__init__()
+                self.loss_weight = loss_weight
+                self.loss_criterion = loss_criterion
+                self.acc_weight = acc_weight
+                self.acc_criterion = acc_criterion
+
+            def forward(self, logits, labels):
+                weighted_loss = self.loss_weight * self.loss_criterion(logits, labels)
+                weighted_acc = self.acc_weight * self.acc_criterion(logits, labels)
+                return weighted_loss + weighted_acc
+
+        weighted_criterion = WeightedCriterion(
+            loss_weight=0.5,
+            loss_criterion=loss_criterion,
+            acc_weight=0.5,
+            acc_criterion=acc_criterion,
+        )
+
+        print("Single-run neuroevolution process start.")
+        single_problem = SupervisedLearningProblem(
+            model=self.model,
+            data_loader=self.pre_ne_train_loader,
+            criterion=weighted_criterion,
+            pop_size=None,
+            device=self.device,
+        )
+        single_problem.setup()
+
+        @jit_class
+        class RandAlgorithm(Algorithm):
+            def __init__(self, lb, ub):
+                super().__init__()
+                assert lb.ndim == 1 and ub.ndim == 1, (
+                    f"Lower and upper bounds shall have ndim of 1, "
+                    f"got {lb.ndim} and {ub.ndim}. "
+                )
+                assert lb.shape == ub.shape, (
+                    f"Lower and upper bounds shall have same shape, "
+                    f"got {lb.ndim} and {ub.ndim}. "
+                )
+                self.hp = Parameter([1.0, 2.0])
+                self.lb = lb
+                self.ub = ub
+                self.dim = lb.shape[0]
+                self.pop = nn.Buffer(
+                    torch.empty(1, lb.shape[0], dtype=lb.dtype, device=lb.device)
+                )
+                self.fit = nn.Buffer(torch.empty(1, dtype=lb.dtype, device=lb.device))
+
+            def step(self):
+                pop = torch.rand(
+                    self.dim,
+                    dtype=self.lb.dtype,
+                    device=self.lb.device,
+                )
+                pop = pop * (self.ub - self.lb)[None, :] + self.lb[None, :]
+                pop = pop * self.hp[0]
+                self.pop.copy_(pop)
+                self.fit.copy_(self.evaluate(pop))
+
+        single_algorithm = RandAlgorithm(lb=self.lower_bound, ub=self.upper_bound)
+
+        single_monitor = EvalMonitor(
+            topk=1,
+            device=self.device,
+        )
+        single_monitor.setup()
+
+        single_workflow = StdWorkflow()
+        single_workflow.setup(
+            algorithm=single_algorithm,
+            problem=single_problem,
+            solution_transform=self.adapter,
+            monitor=single_monitor,
+            device=self.device,
+        )
+        self.neuroevolution_process(
+            workflow=single_workflow,
+            adapter=self.adapter,
+            model=self.model,
+            test_loader=self.pre_test_loader,
+            device=self.device,
+            best_acc=0.0,
+            max_generation=3,
         )
-        for inputs, labels in tqdm.tqdm(train_loader)
-    ])
-    pre_test_loader = tuple([
-        (inputs.to(device), labels.to(device))
-        for inputs, labels in tqdm.tqdm(test_loader)
-    ])
-    print()
-
-    # Initialize model
-    model = SimpleCNN().to(device)
-    total_params = sum(p.numel() for p in model.parameters())
-    print(f"Total number of model parameters: {total_params}")
-    print()
-
-    # Gradient descent process
-    print("Gradient descent training start.")
-    model_train(model, 
-        data_loader    = pre_gd_train_loader, 
-        criterion      = nn.CrossEntropyLoss(), 
-        optimizer      = torch.optim.Adam(model.parameters(), lr=1e-2), 
-        max_epoch      = 3, 
-        device         = device,
-        print_frequent = 500,
-    )
-    gd_acc = model_test(model, pre_test_loader, device)
-    print(f"Accuracy after gradient descent training: {gd_acc:.4f} %.")
-    print()
-
-    # Initialize neuroevolution process
-    adapter = ParamsAndVector(dummy_model=model)
-    model_params = dict(model.named_parameters())
-    pop_center  = adapter.to_vector(model_params)
-    lower_bound = pop_center - 0.01 
-    upper_bound = pop_center + 0.01 
-   
-    # Define criterion
-    class AccuracyCriterion(nn.Module):
-        def __init__(self, data_loader: DataLoader):
-            super().__init__()
-            self.data_loader = data_loader
-        def forward(self, logits, labels):
-            _, predicted = torch.max(logits, dim=1)
-            correct = (predicted == labels[:, 0]).sum()
-            fitness = -correct
-            return fitness
-    acc_criterion = AccuracyCriterion(pre_ne_train_loader)
-    loss_criterion = nn.MSELoss()
-    class WeightedCriterion(nn.Module):
-        def __init__(self, 
-            loss_weight, 
-            loss_criterion, 
-            acc_weight, 
-            acc_criterion
-        ):
-            super().__init__()
-            self.loss_weight    = loss_weight
-            self.loss_criterion = loss_criterion
-            self.acc_weight     = acc_weight
-            self.acc_criterion  = acc_criterion
-        def forward(self, logits, labels):
-            weighted_loss = self.loss_weight * self.loss_criterion(
-                logits, labels
-            )
-            weighted_acc  = self.acc_weight  * self.acc_criterion(
-                logits, labels
-            )
-            return weighted_loss + weighted_acc
-    weighted_criterion = WeightedCriterion(
-        loss_weight    = 0.5,
-        loss_criterion = loss_criterion,
-        acc_weight     = 0.5,
-        acc_criterion  = acc_criterion,
-    )
-
-    # Population-based neuroevolution testing
-    print(
-        "Upon gradient descent, "
-        "the population-based neuroevolution process start. "
-    )
-    POP_SIZE = 500
-    vmapped_problem = SupervisedLearningProblem(
-        model       = model,
-        data_loader = pre_ne_train_loader,
-        criterion   = weighted_criterion,
-        pop_size    = POP_SIZE,
-        device      = device,
-    )
-    vmapped_problem.setup()
-
-    pop_algorithm = PSO(
-        pop_size = POP_SIZE, 
-        lb       = lower_bound,
-        ub       = upper_bound,
-        device   = device,
-    )
-    pop_algorithm.setup()
-
-    pop_monitor = EvalMonitor( 
-        topk=3, device=device, # choose the best three individuals
-    ) 
-    pop_monitor.setup()
-
-    pop_workflow = StdWorkflow()
-    pop_workflow.setup(
-        algorithm          = pop_algorithm, 
-        problem            = vmapped_problem,
-        solution_transform = adapter,
-        monitor            = pop_monitor,
-        device             = device,
-    )
-    neuroevolution_process(
-        workflow       = pop_workflow, 
-        adapter        = adapter, 
-        model          = model, 
-        test_loader    = pre_test_loader, 
-        device         = device,
-        best_acc       = gd_acc,
-        max_generation = 3,
-    )
-    print()
-
-
-    # Single-run neuroevolution testing
-    print(
-        "Upon gradient descent, "
-        "the single-run neuroevolution process start. "
-    )
-    single_problem = SupervisedLearningProblem(
-        model       = model,
-        data_loader = pre_ne_train_loader,
-        criterion   = weighted_criterion,
-        pop_size    = None, # set the problem to single-run mode
-        device      = device,
-    )
-    single_problem.setup()
-
-    # Define a single-run random search algorithm
-    @jit_class
-    class RandAlgorithm(Algorithm):
-        def __init__(self, lb: torch.Tensor, ub: torch.Tensor):
-            super().__init__()
-            assert lb.ndim == 1 and ub.ndim == 1, (
-                f"Lower and upper bounds shall have ndim of 1, "
-                f"got {lb.ndim} and {ub.ndim}. "
-            )
-            assert lb.shape == ub.shape, (
-                f"Lower and upper bounds shall have same shape, "
-                f"got {lb.ndim} and {ub.ndim}. "
-            )
-            self.hp  = Parameter([1.0, 2.0])
-            self.lb  = lb
-            self.ub  = ub
-            self.dim = lb.shape[0]
-            self.pop = nn.Buffer(
-                torch.empty(1, lb.shape[0], dtype=lb.dtype, device=lb.device)
-            )
-            self.fit = nn.Buffer(
-                torch.empty(1, dtype=lb.dtype, device=lb.device)
-            )
-        def step(self):
-            pop = torch.rand(
-                self.dim, dtype=self.lb.dtype, device=self.lb.device,
-            )
-            pop = pop * (self.ub - self.lb)[None, :] + self.lb[None, :]
-            pop = pop * self.hp[0]
-            self.pop.copy_(pop)
-            self.fit.copy_(self.evaluate(pop))
-    single_algorithm = RandAlgorithm(lb=lower_bound, ub=upper_bound)
-
-    single_monitor = EvalMonitor( 
-        topk=1, device=device, # there is only one individual to be monitored
-    )
-    single_monitor.setup()
-
-    single_workflow = StdWorkflow()
-    single_workflow.setup(
-        algorithm          = single_algorithm, 
-        problem            = single_problem,
-        solution_transform = adapter,
-        monitor            = single_monitor,
-        device             = device,
-    )
-    neuroevolution_process(
-        workflow       = single_workflow, 
-        adapter        = adapter, 
-        model          = model, 
-        test_loader    = pre_test_loader, 
-        device         = device,
-        best_acc       = gd_acc,
-        max_generation = 3,
-    )
-    print()
-
-    print("Tests completed.")