Add argparse and logging to lime + iris dataset for kan and mamba:

woodRock · Aug 13, 2024 · 3c19577 · 3c19577
1 parent 4cfd1e0
commit 3c19577
Show file tree

Hide file tree

Showing 16 changed files with 1,216 additions and 270 deletions.
diff --git a/code/kan/figures/model_accuracy.png b/code/kan/figures/model_accuracy.png
diff --git a/code/kan/iris.py b/code/kan/iris.py
@@ -0,0 +1,173 @@
+import argparse
+import logging 
+import torch
+import torch.nn as nn 
+import torch.optim as optim
+from kan import StackedKAN
+from util import preprocess_dataset
+from train import train_model, evaluate_model
+
+
+def parse_arguments():
+    parser = argparse.ArgumentParser(
+                    prog='Mamba',
+                    description='Mamba: Linear-Time Sequence Modeling with Selective State Spaces',
+                    epilog='Implemented in pytorch and written in python.')
+    parser.add_argument('-d', '--dataset', type=str, default="species",
+                         help="The fish species or part dataset. Defaults to species")
+    parser.add_argument('-f', '--file-path', type=str, default="cnn_checkpoint",
+                        help="Filepath to store the model checkpoints to. Defaults to transformer_checkpoint")
+    parser.add_argument('-r', '--run', type=int, default=0)
+    parser.add_argument('-o', '--output', type=str, default=f"logs/results")
+
+    # Preprocessing
+    parser.add_argument('-da', '--data-augmentation',
+                    action='store_true', default=False,
+                    help="Flag to perform data augmentation. Defaults to False.")  
+    # Pre-training
+    parser.add_argument('-msm', '--masked-spectra-modelling',
+                    action='store_true', default=False,
+                    help="Flag to perform masked spectra modelling. Defaults to False.")  
+    parser.add_argument('-nsp', '--next-spectra-prediction',
+                    action='store_true', default=False,
+                    help="Flag to perform next spectra prediction. Defaults to False.") 
+    # Regularization
+    parser.add_argument('-es', '--early-stopping', type=int, default=10,
+                        help='Early stopping patience. To disable early stopping set to the number of epochs. Defaults to 5.')
+    parser.add_argument('-do', '--dropout', type=float, default=0.2,
+                        help="Probability of dropout. Defaults to 0.2")
+    parser.add_argument('-ls', '--label-smoothing', type=float, default=0.1,
+                        help="The alpha value for label smoothing. 1 is a uniform distribution, 0 is no label smoothing. Defaults to 0.1")
+    # Hyperparameters
+    parser.add_argument('-e', '--epochs', type=int, default=500,
+                        help="The number of epochs to train the model for.")
+    parser.add_argument('-lr', '--learning-rate', type=float, default=1E-3,
+                        help="The learning rate for the model. Defaults to 1E-3.")
+    parser.add_argument('-wd', '--weight-decay', type=float, default=1E-3,
+                        help="The weight decay for the optimizer. Defaults to 1E-3.")
+    parser.add_argument('-bs', '--batch-size', type=int, default=64,
+                        help='Batch size for the DataLoader. Defaults to 64.')
+    parser.add_argument('-hd', '--hidden-dimension', type=int, default=1023,
+                        help='The dimensions of the hidden dimension. Defaults to 1023.')
+    parser.add_argument('-sd', '--state-dimension', type=int, default=16,
+                        help='The dimensions of the state dimension. Defaults to 16.')
+    parser.add_argument('-dc', '--conv-dimension', type=int, default=4,
+                        help='The dimensions of the convlutional dimension. Defaults to 4.')
+    parser.add_argument('-ex', '--expand', type=int, default=2,
+                        help='The number of dimensions to expand. Defaults to 2.')
+    parser.add_argument('-nl', '--num-layers', type=int, default=1,
+                        help='The dimensions of the hidden dimension. Defaults to 1.')
+
+    return parser.parse_args()
+
+
+def setup_logging(args):
+    logger = logging.getLogger(__name__)
+    output = f"{args.output}_{args.run}.log"
+    logging.basicConfig(filename=output, level=logging.INFO, filemode='w')
+    return logger
+
+import torch
+import torch.nn.functional as F
+from torch.utils.data import Dataset, DataLoader
+from sklearn.datasets import load_iris
+from sklearn.model_selection import train_test_split
+from sklearn.preprocessing import StandardScaler
+import numpy as np
+
+class IrisDataset(Dataset):
+    def __init__(self, features, labels, one_hot=True):
+        self.features = torch.FloatTensor(features)
+        self.labels = torch.LongTensor(labels)
+        self.one_hot = one_hot
+        self.num_classes = len(torch.unique(self.labels))
+
+    def __len__(self):
+        return len(self.labels)
+
+    def __getitem__(self, idx):
+        feature = self.features[idx]
+        label = self.labels[idx]
+        if self.one_hot:
+            label = F.one_hot(label, num_classes=self.num_classes).float()
+        return feature, label
+
+def create_iris_dataloaders(batch_size=32, train_split=0.8, random_state=42):
+    # Load the Iris dataset
+    iris = load_iris()
+    X, y = iris.data, iris.target
+
+    # Split the data into training and validation sets
+    X_train, X_val, y_train, y_val = train_test_split(X, y, train_size=train_split, 
+                                                      random_state=random_state, stratify=y)
+
+    # Standardize the features
+    scaler = StandardScaler()
+    X_train_scaled = scaler.fit_transform(X_train)
+    X_val_scaled = scaler.transform(X_val)
+
+    # Create Dataset objects
+    train_dataset = IrisDataset(X_train_scaled, y_train)
+    val_dataset = IrisDataset(X_val_scaled, y_val)
+
+    # Create DataLoader objects
+    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
+    val_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)
+
+    return train_loader, val_loader
+
+
+def main():
+    args = parse_arguments()
+    logger = setup_logging(args)
+
+    n_features = 1023
+    n_classes_per_dataset = {"species": 2, "part": 6, "oil": 7, "cross-species": 3}
+    n_classes = n_classes_per_dataset[args.dataset]
+
+    if args.dataset not in n_classes_per_dataset:
+        raise ValueError(f"Invalid dataset: {args.dataset} not in {n_classes_per_dataset.keys()}")
+
+    # Load the dataset.
+    train_loader, val_loader = create_iris_dataloaders(batch_size=16, train_split=0.8)
+
+    n_features = 4
+    n_classes = 3
+
+    # Example usage
+    model = StackedKAN(
+        input_dim=n_features,
+        output_dim=n_classes,
+        hidden_dim=64,
+        num_inner_functions=10,
+        dropout_rate=0.2,
+        num_layers=5
+    )
+
+    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+    model = model.to(device)
+    # Label smoothing (Szegedy 2016)
+    criterion = nn.CrossEntropyLoss(label_smoothing=args.label_smoothing)
+    # AdamW optimizer (Loshchilov 2017)
+    optimizer = optim.AdamW(model.parameters(), lr=args.learning_rate, weight_decay=args.weight_decay)
+
+    train_model(
+        model = model, 
+        train_loader = train_loader,
+        val_loader = val_loader,
+        criterion = criterion,
+        optimizer = optimizer,
+        num_epochs = args.epochs,
+        patience = args.early_stopping
+    )
+
+    evaluate_model(
+        model=model, 
+        train_loader=train_loader, 
+        val_loader=val_loader, 
+        dataset=args.dataset, 
+        device=device
+    )
+
+if __name__ == "__main__":
+    main()