[Feature] Support AutoGNN (#309)

* autognn * Fix autognn * Add autognn tests * Fix autognn tests Co-authored-by: Yukuo Cen <cenyk1230@qq.com>
THUDM · Nov 16, 2021 · d7d259c · d7d259c
1 parent bd47b29
commit d7d259c
Show file tree

Hide file tree

Showing 5 changed files with 327 additions and 5 deletions.
diff --git a/cogdl/experiments.py b/cogdl/experiments.py
@@ -64,6 +64,12 @@ def _objective(self, trials):
     def run(self):
         study = optuna.create_study(direction="maximize")
         study.optimize(self._objective, n_trials=self.n_trials, n_jobs=1)
+        # fig1 = optuna.visualization.plot_optimization_history(study)
+        # fig1.show()
+        # fig2 = optuna.visualization.plot_slice(study)
+        # fig2.show()
+        # fig3 = optuna.visualization.plot_param_importances(study)
+        # fig3.show()
         print(study.best_params)
         return self.best_results
 
@@ -260,7 +266,25 @@ def auto_experiment(args):
     return results_dict
 
 
-def experiment(dataset, model, **kwargs):
+def default_search_space(trial):
+    return {
+        "dropout": trial.suggest_uniform("dropout", 0.2, 0.6),  # intra-layer
+        "norm": trial.suggest_categorical("norm", ["batchnorm", "layernorm"]),
+        "activation": trial.suggest_categorical("activation", ["relu", "gelu"]),
+        "layers_type": trial.suggest_categorical("layers_type", ["gcn", "gat", "grand", "gcnii", "drgat"]),
+        "residual": trial.suggest_categorical("residual", [True, False]),  # inter-layer
+        "num_layers": trial.suggest_categorical("num_layers", [2, 4, 8]),
+        "lr": trial.suggest_categorical("lr", [1e-3, 5e-3, 1e-2]),  # config
+        "hidden_size": trial.suggest_categorical("hidden_size", [32, 64, 128]),
+        # "optimizer": trial.suggest_categorical("optimizer", ["sgd", "adam"]),
+        # "epochs": trial.suggest_categorical("epochs", [500, 1000, 1500]),
+        "weight_decay": trial.suggest_categorical("weight_decay", [0, 1e-5, 1e-4]),
+    }
+
+
+def experiment(dataset, model=None, **kwargs):
+    if model is None:
+        model = "autognn"
     if isinstance(dataset, str) or isinstance(dataset, Dataset):
         dataset = [dataset]
     if isinstance(model, str) or isinstance(model, nn.Module):
@@ -282,7 +306,15 @@ def experiment(dataset, model, **kwargs):
         warnings.warn("The max_epoch is deprecated and will be removed in the future, please use epochs instead!")
         args.epochs = args.max_epoch
 
-    if "search_space" in kwargs:
+    if len(model) == 1 and isinstance(model[0], str) and model[0] == "autognn":
+        if not hasattr(args, "search_space"):
+            args.search_space = default_search_space
+        if not hasattr(args, "seed"):
+            args.seed = [1, 2]
+        if not hasattr(args, "n_trials"):
+            args.n_trials = 20
+
+    if hasattr(args, "search_space"):
         return auto_experiment(args)
 
     return raw_experiment(args)
diff --git a/cogdl/models/__init__.py b/cogdl/models/__init__.py
@@ -110,4 +110,5 @@ def build_model(args):
     "revgat": "cogdl.models.nn.revgcn.RevGAT",
     "revgen": "cogdl.models.nn.revgcn.RevGEN",
     "sage": "cogdl.models.nn.graphsage.SAGE",
+    "autognn": "cogdl.models.nn.autognn.AutoGNN",
 }
diff --git a/cogdl/models/nn/autognn.py b/cogdl/models/nn/autognn.py
@@ -0,0 +1,275 @@
+import math
+import numpy as np
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+
+from cogdl.layers import GATLayer, SELayer, GCNLayer, GCNIILayer
+from cogdl.models import BaseModel
+from cogdl.utils import spmm
+
+
+def gcn_model(in_feats, hidden_size, num_layers, out_feats, dropout, residual, norm, activation):
+    shapes = [in_feats] + [hidden_size] * (num_layers - 1) + [out_feats]
+
+    return nn.ModuleList(
+        [
+            GCNLayer(
+                shapes[i],
+                shapes[i + 1],
+                dropout=dropout if i != num_layers - 1 else 0,
+                residual=residual if i != num_layers - 1 else None,
+                norm=norm if i != num_layers - 1 else None,
+                activation=activation if i != num_layers - 1 else None,
+            )
+            for i in range(num_layers)
+        ]
+    )
+
+
+def gat_model(
+    in_feats, hidden_size, out_feats, nhead, attn_drop, alpha, residual, norm, num_layers, dropout, last_nhead
+):
+    layers = nn.ModuleList()
+    layers.append(
+        GATLayer(in_feats, hidden_size, nhead=nhead, attn_drop=attn_drop, alpha=alpha, residual=residual, norm=norm)
+    )
+    if num_layers != 1:
+        layers.append(nn.ELU())
+    for i in range(num_layers - 2):
+        if dropout > 0.0:
+            layers.append(nn.Dropout(dropout))
+        layers.append(
+            GATLayer(
+                hidden_size * nhead,
+                hidden_size,
+                nhead=nhead,
+                attn_drop=attn_drop,
+                alpha=alpha,
+                residual=residual,
+                norm=norm,
+            )
+        )
+        layers.append(nn.ELU())
+
+    if dropout > 0.0:
+        layers.append(nn.Dropout(p=dropout))
+    layers.append(
+        GATLayer(
+            hidden_size * nhead,
+            out_feats,
+            attn_drop=attn_drop,
+            alpha=alpha,
+            nhead=last_nhead,
+            residual=False,
+        )
+    )
+
+    return layers
+
+
+def grand_model(in_feats, hidden_size, out_feats, dropout, dropout2, norm):
+    layers = nn.ModuleList()
+    if norm == "batchnorm":
+        layers.append(nn.BatchNorm1d(in_feats))
+    layers.append(nn.Dropout(p=dropout))  # dropout=inputdropout
+    layers.append(nn.Linear(in_feats, hidden_size))
+    layers.append(nn.ReLU())
+    if norm == "batchnorm":
+        layers.append(nn.BatchNorm1d(hidden_size))
+    layers.append(nn.Dropout(p=dropout2))  # dropout2
+    layers.append(nn.Linear(hidden_size, out_feats))
+
+    return layers
+
+
+def gcnii_model(in_feats, hidden_size, out_feats, dropout, num_layers, alpha, lmbda, residual):
+    layers = nn.ModuleList()
+    layers.append(nn.Dropout(p=dropout))
+    layers.append(nn.Linear(in_feats, hidden_size))
+    layers.append(nn.ReLU())
+    for i in range(num_layers):
+        layers.append(nn.Dropout(p=dropout))
+        layers.append(GCNIILayer(hidden_size, alpha, math.log(lmbda / (i + 1) + 1), residual))
+        layers.append(nn.ReLU())
+    layers.append(nn.Dropout(p=dropout))
+    layers.append(nn.Linear(hidden_size, out_feats))
+
+    return layers
+
+
+def drgat_model(num_features, hidden_size, num_classes, dropout, num_heads):
+    layers = nn.ModuleList()
+    layers.append(nn.Dropout(p=dropout))
+    layers.append(SELayer(num_features, se_channels=int(np.sqrt(num_features))))
+    layers.append(GATLayer(num_features, hidden_size, nhead=num_heads, attn_drop=dropout))
+    layers.append(nn.ELU())
+    layers.append(nn.Dropout(p=dropout))
+    layers.append(SELayer(hidden_size * num_heads, se_channels=int(np.sqrt(hidden_size * num_heads))))
+    layers.append(GATLayer(hidden_size * num_heads, num_classes, nhead=1, attn_drop=dropout))
+    layers.append(nn.ELU())
+
+    return layers
+
+
+class AutoGNN(BaseModel):
+    """
+    Args
+    """
+
+    @staticmethod
+    def add_args(parser):
+        parser.add_argument("--num-features", type=int)
+        parser.add_argument("--num-classes", type=int)
+        parser.add_argument("--hidden-size", type=int, default=8)
+        parser.add_argument("--layers-type", type=str, default="gcn")
+        parser.add_argument("--num-layers", type=int, default=2)
+        parser.add_argument("--dropout", type=float, default=0.6)
+        parser.add_argument("--norm", type=str, default=None)
+        parser.add_argument("--residual", action="store_true")
+        parser.add_argument("--activation", type=str, default="relu")
+        parser.add_argument("--attn-drop", type=float, default=0.5)
+        parser.add_argument("--alpha", type=float, default=0.2)
+        parser.add_argument("--nhead", type=int, default=8)
+        parser.add_argument("--last-nhead", type=int, default=1)
+        parser.add_argument("--weight-decay", type=float, default=0.0)
+        parser.add_argument("--dropoutn", type=float, default=0.5)
+
+    @classmethod
+    def build_model_from_args(cls, args):
+        if not hasattr(args, "attn_drop"):
+            args.attn_drop = 0.5
+        if not hasattr(args, "alpha"):
+            args.alpha = 0.2
+        if not hasattr(args, "nhead"):
+            args.nhead = 8
+        if not hasattr(args, "last_nhead"):
+            args.last_nhead = 1
+        if not hasattr(args, "dropoutn"):
+            args.dropoutn = 0.5
+        return cls(
+            args.num_features,
+            args.hidden_size,
+            args.num_classes,
+            args.num_layers,
+            args.layers_type,
+            args.dropout,
+            args.activation,
+            args.norm,
+            args.residual,
+            args.attn_drop,
+            args.alpha,
+            args.nhead,
+            args.last_nhead,
+            args.dropoutn,
+        )
+
+    def __init__(
+        self,
+        in_feats,
+        hidden_size,
+        out_feats,
+        num_layers,
+        layers_type,
+        dropout,
+        activation=None,
+        norm=None,  # reuse `use_bn`
+        residual=False,
+        attn_drop=0.5,  # reuse `dropnode`
+        alpha=0.2,
+        nhead=8,  # reuse `order`
+        last_nhead=1,
+        dropoutn=0.5,  # reuse `gcnii:lambda`
+    ):
+        super(AutoGNN, self).__init__()
+
+        self.dropout = dropout
+        self.layers_type = layers_type
+        if self.layers_type == "gcn":
+            self.layers = gcn_model(in_feats, hidden_size, num_layers, out_feats, dropout, residual, norm, activation)
+            self.num_layers = num_layers
+
+        elif self.layers_type == "gat":
+            self.layers = gat_model(
+                in_feats,
+                hidden_size,
+                out_feats,
+                nhead,
+                attn_drop,
+                alpha,
+                residual,
+                norm,
+                num_layers,
+                dropout,
+                last_nhead,
+            )
+            self.num_layers = num_layers
+            self.last_nhead = last_nhead
+        elif self.layers_type == "grand":
+            self.layers = grand_model(in_feats, hidden_size, out_feats, dropout, dropoutn, norm)
+            self.dropnode_rate = attn_drop
+            self.order = nhead
+        elif self.layers_type == "gcnii":
+            self.layers = gcnii_model(in_feats, hidden_size, out_feats, dropout, num_layers, alpha, dropoutn, residual)
+        elif self.layers_type == "drgat":
+            self.layers = drgat_model(in_feats, hidden_size, out_feats, dropout, nhead)
+
+        self.autognn_parameters = list(self.layers.parameters())
+
+    def drop_node(self, x):
+        n = x.shape[0]
+        drop_rates = torch.ones(n) * self.dropnode_rate
+        if self.training:
+            masks = torch.bernoulli(1.0 - drop_rates).unsqueeze(1)
+            x = masks.to(x.device) * x
+
+        else:
+            x = x * (1.0 - self.dropnode_rate)
+        return x
+
+    def rand_prop(self, graph, x):
+        x = self.drop_node(x)
+
+        y = x
+        for i in range(self.order):
+            x = spmm(graph, x).detach_()
+            y.add_(x)
+        return y.div_(self.order + 1.0).detach_()
+
+    def normalize_x(self, x):
+        row_sum = x.sum(1)
+        row_inv = row_sum.pow_(-1)
+        row_inv.masked_fill_(row_inv == float("inf"), 0)
+        x = x * row_inv[:, None]
+        return x
+
+    def forward(self, graph):
+        if self.layers_type == "gcn":
+            graph.sym_norm()
+            h = graph.x
+        elif self.layers_type == "gat":
+            h = graph.x
+        elif self.layers_type == "grand":
+            graph.sym_norm()
+            x = graph.x
+            x = self.normalize_x(x)
+            h = self.rand_prop(graph, x)
+        elif self.layers_type == "gcnii":
+            graph.sym_norm()
+            h = graph.x
+        elif self.layers_type == "drgat":
+            h = graph.x
+
+        init_h = None
+        for i, layer in enumerate(self.layers):
+
+            if type(layer).__name__ == "GATLayer" or type(layer).__name__ == "GCNLayer":
+                h = layer(graph, h)
+            elif type(layer).__name__ == "GCNIILayer":
+                h = layer(graph, h, init_h)
+            else:
+                h = layer(h)
+
+            if i == 2:
+                init_h = h
+        return h
diff --git a/cogdl/options.py b/cogdl/options.py
@@ -34,6 +34,7 @@ def get_parser():
     parser.add_argument("--use-best-config", action="store_true", help="use best config")
     parser.add_argument("--unsup", action="store_true")
     parser.add_argument("--nstage", type=int, default=1)
+    parser.add_argument("--n-trials", type=int, default=3)
 
     parser.add_argument("--devices", default=[0], type=int, nargs="+", help="which GPU to use")
     parser.add_argument("--cpu", action="store_true", help="use CPU instead of CUDA")
@@ -82,7 +83,7 @@ def add_dataset_args(parser):
 def add_model_args(parser):
     group = parser.add_argument_group("Model configuration")
     # fmt: off
-    group.add_argument("--model", "-m", metavar="MODEL", nargs="+", required=True,
+    group.add_argument("--model", "-m", default="autognn", metavar="MODEL", nargs="+", required=False,
                        help="Model Architecture")
     # fmt: on
     return group

diff --git a/tests/test_experiments.py b/tests/test_experiments.py
@@ -14,7 +14,7 @@ def test_set_best_config():
 
 
 def test_train():
-    args = get_default_args(task="node_classification", dataset="cora", model="gcn", epochs=10, cpu=True)
+    args = get_default_args(dataset="cora", model="gcn", epochs=10, cpu=True)
     args.dataset = args.dataset[0]
     args.model = args.model[0]
     args.seed = args.seed[0]
@@ -46,7 +46,6 @@ def search_space_example(trial):
         }
 
     results = experiment(
-        task="node_classification",
         dataset="cora",
         model="gcn",
         seed=[1, 2],
@@ -60,9 +59,23 @@ def search_space_example(trial):
     assert results[("cora", "gcn")][0]["test_acc"] > 0
 
 
+def test_autognn_experiment():
+    results = experiment(
+        dataset="cora",
+        model="autognn",
+        seed=[1],
+        n_trials=2,
+        epochs=2,
+        cpu=True,
+    )
+    assert ("cora", "autognn") in results
+    assert results[("cora", "autognn")][0]["test_acc"] > 0
+
+
 if __name__ == "__main__":
     test_set_best_config()
     test_train()
     test_gen_variants()
     test_experiment()
     test_auto_experiment()
+    test_autognn_experiment()