add code for few-shot baseline

2020-08-10 08:51:26 +08:00 · 2020-08-10 08:51:26 +08:00 · 8102651a28
commit 8102651a28
parent 649f2244f7
4 changed files with 265 additions and 0 deletions
--- a/configs/few-shot/crossdomain.yml
+++ b/configs/few-shot/crossdomain.yml
@ -0,0 +1,62 @@
 name: cross-domain
 engine: crossdomain
 result_dir: ./result
 distributed:
  model:
    # broadcast_buffers: False
 misc:
  random_seed: 1004
 checkpoints:
  interval: 2000
 log:
  logger:
    level: 20 # DEBUG(10) INFO(20)
 model:
  _type: resnet10
 baseline:
  plusplus: False
  optimizers:
    _type: Adam
  data:
    dataloader:
      batch_size: 1024
      shuffle: True
      num_workers: 16
      pin_memory: True
      drop_last: True
    dataset:
      train:
        path: /data/few-shot/mini_imagenet_full_size/train
        pipeline:
          - RandomResizedCrop:
              size: [256, 256]
          - ColorJitter:
              brightness: 0.4
              contrast: 0.4
              saturation: 0.4
          - RandomHorizontalFlip
          - ToTensor
          - Normalize:
              mean: [0.485, 0.456, 0.406]
              std: [0.229, 0.224, 0.225]
      val:
        path: /data/few-shot/mini_imagenet_full_size/val
        pipeline:
          - Resize:
              size: [286, 286]
          - RandomCrop:
              size: [256, 256]
          - ToTensor
          - Normalize:
              mean: [0.485, 0.456, 0.406]
              std: [0.229, 0.224, 0.225]
--- a/engine/crossdomain.py
+++ b/engine/crossdomain.py
@ -0,0 +1,97 @@
 import torch
 import torch.nn as nn
 from torchvision.datasets import ImageFolder
 import ignite.distributed as idist
 from ignite.contrib.metrics.gpu_info import GpuInfo
 from ignite.contrib.handlers.tensorboard_logger import TensorboardLogger, global_step_from_engine, OutputHandler, \
    WeightsScalarHandler, GradsHistHandler, WeightsHistHandler, GradsScalarHandler
 from ignite.engine import create_supervised_evaluator, create_supervised_trainer, Events
 from ignite.metrics import Accuracy, Loss, RunningAverage
 from ignite.contrib.engines.common import save_best_model_by_val_score
 from ignite.contrib.handlers import ProgressBar
 from util.build import build_model, build_optimizer
 from util.handler import setup_common_handlers
 from data.transform import transform_pipeline
 def baseline_trainer(config, logger, val_loader):
    model = build_model(config.model, config.distributed.model)
    optimizer = build_optimizer(model.parameters(), config.baseline.optimizers)
    loss_fn = nn.CrossEntropyLoss()
    trainer = create_supervised_trainer(model, optimizer, loss_fn, idist.device(), non_blocking=True)
    trainer.logger = logger
    RunningAverage(output_transform=lambda x: x).attach(trainer, "loss")
    ProgressBar(ncols=0).attach(trainer)
    val_metrics = {
        "accuracy": Accuracy(),
        "nll": Loss(loss_fn)
    }
    evaluator = create_supervised_evaluator(model, val_metrics, idist.device())
    ProgressBar(ncols=0).attach(evaluator)
    @trainer.on(Events.EPOCH_COMPLETED)
    def log_training_loss(engine):
        logger.info(f"Epoch[{engine.state.epoch}] Loss: {engine.state.output:.2f}")
        evaluator.run(val_loader)
        metrics = evaluator.state.metrics
        logger.info("Training Results - Avg accuracy: {:.2f} Avg loss: {:.2f}"
                    .format(trainer.state.epoch, metrics["accuracy"], metrics["nll"]))
    if idist.get_rank() == 0:
        GpuInfo().attach(trainer, name='gpu')
        tb_logger = TensorboardLogger(log_dir=config.output_dir)
        tb_logger.attach(
            evaluator,
            log_handler=OutputHandler(
                tag="val",
                metric_names='all',
                global_step_transform=global_step_from_engine(trainer),
            ),
            event_name=Events.EPOCH_COMPLETED
        )
        tb_logger.attach(trainer, log_handler=WeightsScalarHandler(model),
                         event_name=Events.EPOCH_COMPLETED(every=10))
        tb_logger.attach(trainer, log_handler=WeightsHistHandler(model), event_name=Events.EPOCH_COMPLETED(every=25))
        tb_logger.attach(trainer, log_handler=GradsScalarHandler(model),
                         event_name=Events.EPOCH_COMPLETED(every=10))
        tb_logger.attach(trainer, log_handler=GradsHistHandler(model), event_name=Events.EPOCH_COMPLETED(every=25))
        @trainer.on(Events.COMPLETED)
        def _():
            tb_logger.close()
    to_save = dict(model=model, optimizer=optimizer, trainer=trainer)
    setup_common_handlers(trainer, config.output_dir, print_interval_event=Events.EPOCH_COMPLETED, to_save=to_save,
                          save_interval_event=Events.EPOCH_COMPLETED(every=25), n_saved=5,
                          metrics_to_print=["loss"])
    save_best_model_by_val_score(config.output_dir, evaluator, model, "accuracy", 1, trainer)
    return trainer
 def run(task, config, logger):
    assert torch.backends.cudnn.enabled
    torch.backends.cudnn.benchmark = True
    logger.info(f"start task {task}")
    if task == "baseline":
        train_dataset = ImageFolder(config.baseline.data.dataset.train.path,
                                    transform=transform_pipeline(config.baseline.data.dataset.train.pipeline))
        val_dataset = ImageFolder(config.baseline.data.dataset.val.path,
                                  transform=transform_pipeline(config.baseline.data.dataset.val.pipeline))
        logger.info(f"train with dataset:\n{train_dataset}")
        train_data_loader = idist.auto_dataloader(train_dataset, **config.baseline.data.dataloader)
        val_data_loader = idist.auto_dataloader(val_dataset, **config.baseline.data.dataloader)
        trainer = baseline_trainer(config, logger, val_data_loader)
        try:
            trainer.run(train_data_loader, max_epochs=400)
        except Exception:
            import traceback
            print(traceback.format_exc())
    else:
        return NotImplemented(f"invalid task: {task}")
--- a/model/init.py
+++ b/model/init.py
@ -1,2 +1,3 @@
 from model.registry import MODEL
 import model.residual_generator
 import model.fewshot
--- a/model/fewshot.py
+++ b/model/fewshot.py
@ -0,0 +1,105 @@
 import math
 import torch.nn as nn
 from .registry import MODEL
 # --- gaussian initialize ---
 def init_layer(l):
    # Initialization using fan-in
    if isinstance(l, nn.Conv2d):
        n = l.kernel_size[0] * l.kernel_size[1] * l.out_channels
        l.weight.data.normal_(0, math.sqrt(2.0 / float(n)))
    elif isinstance(l, nn.BatchNorm2d):
        l.weight.data.fill_(1)
        l.bias.data.fill_(0)
    elif isinstance(l, nn.Linear):
        l.bias.data.fill_(0)
 class Flatten(nn.Module):
    def __init__(self):
        super(Flatten, self).__init__()
    def forward(self, x):
        return x.view(x.size(0), -1)
 class SimpleBlock(nn.Module):
    def __init__(self, in_channels, out_channels, half_res, leakyrelu=False):
        super(SimpleBlock, self).__init__()
        self.in_channels = in_channels
        self.out_channels = out_channels
        self.block = nn.Sequential(
            nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=2 if half_res else 1, padding=1, bias=False),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(inplace=True) if not leakyrelu else nn.LeakyReLU(0.2, inplace=True),
            nn.Conv2d(out_channels, out_channels, kernel_size=3, padding=1, bias=False),
            nn.BatchNorm2d(out_channels),
        )
        self.relu = nn.ReLU(inplace=True) if not leakyrelu else nn.LeakyReLU(0.2, inplace=True)
        if in_channels != out_channels:
            self.shortcut = nn.Sequential(
                nn.Conv2d(in_channels, out_channels, 1, 2 if half_res else 1, bias=False),
                nn.BatchNorm2d(out_channels)
            )
        else:
            self.shortcut = nn.Identity()
    def forward(self, x):
        o = self.block(x)
        return self.relu(o + self.shortcut(x))
 class ResNet(nn.Module):
    def __init__(self, block, layers, dims, num_classes=None, classifier_type="linear", flatten=True, leakyrelu=False):
        super().__init__()
        assert len(layers) == 4, 'Can have only four stages'
        self.inplanes = 64
        self.start = nn.Sequential(
            nn.Conv2d(3, self.inplanes, kernel_size=7, stride=2, padding=3, bias=False),
            nn.BatchNorm2d(self.inplanes),
            nn.ReLU(inplace=True) if not leakyrelu else nn.LeakyReLU(0.2, inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        )
        trunk = []
        in_channels = self.inplanes
        for i in range(4):
            for j in range(layers[i]):
                half_res = i >= 1 and j == 0
                trunk.append(block(in_channels, dims[i], half_res, leakyrelu))
                in_channels = dims[i]
        if flatten:
            trunk.append(nn.AvgPool2d(7))
            trunk.append(Flatten())
        if num_classes is not None:
            if classifier_type == "linear":
                trunk.append(nn.Linear(in_channels, num_classes))
            elif classifier_type == "distlinear":
                pass
            else:
                raise ValueError(f"invalid classifier_type:{classifier_type}")
        self.trunk = nn.Sequential(*trunk)
        self.apply(init_layer)
    def forward(self, x):
        return self.trunk(self.start(x))
@MODEL.register_module()
 def resnet10(num_classes=None, classifier_type="linear", flatten=True, leakyrelu=False):
    return ResNet(SimpleBlock, [1, 1, 1, 1], [64, 128, 256, 512], num_classes, classifier_type, flatten, leakyrelu)
@MODEL.register_module()
 def resnet18(num_classes=None, classifier_type="linear", flatten=True, leakyrelu=False):
    return ResNet(SimpleBlock, [2, 2, 2, 2], [64, 128, 256, 512], num_classes, classifier_type, flatten, leakyrelu)
@MODEL.register_module()
 def resnet34(num_classes=None, classifier_type="linear", flatten=True, leakyrelu=False):
    return ResNet(SimpleBlock, [3, 4, 6, 3], [64, 128, 256, 512], num_classes, classifier_type, flatten, leakyrelu)