xautodl/lib/models/clone_weights.py

import torch
import torch.nn as nn


def copy_conv(module, init):
  assert isinstance(module, nn.Conv2d), 'invalid module : {:}'.format(module)
  assert isinstance(init  , nn.Conv2d), 'invalid module : {:}'.format(init)
  new_i, new_o = module.in_channels, module.out_channels
  module.weight.copy_( init.weight.detach()[:new_o, :new_i] )
  if module.bias is not None:
    module.bias.copy_( init.bias.detach()[:new_o] )

def copy_bn  (module, init):
  assert isinstance(module, nn.BatchNorm2d), 'invalid module : {:}'.format(module)
  assert isinstance(init  , nn.BatchNorm2d), 'invalid module : {:}'.format(init)
  num_features = module.num_features
  if module.weight is not None:
    module.weight.copy_( init.weight.detach()[:num_features] )
  if module.bias is not None:
    module.bias.copy_( init.bias.detach()[:num_features] )
  if module.running_mean is not None:
    module.running_mean.copy_( init.running_mean.detach()[:num_features] )
  if module.running_var  is not None:
    module.running_var.copy_( init.running_var.detach()[:num_features] )

def copy_fc  (module, init):
  assert isinstance(module, nn.Linear), 'invalid module : {:}'.format(module)
  assert isinstance(init  , nn.Linear), 'invalid module : {:}'.format(init)
  new_i, new_o = module.in_features, module.out_features
  module.weight.copy_( init.weight.detach()[:new_o, :new_i] )
  if module.bias is not None:
    module.bias.copy_( init.bias.detach()[:new_o] )

def copy_base(module, init):
  assert type(module).__name__ in ['ConvBNReLU', 'Downsample'], 'invalid module : {:}'.format(module)
  assert type(  init).__name__ in ['ConvBNReLU', 'Downsample'], 'invalid module : {:}'.format(  init)
  if module.conv is not None:
    copy_conv(module.conv, init.conv)
  if module.bn is not None:
    copy_bn  (module.bn, init.bn)

def copy_basic(module, init):
  copy_base(module.conv_a, init.conv_a)
  copy_base(module.conv_b, init.conv_b)
  if module.downsample is not None:
    if init.downsample is not None:
      copy_base(module.downsample, init.downsample)
    #else:
    # import pdb; pdb.set_trace()


def init_from_model(network, init_model):
  with torch.no_grad():
    copy_fc(network.classifier, init_model.classifier)
    for base, target in zip(init_model.layers, network.layers):
      assert type(base).__name__  == type(target).__name__, 'invalid type : {:} vs {:}'.format(base, target)
      if type(base).__name__ == 'ConvBNReLU':
        copy_base(target, base)
      elif type(base).__name__ == 'ResNetBasicblock':
        copy_basic(target, base)
      else:
        raise ValueError('unknown type name : {:}'.format( type(base).__name__ ))