Adversarial Discriminative Domain Adaptation with BERT

A PyTorch implementation of Adversarial Discriminative Domain Adaptation for text dataset with pretrained BERT.
This code mainly refers to pytorch-adda

Requirements

torch
pandas
pytorch_pretrained_bert

Install requirements

pip install -r requirements.txt

Run the test

python main.py --src books --tgt dvd --seqlen 200 --patience 5 --num_epochs_pre 200 ^
	       --log_step_pre 1 --eval_step_pre 10 --save_step_pre 100 ^
	       --num_epochs 100 --log_step 1 --save_step 100

Arguments

usage: main.py [-h] [--src {book,dvd,electronic,kitchen}]
               [--tgt {book,dvd,electronic,kitchen}] [--enc_train]
	       [--seqlen SEQLEN] [--patience PATIENCE] [--num_epochs_pre NUM_EPOCHS_PRE] 
	       [--log_step_pre LOG_STEP_PRE] [--eval_step_pre EVAL_STEP_PRE] 
	       [--save_step_pre SAVE_STEP_PRE] [--num_epochs NUM_EPOCHS] 
	       [--log_step LOG_STEP] [--save_step SAVE_STEP]

Specify Params for Experimental Setting

optional arguments:
  -h, --help            show this help message and exit
  --src {book,dvd,electronic,kitchen}
                        Specify src dataset (default: books)
  --tgt {book,dvd,electronic,kitchen}
                        Specify tgt dataset (default: dvd)
  --enc_train           Train source encoder (default: False)
  --seqlen SEQLEN       Specify maximum sequence length (default: 200)
  --patience PATIENCE   Specify patience of early stopping for pretrain (default: 5)
  --num_epochs_pre NUM_EPOCHS_PRE
                        Specify the number of epochs for pretrain (default: 200)
  --log_step_pre LOG_STEP_PRE
                        Specify log step size for pretrain (default: 1)
  --eval_step_pre EVAL_STEP_PRE
                        Specify eval step size for pretrain (default: 10)
  --save_step_pre SAVE_STEP_PRE
                        Specify save step size for pretrain (default: 100)
  --num_epochs NUM_EPOCHS
                        Specify the number of epochs for adaptation (default: 100)
  --log_step LOG_STEP   Specify log step size for adaptation (default: 1)
  --save_step SAVE_STEP
                        Specify save step size for adaptation (default: 100)

Model

BERT encoder

BERTEncoder(
  (encoder): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(30522, 768)
      (position_embeddings): Embedding(512, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): BertLayerNorm()
      (dropout): Dropout(p=0.1)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): BertLayerNorm()
              (dropout): Dropout(p=0.1)
            )
          )
          (intermediate): BertIntermediate(
            (dense): Linear(in_features=768, out_features=3072, bias=True)
          )
          (output): BertOutput(
            (dense): Linear(in_features=3072, out_features=768, bias=True)
            (LayerNorm): BertLayerNorm()
            (dropout): Dropout(p=0.1)
          )
        )
	⋮
        (11): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): BertLayerNorm()
              (dropout): Dropout(p=0.1)
            )
          )
          (intermediate): BertIntermediate(
            (dense): Linear(in_features=768, out_features=3072, bias=True)
          )
          (output): BertOutput(
            (dense): Linear(in_features=3072, out_features=768, bias=True)
            (LayerNorm): BertLayerNorm()
            (dropout): Dropout(p=0.1)
          )
        )
      )
    )
    (pooler): BertPooler(
      (dense): Linear(in_features=768, out_features=768, bias=True)
      (activation): Tanh()
    )
  )
)

BERT classifier

BERTClassifier(
  (classifier): Sequential(
    (0): Dropout(p=0.1)
    (1): Linear(in_features=768, out_features=768, bias=True)
    (2): LeakyReLU(negative_slope=0.01)
    (3): Linear(in_features=768, out_features=2, bias=True)
  )
)

Discriminator

Discriminator(
  (layer): Sequential(
    (0): Linear(in_features=768, out_features=96, bias=True)
    (1): ReLU()
    (2): Linear(in_features=96, out_features=96, bias=True)
    (3): ReLU()
    (4): Linear(in_features=96, out_features=2, bias=True)
  )
)

Name		Name	Last commit message	Last commit date
Latest commit History 42 Commits
core		core
data/processed		data/processed
models		models
params		params
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Adversarial Discriminative Domain Adaptation with BERT

Requirements

Install requirements

Run the test

Arguments

Model

About

Releases

Packages

Languages

deep0learning/text-adda

Folders and files

Latest commit

History

Repository files navigation

Adversarial Discriminative Domain Adaptation with BERT

Requirements

Install requirements

Run the test

Arguments

Model

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages