Name		Name	Last commit message	Last commit date
parent directory ..
figures		figures
src		src
README.md		README.md
requirements.txt		requirements.txt

README.md

Towards Optimal Learning of Language Models

Obejctive

A: Learning Law. B: Empirical Evidence.

1 Environment

The following packages are required:

numpy
torch
matplotlib
wandb
cvxpy
transformers

Or simply:

pip3 install -r requirements.txt

2 Data

The training data of Perceptron Linear Classification and Transformer Language Modeling can be downloaded from this link. The data should be placed in data/linear and data/tinystory.

3 Learning Policy Optimization

cd src/
bash scripts/transformer/opt_policy.sh ${PATH_TO}/learning_law/src
bash scripts/perceptron/opt_policy.sh ${PATH_TO}/learning_law/src

4 Evaluating Optimized Learning Policy

cd src/
bash scripts/transformer/eval_policies.sh ${PATH_TO}/learning_law/src
bash scripts/perceptron/eval_policies.sh ${PATH_TO}/learning_law/src

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

learning_law

learning_law

README.md

Towards Optimal Learning of Language Models

1 Environment

2 Data

3 Learning Policy Optimization

4 Evaluating Optimized Learning Policy

Files

learning_law

Directory actions

More options

Directory actions

More options

Latest commit

History

learning_law

Folders and files

parent directory

README.md

Towards Optimal Learning of Language Models

1 Environment

2 Data

3 Learning Policy Optimization

4 Evaluating Optimized Learning Policy