GitHub - aebogdanova/LM-Addition-Operation: Fine-tuning of the GPT-2 model for performing the addition operation task

Fine-tuning Language Model for Addition Operation Task

Description

The repository includes a dataset and scripts for fine-tuning the GPT-2 model to perform the addition operation task, based on the methodology described in the article "Toolformer: Language Models Can Teach Themselves to Use Tools". The technical report is available here.

Model

To run fine-tuning:

python train.py

Evaluation

The fine-tuned model is available here. Please download it and place to ./model directory.

To see results:

python evaluate.py

Results

See accuracy scores in results/results_average.json.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data		data
model		model
results		results
README.md		README.md
Report.pdf		Report.pdf
evaluate.py		evaluate.py
generate_dataset.py		generate_dataset.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fine-tuning Language Model for Addition Operation Task

Description

Model

Evaluation

Results

About

Releases

Packages

Languages

aebogdanova/LM-Addition-Operation

Folders and files

Latest commit

History

Repository files navigation

Fine-tuning Language Model for Addition Operation Task

Description

Model

Evaluation

Results

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages