README - long-t5-tglobal-base-16384-booksum-V11-big_patent-V2

this README was added because there wasn't one
created 2022-07-31_12-14-50

about

An experiment testing some transfer learning with pszemraj/long-t5-tglobal-base-16384-book-summary to evaluate the ability to learn some technical documentation through the big_patent dataset on modeldatabase.

This checkpoint has been trained on dataset subsection y of big_patent for approx 400 steps of functional batch size 128.

Downloads last month: 103

Safetensors

Model size

248M params

Tensor type

F32

Hosted inference API

Summarization

Examples

This model can be loaded on the Inference API on-demand.

Datasets used to train pszemraj/long-t5-tglobal-base-16384-booksum-V11-big_patent-V2

Space using pszemraj/long-t5-tglobal-base-16384-booksum-V11-big_patent-V2 1

Evaluation results

ROUGE-1 on kmfoda/booksum
test set verified

23.144
ROUGE-2 on kmfoda/booksum
test set verified

3.239
ROUGE-L on kmfoda/booksum
test set verified

12.704
ROUGE-LSUM on kmfoda/booksum
test set verified

19.810
loss on kmfoda/booksum
test set verified

2.766
gen_len on kmfoda/booksum
test set verified

63.449
ROUGE-1 on samsum
test set verified

26.803
ROUGE-2 on samsum
test set verified

6.066
ROUGE-L on samsum
test set verified

20.010
ROUGE-LSUM on samsum
test set verified

21.912
loss on samsum
test set verified

2.317
gen_len on samsum
test set verified

19.111
ROUGE-1 on xsum
test set verified

25.206
ROUGE-2 on xsum
test set verified

4.705
ROUGE-L on xsum
test set verified

17.859
ROUGE-LSUM on xsum
test set verified

18.080
loss on xsum
test set verified

3.003
gen_len on xsum
test set verified

27.482
ROUGE-1 on cnn_dailymail
test set verified

27.569
ROUGE-2 on cnn_dailymail
test set verified

6.126
ROUGE-L on cnn_dailymail
test set verified

17.113
ROUGE-LSUM on cnn_dailymail
test set verified

23.007
loss on cnn_dailymail
test set verified

2.219
gen_len on cnn_dailymail
test set verified

39.195
ROUGE-1 on billsum
test set verified

28.063
ROUGE-2 on billsum
test set verified

9.900
ROUGE-L on billsum
test set verified

18.250
ROUGE-LSUM on billsum
test set verified

21.905
loss on billsum
test set verified

2.033
gen_len on billsum
test set verified

48.599
ROUGE-1 on big_patent
test set verified

34.785
ROUGE-2 on big_patent
test set verified

9.755
ROUGE-L on big_patent
test set verified

22.228
ROUGE-LSUM on big_patent
test set verified

28.039
loss on big_patent
test set verified

1.779
gen_len on big_patent
test set verified

71.637
ROUGE-1 on launch/gov_report
validation set verified

23.593
ROUGE-2 on launch/gov_report
validation set verified

5.676
ROUGE-L on launch/gov_report
validation set verified

13.811
ROUGE-LSUM on launch/gov_report
validation set verified

20.244
loss on launch/gov_report
validation set verified

2.638
gen_len on launch/gov_report
validation set verified

64.181
ROUGE-1 on launch/gov_report
test set verified

23.744
ROUGE-2 on launch/gov_report
test set verified

5.501
ROUGE-L on launch/gov_report
test set verified

13.813
ROUGE-LSUM on launch/gov_report
test set verified

20.462
loss on launch/gov_report
test set verified

2.638
gen_len on launch/gov_report
test set verified

64.909

View leaderboard (Papers With Code)