diff --git a/Cargo.toml b/Cargo.toml
index 858551715..dec989a86 100644
--- a/Cargo.toml
+++ b/Cargo.toml
@@ -38,6 +38,10 @@ harness = false
 name = "translation_benchmark"
 harness = false
 
+[[bench]]
+name = "generation_benchmark"
+harness = false
+
 [[bench]]
 name = "tensor_operations_benchmark"
 harness = false
diff --git a/benches/generation_benchmark.rs b/benches/generation_benchmark.rs
new file mode 100644
index 000000000..4ef977ec4
--- /dev/null
+++ b/benches/generation_benchmark.rs
@@ -0,0 +1,72 @@
+#[macro_use]
+extern crate criterion;
+
+use criterion::{black_box, Criterion};
+use rust_bert::gpt2::{
+    Gpt2ConfigResources, Gpt2MergesResources, Gpt2ModelResources, Gpt2VocabResources,
+};
+use rust_bert::pipelines::common::ModelType;
+use rust_bert::pipelines::text_generation::{TextGenerationConfig, TextGenerationModel};
+use rust_bert::resources::{RemoteResource, Resource};
+use std::time::{Duration, Instant};
+use tch::Device;
+
+fn create_summarization_model() -> TextGenerationModel {
+    let config = TextGenerationConfig {
+        model_type: ModelType::GPT2,
+        model_resource: Resource::Remote(RemoteResource::from_pretrained(Gpt2ModelResources::GPT2)),
+        config_resource: Resource::Remote(RemoteResource::from_pretrained(
+            Gpt2ConfigResources::GPT2,
+        )),
+        vocab_resource: Resource::Remote(RemoteResource::from_pretrained(Gpt2VocabResources::GPT2)),
+        merges_resource: Resource::Remote(RemoteResource::from_pretrained(
+            Gpt2MergesResources::GPT2,
+        )),
+        min_length: 0,
+        max_length: 30,
+        do_sample: true,
+        early_stopping: false,
+        num_beams: 5,
+        temperature: 1.0,
+        top_k: 0,
+        top_p: 0.9,
+        repetition_penalty: 1.0,
+        length_penalty: 1.0,
+        no_repeat_ngram_size: 3,
+        num_return_sequences: 5,
+        device: Device::cuda_if_available(),
+    };
+    TextGenerationModel::new(config).unwrap()
+}
+
+fn generation_forward_pass(iters: u64, model: &TextGenerationModel, data: &[&str]) -> Duration {
+    let mut duration = Duration::new(0, 0);
+    for _i in 0..iters {
+        let start = Instant::now();
+        let _ = model.generate(data, None);
+        duration = duration.checked_add(start.elapsed()).unwrap();
+    }
+    duration
+}
+
+fn bench_generation(c: &mut Criterion) {
+    //    Set-up summarization model
+    unsafe {
+        torch_sys::dummy_cuda_dependency();
+    }
+    let model = create_summarization_model();
+
+    //    Define input
+    let input = ["Hello, I'm a language model,"];
+    c.bench_function("Generation", |b| {
+        b.iter_custom(|iters| black_box(generation_forward_pass(iters, &model, &input)))
+    });
+}
+
+criterion_group! {
+name = benches;
+config = Criterion::default().sample_size(10);
+targets = bench_generation
+}
+
+criterion_main!(benches);
diff --git a/src/pipelines/text_generation.rs b/src/pipelines/text_generation.rs
index 3d22d1229..f1199e8fc 100644
--- a/src/pipelines/text_generation.rs
+++ b/src/pipelines/text_generation.rs
@@ -105,7 +105,7 @@ impl TextGenerationConfig {
 impl Default for TextGenerationConfig {
     fn default() -> TextGenerationConfig {
         TextGenerationConfig {
-            model_type: ModelType::Bart,
+            model_type: ModelType::GPT2,
             model_resource: Resource::Remote(RemoteResource::from_pretrained(
                 Gpt2ModelResources::GPT2_MEDIUM,
             )),