ROUGE-2

forkortelse for Recall-Oriented Understudy for Gisting Evaluation, 2-gram

ROUGE-2 er en automatisk evalueringsmetrik, der måler overlap af bigrammer (2-grams) mellem en maskinskrevet tekst og en reference-tekst for at vurdere kvaliteten af tekstgenerering, især inden for automatisk opsummering.

Kort fortalt

ROUGE-2 tæller, hvor mange ordpar (bigrammer) der er fælles mellem den genererede tekst og en modeltekst, og dividerer med antallet i modelteksten — jo flere overlap, jo bedre.

Kategori
metrik
Niveau
øvet
Udtale
ˈruːʒ tuː

Betydninger

1
  1. 1

    ROUGE-2 måler bigram-recall: forholdet mellem antallet af bigrammer, der forekommer i både den genererede tekst og en reference, og det samlede antal bigrammer i reference-teksten.

    • Systemet opnåede en ROUGE-2-score på 0,45, hvilket indikerer et godt overlap af ordpar med reference-resuméet.
    • ROUGE-2 supplerer ROUGE-1 ved at fange sammenhængen mellem ord, ikke kun individuelle ord.

Hvornår bruges det

ROUGE-2 bruges typisk inden for automatisk tekstopsummering og maskinoversættelse til at sammenligne systemoutput med menneskeskrevne referencer. Den supplerer ROUGE-1 (unigram) med fokus på sætningsflyd og ordstilling.

Formel

ROUGE-2 = (antal fælles bigrammer) / (antal bigrammer i reference)

Oprindelse

ROUGE står for Recall-Oriented Understudy for Gisting Evaluation, udviklet af Chin-Yew Lin i 2004. '2' angiver brug af bigrammer (2-grams).

Kilder

1