ROUGE-2
forkortelse for Recall-Oriented Understudy for Gisting Evaluation, 2-gram
ROUGE-2 er en automatisk evalueringsmetrik, der måler overlap af bigrammer (2-grams) mellem en maskinskrevet tekst og en reference-tekst for at vurdere kvaliteten af tekstgenerering, især inden for automatisk opsummering.
Kort fortalt
ROUGE-2 tæller, hvor mange ordpar (bigrammer) der er fælles mellem den genererede tekst og en modeltekst, og dividerer med antallet i modelteksten — jo flere overlap, jo bedre.
- Kategori
- metrik
- Niveau
- øvet
- Udtale
- ˈruːʒ tuː
Betydninger
1- 1
ROUGE-2 måler bigram-recall: forholdet mellem antallet af bigrammer, der forekommer i både den genererede tekst og en reference, og det samlede antal bigrammer i reference-teksten.
- Systemet opnåede en ROUGE-2-score på 0,45, hvilket indikerer et godt overlap af ordpar med reference-resuméet.
- ROUGE-2 supplerer ROUGE-1 ved at fange sammenhængen mellem ord, ikke kun individuelle ord.
Hvornår bruges det
ROUGE-2 bruges typisk inden for automatisk tekstopsummering og maskinoversættelse til at sammenligne systemoutput med menneskeskrevne referencer. Den supplerer ROUGE-1 (unigram) med fokus på sætningsflyd og ordstilling.
Formel
ROUGE-2 = (antal fælles bigrammer) / (antal bigrammer i reference)Oprindelse
ROUGE står for Recall-Oriented Understudy for Gisting Evaluation, udviklet af Chin-Yew Lin i 2004. '2' angiver brug af bigrammer (2-grams).