ekstraktiv resumé-generering

En automatisk metode til at skabe et resumé af en tekst ved at udvælge de vigtigste sætninger eller sætningsdele direkte fra kildeteksten.

Kort fortalt

En teknik hvor computeren finder de vigtigste sætninger i en tekst og sætter dem sammen til et resumé uden at omskrive noget.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En metode til automatisk resumé-generering hvor resuméet udelukkende består af sætninger eller uddrag valgt direkte fra kildeteksten, ofte baseret på en scoringsfunktion.

    • Modellen anvender ekstraktiv resumé-generering til at udtrække de tre bedst rangerede sætninger.
    • Ekstraktiv resumé-generering adskiller sig fra abstraktiv resumé-generering ved ikke at generere nyt sprog.

Hvornår bruges det

Bruges ofte i dokumentbehandling og nyhedsaggregatorer til at give et hurtigt overblik over lange tekster. Metoden er enkel og hurtig men kan mangle sammenhæng.

Kodeeksempel

def extractive_summary(text, num_sentences=2):
    sentences = nltk.sent_tokenize(text)
    word_freq = Counter(w.lower() for w in text.split() if w.isalpha())
    scores = {}
    for sent in sentences:
        for word in sent.lower().split():
            if word in word_freq:
                scores[sent] = scores.get(sent, 0) + word_freq[word]
    return sorted(scores, key=scores.get, reverse=True)[:num_sentences]

Simpel implementering af ekstraktiv resumé-generering med sætningsscoring baseret på ordhyppighed.

Oprindelse

Ekstraktiv kommer fra latin 'extrahere' (trække ud), resumé fra latin 'resumere' (genoptage), og generering fra latin 'generare' (frembringe).