ekstraktiv resumé-generering
En automatisk metode til at skabe et resumé af en tekst ved at udvælge de vigtigste sætninger eller sætningsdele direkte fra kildeteksten.
Kort fortalt
En teknik hvor computeren finder de vigtigste sætninger i en tekst og sætter dem sammen til et resumé uden at omskrive noget.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En metode til automatisk resumé-generering hvor resuméet udelukkende består af sætninger eller uddrag valgt direkte fra kildeteksten, ofte baseret på en scoringsfunktion.
- Modellen anvender ekstraktiv resumé-generering til at udtrække de tre bedst rangerede sætninger.
- Ekstraktiv resumé-generering adskiller sig fra abstraktiv resumé-generering ved ikke at generere nyt sprog.
Hvornår bruges det
Bruges ofte i dokumentbehandling og nyhedsaggregatorer til at give et hurtigt overblik over lange tekster. Metoden er enkel og hurtig men kan mangle sammenhæng.
Kodeeksempel
def extractive_summary(text, num_sentences=2):
sentences = nltk.sent_tokenize(text)
word_freq = Counter(w.lower() for w in text.split() if w.isalpha())
scores = {}
for sent in sentences:
for word in sent.lower().split():
if word in word_freq:
scores[sent] = scores.get(sent, 0) + word_freq[word]
return sorted(scores, key=scores.get, reverse=True)[:num_sentences]Simpel implementering af ekstraktiv resumé-generering med sætningsscoring baseret på ordhyppighed.
Oprindelse
Ekstraktiv kommer fra latin 'extrahere' (trække ud), resumé fra latin 'resumere' (genoptage), og generering fra latin 'generare' (frembringe).