automatisk opsummering

Teknik inden for naturlig sprogbehandling, der automatisk producerer en kortfattet version af en længere tekst.

Kort fortalt

En metode, hvor en computer læser en lang tekst og laver et kort resumé.

Kategori
teknik
Niveau
øvet

Betydninger

2
  1. 1

    Ekstraktiv opsummering: en metode, hvor resuméet dannes ved at udvælge og sammensætte de mest relevante sætninger eller sætningsfragmenter fra kildeteksten.

    • I ekstraktiv opsummering bruges ofte TF-IDF eller neurale modeller til at rangere sætninger.
    • Mange nyhedsaggregatorer anvender ekstraktiv opsummering til at præsentere de vigtigste punkter.
  2. 2

    Abstraktiv opsummering: en metode, hvor resuméet genereres ved at producere nye sætninger, der genformulerer indholdet, ofte ved hjælp af sprogmodeller som BART eller T5.

    • Abstraktiv opsummering kan producere mere flydende og menneskelignende resuméer end ekstraktiv.
    • Modeller som PEGASUS er specialdesignet til abstraktiv opsummering.

Hvornår bruges det

Bruges i nyhedsaggregatorer, videnskabelige søgemaskiner og dokumenthåndteringssystemer til at reducere læsetid og præsentere nøgleinformation.

Kodeeksempel

from transformers import pipeline

summarizer = pipeline("summarization")
text = "..." # long text
summary = summarizer(text, max_length=50, min_length=10)
print(summary[0]['summary_text'])

Eksempel på brug af Hugging Face transformator-bibliotek til automatisk opsummering.

Oprindelse

Lån fra engelsk 'automatic summarization', sammensat af 'automatic' (automatisk) og 'summarization' (opsummering).

Afledte ord

2