Toolformer

Toolformer er en metode til at finjustere en sprogmodel, så den kan lære at bruge eksterne værktøjer gennem få eksempler.

Kort fortalt

Toolformer lærer sprogmodeller selv at beslutte, hvornår de skal bruge værktøjer som regnemaskiner eller søgemaskiner, og hvordan de skal kalde dem.

Kategori
teknik
Niveau
øvet
Udtale
/ˈtuːlˌfɔːrmər/

Betydninger

1
  1. 1

    En sprogmodel, der er finjusteret til at lære at bruge eksterne værktøjer (f.eks. lommeregner, søgemaskine, oversættelsessystem) ved at generere særlige API-kald i teksten.

    • Toolformer kan lære at kalde en lommeregner for at løse regnestykker i en sætning.Toolformer: Language Models Can Teach Themselves to Use Tools (2023)
    • Ved at tilføje få eksempler kan Toolformer selv beslutte, om et spørgsmål kræver en søgning eller en simpel sproglig respons.Toolformer: Language Models Can Teach Themselves to Use Tools (2023)

Hvornår bruges det

Toolformer anvendes til at give sprogmodeller adgang til eksterne værktøjer uden manuel programmering. Det bruges især i opgaver, der kræver præcise beregninger eller opdateret information, såsom QA-systemer eller faktatjek.

Oprindelse

Sammensat af 'tool' (værktøj) og 'Transformer', efter modellens arkitektur og funktion.

Kilder

1