Toolformer
Toolformer er en metode til at finjustere en sprogmodel, så den kan lære at bruge eksterne værktøjer gennem få eksempler.
Kort fortalt
Toolformer lærer sprogmodeller selv at beslutte, hvornår de skal bruge værktøjer som regnemaskiner eller søgemaskiner, og hvordan de skal kalde dem.
- Kategori
- teknik
- Niveau
- øvet
- Udtale
- /ˈtuːlˌfɔːrmər/
Betydninger
1- 1
En sprogmodel, der er finjusteret til at lære at bruge eksterne værktøjer (f.eks. lommeregner, søgemaskine, oversættelsessystem) ved at generere særlige API-kald i teksten.
- Toolformer kan lære at kalde en lommeregner for at løse regnestykker i en sætning. — Toolformer: Language Models Can Teach Themselves to Use Tools (2023)
- Ved at tilføje få eksempler kan Toolformer selv beslutte, om et spørgsmål kræver en søgning eller en simpel sproglig respons. — Toolformer: Language Models Can Teach Themselves to Use Tools (2023)
Hvornår bruges det
Toolformer anvendes til at give sprogmodeller adgang til eksterne værktøjer uden manuel programmering. Det bruges især i opgaver, der kræver præcise beregninger eller opdateret information, såsom QA-systemer eller faktatjek.
Oprindelse
Sammensat af 'tool' (værktøj) og 'Transformer', efter modellens arkitektur og funktion.