teknik
581 termer- A2CA2C er en synkron reinforcement learning-algoritme, der kombinerer en policy (actor) med en værdifunktion (critic) og bruger advantage-estimater til at reducere varians.
- A3CEn forstærkningslæringsalgoritme, der kombinerer actor-critic med asynkron parallel træning for at stabilisere og fremskynde indlæring.
- abstraktiv resumé-genereringEn NLP-teknik, der genererer et kort resumé af en tekst ved at formulere nye sætninger, ikke blot udvælge eksisterende.
- Active LearningActive learning er en maskinlæringsteknik, hvor algoritmen aktivt vælger de mest informative datapunkter til manuel annotering for at optimere modelpræstation med minimalt antal mærkede data.
- Actor-criticEn familie af reinforcement learning-algoritmer, der kombinerer en policy-baseret aktør (actor) og en værdibaseret kritiker (critic) for at forbedre træningseffektivitet.
- adapterAdapter er en parameter-effektiv finjusteringsteknik, hvor små trænbare moduler indsættes i en forudtrænet models lag for at tilpasse den til en ny opgave uden at ændre de originale vægte.
- Adapter-modulEt letvægts neuralt netværksmodul, der indsættes mellem lagene i en fortrænet model, så kun adapterne trænes under finjustering, mens resten af modellen fryses.
- adapterbaseret finjusteringEn parameter-effektiv finjusteringsmetode, hvor små neurale moduler (adaptere) indsættes i et prætrænet sprogmodel-lag, og kun disse adaptere opdateres under træning.
- adapterlagEt adapterlag er et lille neuralt lag, der indsættes i en forudtrænet model og trænes for at tilpasse modellen til en ny opgave, uden at ændre de oprindelige vægte.
- AdapterLayerEt lille neuralt netværk med en flaskehals, der indsættes mellem lagene i en fortrænet model, så kun adapterlagets parametre opdateres under finjustering, mens resten af modellen forbliver frossen.
- AdaptersEn parameter-effektiv finjusteringsmetode, hvor små neurale moduler indsættes i en fortrænet model, så kun disse trænes.
- adaptiv learning rateEn teknik i træning af neurale netværk, hvor læringsraten automatisk justeres under træningen for at forbedre konvergens.
- adversarial trainingAdversarial training er en træningsteknik, hvor modellen trænes på både originale og bevidst forstyrrede (adversarial) eksempler for at øge robusthed over for modangreb.
- adversariel domænetilpasningAdversariel domænetilpasning er en teknik inden for transfer learning, der bruger en modstandsdrevet (adversarial) træningsproces til at lære domæne-invariante repræsentationer ved at minimere en klassifikationsfejl på kildedomænet samtidig med at en domæneklassifikator bedrages.
- agent workflowEn struktureret sekvens af handlinger, hvor autonome AI-agenter samarbejder om at udføre komplekse opgaver.
- agentbaseret modelleringAgentbaseret modellering er en simulationsmetode, hvor individuelle agenter med egne regler interagerer og skaber kompleks kollektiv adfærd.
- AI-assisteret kodningBrug af kunstig intelligens til at generere, foreslå eller fuldføre kildekode.
- AI-moderationAnvendelse af kunstig intelligens til automatisk at overvåge og regulere indhold på digitale platforme.
- alignment trainingTræning af en AI-model for at sikre, at dens adfærd overholder menneskelige værdier, intentioner og sikkerhedshensyn.
- API queryEn API query er en anmodning sendt til et API-endepunkt for at hente eller manipulere data, typisk brugt til at interagere med sprogmodeller.
- argmax-afkodningEn deterministisk afkodningsstrategi, hvor modellen ved hvert tidsskridt vælger det token med højest sandsynlighed.
- argmax-politikEn deterministisk politik, der for hver tilstand vælger den handling med højest estimeret værdi.
- artistic style transferArtistic style transfer er en teknik inden for computer vision, hvor en models stil fra et billede (f.eks. et maleri) overføres til indholdet af et andet billede, så resultatet beholder indholdets struktur men får stilens visuelle karakteristika.
- AttentionEn mekanisme i neurale netværk der vægter forskellige dele af inputtet forskelligt.
- augmenteringspipelineEn augmenteringspipeline er en række automatiserede transformationer anvendt på træningsdata for at øge datasættets variation og forbedre modelgeneralisation.
- AutogradAutograd er en automatisk differentieringsteknik, der beregner gradienter af en funktion i forhold til dens input ved at opbygge et beregningsgraf og anvende kædereglen.
- automatic differentiationAutomatisk differentiering er en samling teknikker til effektivt at beregne nøjagtige afledede af funktioner defineret af computerprogrammer.
- automatisk opsummeringTeknik inden for naturlig sprogbehandling, der automatisk producerer en kortfattet version af en længere tekst.
- autoregressiv generationEn genereringsteknik, hvor hvert nyt token i en sekvens forudsiges baseret på alle tidligere genererede tokens.
- backpropBackpropagation er en algoritme, der beregner gradienter af en tabsfunktion med hensyn til netværksvægte ved hjælp af kædereglen, hvilket muliggør gradient descent-optimering.
- BackpropagationBackpropagation er en algoritme, der beregner gradienten af en tabsfunktion med hensyn til netværkets vægte ved hjælp af kædereglen, hvilket muliggør gradientbaseret optimering i neurale netværk.
- Backpropagation gennem tidBackpropagation gennem tid (BPTT) er en algoritme til at beregne gradienter i tilbagevendende neurale netværk ved at udrulle netværket over tid og anvende den almindelige backpropagation på det udrullede netværk.
- Batch inferenceBatch inference er processen med at udføre modelinferens på en gruppe af input samples på én gang for at udnytte hardwareparallelisme og øge gennemløb.
- batch inference engineEn batch inference engine er et system, der behandler flere datapunkter samtidigt i en enkelt kørsel af en trænet model.
- batch normaliseringTeknik der normaliserer aktiveringer i et neuralt netværk ved at justere deres gennemsnit og varians inden for hver mini-batch under træning.
- Batch normalizationBatch normalization er en teknik, der normaliserer outputtet fra et lag i et neuralt netværk ved at trække batch-middelværdien og dividere med batch-standardafvigelsen for at reducere intern kovariateskift.
- batch-normaliseringslagEt batch-normaliseringslag er et lag i et neuralt netværk, der normaliserer aktiveringerne i et mini-batch ved at justere gennemsnit og varians for at stabilisere træningen.
- Bayesiansk inferensBayesiansk inferens er en statistisk metode, der opdaterer sandsynligheden for en hypotese baseret på ny evidens ved hjælp af Bayes' sætning.
- Beam searchBeam search er en heuristisk søgealgoritme, der til hvert tidstrin holder styr på de k mest sandsynlige sekvenser (stråler) for at generere outputtekst i sekvens-til-sekvens-modeller.
- beam search decodingBeam search er en afkodningsstrategi, der til hvert tidspunkt holder styr på de k mest sandsynlige sekvenser (beams) og udvælger den endelige sekvens med højest samlet sandsynlighed.
- beam widthBeam width er en hyperparameter i beam search, der bestemmer antallet af mest sandsynlige sekvenser, der bevares ved hvert dekodningstrin.
- benchmark-testEn standardiseret test eller evalueringsprocedure, der anvendes til at sammenligne ydeevnen af forskellige AI-modeller eller algoritmer.
- benchmarkingBenchmarking er den systematiske proces med at evaluere og sammenligne en AI-models ydeevne på standardiserede testdatasæt og opgaver.
- beskæringTeknik til at reducere størrelsen af en model ved at fjerne overflødige parametre eller forgreninger.
- beskæringsrateDen andel af parametre eller forbindelser i et neuralt netværk der fjernes under beskarring for at reducere modelstørrelse uden væsentligt tab af nøjagtighed.
- bias testingBias testing er en systematisk evaluering af en AI-models output for at identificere og måle skævheder baseret på følsomme attributter som køn, race eller alder.
- bias-detektionBias-detektion er processen med at identificere systematiske fejl eller skævheder i en AI-models output, som kan føre til uretfærdig eller diskriminerende behandling.
- bias-detektionsmetodeEn teknik eller metode til at identificere systematisk skævhed eller unfairness i en AI-models output eller træningsdata.
- bias-mitigationBias-mitigation er en samling af teknikker, der anvendes til at identificere, måle og reducere systematiske skævheder i AI-modellers data, træning eller beslutninger.
- bias-mitigationsstrategiEn bias-mitigationsstrategi er en systematisk metode til at reducere eller eliminere bias i AI-modellers data, træning eller output.
- bias-mitigationsteknikTeknikker til at reducere eller eliminere skævheder i kunstig intelligens, typisk opdelt i præ-processing, in-processing og post-processing metoder.
- billedgenerationBilledgeneration er processen med at skabe nye billeder fra en given beskrivelse eller betingelse ved hjælp af en AI-model.
- billedklassifikationsalgoritmeEn algoritme der automatisk tildeler en foruddefineret klasse-etiket til et inputbillede baseret på dets visuelle indhold.
- black-box adversarial attackEt black-box adversarial attack er et angreb på en maskinlæringsmodel, hvor angriberen kun har adgang til modellens input-output-adfærd og ikke kender modellens arkitektur, parametre eller træningsdata.
- BPE-segmenteringBPE-segmentering er en datakomprimeringstilpasset metode til deling af ord i underord-enheder baseret på hyppigste tegnpar.
- BPE-tokenEn BPE-token er en enhed af tekst genereret af Byte Pair Encoding, en subord-tokeniseringsalgoritme, der opdeler ord i hyppigt forekommende underenheder.
- BPE-tokeniseringBPE-tokenisering er en subword-tokeniseringsalgoritme, der iterativt fusionerer de hyppigste tegnpar til et nyt token.
- BPE-tokenizerEn tokeniseringsteknik, der anvender Byte Pair Encoding til at opdele tekst i underordsenheder (subwords) ved iterativt at flette de hyppigste tegnpar.
- BPE-vokabulariumEt vokabularium af subword-tokens, genereret ved Byte Pair Encoding-algoritmen.
- Byte Pair EncodingByte Pair Encoding (BPE) er en subord-tokeniseringsalgoritme, der opdeler ord i hyppige underenheder (subwords) ved iterativt at flette de hyppigste tegnpar.
- CAIConstitutional AI (CAI) er en metode til at justere sprogmodellers adfærd ved hjælp af et sæt skrevne principper (en 'forfatning'), som modellen trænes til at følge.
- CAI-justeringProces med at tilpasse en konversationel AI's adfærd til menneskelige forventninger, sikkerhedsretningslinjer eller specifikke opgaver.
- CBOWCBOW er en neural netværksarkitektur til at lære ordindlejringer ved at forudsige et målord ud fra dets kontekst.
- Chain-of-thoughtEn prompting-teknik, hvor modellen opfordres til at generere en ræsonnerende tankekæde trin for trin, før den giver et endeligt svar.
- chain-of-thought-patternEn prompting-teknik, hvor modellen opfordres til at generere en række mellemliggende ræsonnementstrin, før den afgiver det endelige svar.
- Chain-of-thought-promptingEn prompting-teknik hvor modellen opfordres til at generere mellemliggende ræsonnementstrin før det endelige svar for at forbedre nøjagtighed på komplekse opgaver.
- chat completionChat completion er en metode, hvor en sprogmodel genererer et svar baseret på en sekvens af beskeder i en samtale.
- chat completion endpointEn API-endpoint, der accepterer en liste af beskeder og returnerer et modelgenereret svar.
- CheckpointEn gemt kopi af en models vægte og træningstilstand på et bestemt tidspunkt under træning.
- checkpointingCheckpointing er teknikken at gemme en models vægte og optimerertilstand på bestemte tidspunkter under træning, så træningen kan genoptages fra det punkt.
- chunk-overlapChunk-overlap er den mængde af tegn eller tokens, der deles mellem to på hinanden følgende tekstbidder ved opdeling af et dokument.
- chunk-overlap-strategiEn teknik hvor dokumentchunks overlapper for at bevare kontekst ved splitpunkter.
- chunk-størrelseAntallet af tokens eller tegn pr. segment ved opdeling af et dokument til brug i retrieval-augmented generation.
- chunk-størrelsesparameterParameter der bestemmer den maksimale størrelse af tekststykker (chunks) ved opdeling af dokumenter i forbindelse med indeksering.
- chunk-størrelsesstrategiStrategi til valg af størrelsen på de segmenter (chunks), som et dokument opdeles i før indeksering i en RAG-pipeline, med afvejning mellem informationsmængde og præcision.
- ChunkingOpdeling af tekst i mindre enheder (chunks) for at optimere indeksering, søgning og indlejring i sprogmodeller.
- chunking-strategiEn metode til at opdele en tekst i mindre, semantisk eller strukturelt afgrænsede enheder (chunks) for at forbedre informationsgenfinding og behandling i RAG-systemer og sprogmodeller.
- classificationClassification er en overvåget læringsopgave, hvor modellen forudsiger en kategorisk etiket for en input baseret på trænede klasser.
- clusteringClusteranalyse er en uovervåget læringsmetode, der grupperer datapunkter i klynger baseret på lighed.
- conditional computationConditional computation er en teknik i neurale netværk, hvor kun en delmængde af modellens parametre aktiveres baseret på input, hvilket reducerer beregningsomkostningerne.
- conditional image generationEn generativ model der producerer billeder betinget af en given input, såsom en tekstbeskrivelse eller et klasseetikette.
- conditional routingEn teknik, hvor en models eller systems beslutnings-flow dynamisk dirigeres til forskellige behandlingsveje baseret på input-specifikke betingelser.
- confusion matrix heatmapEn confusion matrix heatmap er en grafisk repræsentation af en forvirringsmatrix, hvor celleværdier farvekodes for at visualisere klassifikationsydelse.
- Constitutional AIConstitutional AI er en metode til AI-sikkerhed og -alignment, hvor en model trænes ved hjælp af et sæt skrevne principper (en 'forfatning') til at styre sin adfærd gennem selvforbedring og feedback.
- content moderationProcessen med at overvåge, filtrere og håndtere brugergenereret indhold for at sikre overholdelse af retningslinjer og love.
- context cacheEn teknik, der gemmer mellemliggende repræsentationer (KV-cache) af tidligere behandlede tokens for at undgå genberegning under inferens af sprogmodeller.
- Context cachingTeknik til at gemme og genbruge tidligere beregnede repræsentationer af en kontekst for at reducere latens og beregningsomkostninger.
- Context engineeringContext engineering er den systematiske praksis at designe, strukturere og optimere den kontekst, der præsenteres for en sprogmodel for at styre dens output og opførsel.
- context window extensionTeknikker til at udvide den maksimale kontekstlængde en sprogmodel kan bearbejde i én fremadrettet passage.
- context window truncationTeknik til at forkorte en inputsekvens til den maksimale kontekststørrelse, som en sprogmodel kan håndtere, ved at fjerne dele af teksten.
- contrastive learningEn selvovervåget læringsmetode, hvor en model lærer repræsentationer ved at trække lignende eksempler tættere sammen og skubbe forskellige eksempler fra hinanden.
- contrastive learning objectiveEn træningsmetode hvor en model lærer at skelne mellem lignende og forskellige datapunkter ved at maksimere ligheden mellem positive par og minimere ligheden mellem negative par.
- convolutionEn matematisk operation, der anvender et filter (kernel) på inputdata for at detektere mønstre, og som udgør den grundlæggende byggesten i konvolutionelle neurale netværk.
- cosine annealingEn læringsrate-planlægningsteknik, der reducerer læringsraten efter en cosinusfunktion over et eller flere cyklusser.
- cross validationEn teknik til at evaluere en models præstation ved at opdele data i flere undergrupper, træne på nogle og teste på resten, gentagne gange.
- cross-modal learningLæring på tværs af forskellige datatyper som tekst, billede og lyd.
- cross-modal retrievalTeknik til at søge og matche data på tværs af forskellige modaliteter, fx tekst og billede.
- Curriculum learningTræningsstrategi hvor data præsenteres i en stigende sværhedsgrad for at forbedre læring og konvergens.
- Curriculum schedulerEn strategi under træning, der bestemmer rækkefølgen og tempoet for præsentationen af træningseksempler, typisk fra let til svært.
- cyklus-konsistensstabTab, der måler, hvor godt en model bevarer information ved transformation frem og tilbage mellem domæner.
- Data augmentationTeknik til at øge mængden af træningsdata ved at anvende transformationer på eksisterende data.
- Data DistillationTeknik til at overføre viden fra en stor model eller et stort datasæt til en mindre, mere effektiv model eller et komprimeret datasæt.
- Data labelingProcessen med at tilføje metadata (labels) til rådata for at gøre dem anvendelige til træning af overvågede maskinlæringsmodeller.
- Data Labeling PipelineEn data-labeling-pipeline er en struktureret arbejdsgang til at tildele etiketter til rådata, så de kan bruges til træning af overvågede maskinlæringsmodeller.
- Data parallelismData parallelism er en distribueringsteknik, hvor en model kopieres til flere enheder, og hver enhed trænes på en delmængde af data, mens gradienter synkroniseres.
- Data pipelineEn datapipeline er en sekvens af databehandlingstrin, der transporterer og transformerer rådata fra kilde til destinationssystem, ofte til brug i maskinlæringsmodeller.
- data-drift-detektionData-drift-detektion er processen med at overvåge og identificere ændringer i inputdatafordelingen over tid for at opdage, når en model modtager data, der afviger fra træningsdataene.
- data-drift-overvågningData-drift-overvågning er processen med at løbende overvåge og detektere ændringer i fordelingen af inputdata i en maskinlæringsmodel over tid.
- dataset distillationDataset distillation er en teknik, hvor man komprimerer et stort datasæt til et lille syntetisk datasæt, der bevarer nok information til at træne en model med sammenlignelig ydeevne.
- DBSCANDBSCAN er en tæthedsbaseret klyngealgoritme, der grupperer datapunkter baseret på deres nærhed og antallet af naboer, og som kan identificere støj.
- DDIMDDIM er en klasse af diffusionsmodeller der muliggør deterministisk og hurtig sampling ved at omgå Markov-kæde-antagelsen.
- deep deterministic policy gradientDeep Deterministic Policy Gradient (DDPG) er en reinforcement learning-algoritme, der kombinerer Q-learning med en deterministisk politik (policy) i et actor-critic-rammeværk til kontinuerte handlingsrum.
- deep learningDeep learning er en underkategori af maskinlæring, der anvender neurale netværk med mange lag (dybe arkitekturer) til at lære hierarkiske repræsentationer af data.
- Deep Q-learningDeep Q-learning er en forstærkningslæringsalgoritme, der bruger et dybt neuralt netværk til at tilnærme Q-funktionen, som vurderer kvaliteten af handlinger i en given tilstand.
- deep Q-networkDeep Q-network (DQN) er en forstærkningslæringsalgoritme, der bruger et dybt neuralt netværk til at approksimere Q-værdifunktionen, så en agent kan lære optimale politikker direkte fra højdimensionelle sensoriske input.
- Deep reinforcement learningDel af maskinlæring hvor en agent lærer at træffe beslutninger gennem interaktion med et miljø ved hjælp af dybe neurale netværk til at tilnærme værdi- eller politikfunktioner.
- deepfakeDeepfake er syntetisk medie (video, billede eller lyd) genereret ved hjælp af deep learning-modeller, typisk ved at bytte eller manipulere ansigter.
- Dense Passage RetrievalEn teknik inden for informationssøgning, der repræsenterer tekstpassager som tætte vektorer (embeddings) og finder relevante passager via vektorlighedssøgning.
- dense retrievalDense retrieval er en metode til informationssøgning, der bruger tætte vektorer (embeddings) til at repræsentere forespørgsler og dokumenter og beregner lighed mellem dem for at finde relevante resultater.
- dense retrieverEn retriever, der bruger tætte vektorrepræsentationer (embedding) til at matche en forespørgsel med relevante dokumenter i et vektorrum.
- depthwise separable convolutionEn convolutionsteknik der dekomponerer en standard convolution i en dybdevis convolution efterfulgt af en punktvis convolution, hvilket reducerer antallet af parametre og beregninger.
- diffusion samplingEn metode til at generere nye data ved at reversere en støjtilførselsproces i en diffusionsmodel.
- dimensionalitetsreduktionTeknikker til at reducere antallet af variable (dimensioner) i et datasæt, samtidig med at den væsentlige information bevares.
- direct preference optimizationEn metode til at finjustere sprogmodeller ved at optimere direkte på par af foretrukne og ikke-foretrukne svar, uden brug af reinforcement learning.
- DistillationEn teknik hvor en lille 'student'-model trænes til at efterligne opførselen af en stor 'teacher'-model, typisk ved at minimere en kombination af hard labels og soft labels (logits).
- distillation lossDistillation loss er tabsfunktionen i knowledge distillation, der måler forskellen mellem en lærer- og en elevmodels bløde sandsynlighedsfordelinger.
- diversitetsprøvetagningDiversitetsprøvetagning er en prøveudtagningsmetode, der vælger et repræsentativt sæt af data ved at maksimere variationen i egenskaber mellem prøverne.
- DomænetilpasningTeknik til at tilpasse en maskinlæringsmodel, der er trænet på et kildedomæne, til at fungere godt på et måldomæne med en anden fordeling.
- domænetilpasningTeknik inden for maskinlæring, hvor en model trænet på et kildedomæne tilpasses til at fungere godt på et måldomæne med en anden datadistribution.
- domænetilpasningsmetodeEn metode til at tilpasse en maskinlæringsmodel trænet på et kildedomæne til at fungere effektivt på et måldomæne med en anden datafordeling.
- domænetilpasningsteknikEn domænetilpasningsteknik er en metode til at justere en model, der er trænet på et kildedomæne, så den præsterer godt på et andet, men relateret, måldomæne.
- DPODPO er en metode til at tilpasse sprogmodeller ved at optimere direkte på præferencepar uden brug af reinforcement learning.
- DPO-træningDPO-træning er en metode til at finjustere sprogmodeller direkte på præferencedata uden brug af en belønningsmodel.
- DPO-træningEn træningsmetode, der optimerer en sprogmodel direkte ud fra præferencepar uden behov for et belønningsmodul.
- draft modelEn mindre, hurtig sprogmodel der genererer foreløbige tokens som verificeres af en større målmodel for at accelerere inferens.
- DreamerDreamer er en modelbaseret forstærkningslæringsalgoritme, der lærer en verdensmodel fra erfaring og bruger den til at planlægge og lære adfærd via forestillede trajektorier.
- DreamerV2DreamerV2 er en modelbaseret forstærkningslæringsalgoritme, der lærer en latent verdensmodel via en rekurrent state-space model (RSSM) og optimerer en politik ved at rulle frem i latent rum.
- DropoutDropout er en regulariseringsteknik, hvor tilfældige neuroner midlertidigt fjernes under træning for at mindske overfitting.
- dropout-lagEt dropout-lag er et regulariseringslag i et neuralt netværk, der tilfældigt deaktiverer en brøkdel af neuronerne under træning for at forhindre overfitting.
- dropout-rateHyperparameter der angiver sandsynligheden for at en neuron deaktiveres under dropout-regulering.
- Dropout-regulariseringDropout-regularisering er en teknik under træning af neurale netværk, hvor tilfældigt udvalgte neuroner midlertidigt deaktiveres for at mindske risikoen for overfitting.
- early stoppingEarly stopping er en reguleringsteknik, hvor træningen afbrydes, når modellens ydeevne på en valideringsmængde ikke længere forbedres.
- Edge inferenceKørsel af en trænet maskinlæringsmodel på en lokal enhed (fx mobiltelefon eller IoT-enhed) i stedet for i skyen.
- ekstraktiv resumé-genereringEn automatisk metode til at skabe et resumé af en tekst ved at udvælge de vigtigste sætninger eller sætningsdele direkte fra kildeteksten.
- Elastic Net-regressionElastic Net-regression er en lineær regressionsmodel, der kombinerer L1- og L2-regulering for at opnå både variabelselektion og håndtering af multikollinearitet.
- Elastic Net-regulariseringElastic Net-regularisering er en kombination af L1- og L2-regulering, der både kan udvælge variable og håndtere multikollinearitet.
- EmbeddingEn embedding er en kompakt, tæt vektorrepræsentation af et objekt (fx et ord, en sætning eller et billede) i et kontinuert vektorrum, hvor semantisk lighed svarer til geometrisk nærhed.
- embeddingopslagEmbeddingopslag er processen med at slå en embedding op i en vektordatabase eller fra en indlejringstavle i en model.
- epoch-loss curveEn graf, der viser trænings- og valideringstab som funktion af antallet af epoker under træning af en model.
- epoch-loss plotEn graf der viser tabet efter hver epoke under træning af en maskinlæringsmodel.
- ETL-pipelineETL-pipeline er en dataarbejdsproces, der udtrækker data fra kilder, transformerer dem til analyseformål og indlæser dem i et målsystem.
- eval-målingsprotokolEn standardiseret procedure til måling og evaluering af en AI-models ydeevne, typisk omfattende både metrikker og et sæt testdata.
- eval-pipelineEn eval-pipeline er en struktureret sekvens af trin til systematisk evaluering af en AI-models ydeevne, typisk indeholdende dataindlæsning, kørsel af inference, beregning af metrikker og rapportering.
- feature engineeringFeature engineering er processen med at udvælge, transformere og skabe relevante inputvariable (features) fra rådata for at forbedre præstationen af maskinlæringsmodeller.
- feature extractionFeature extraction er processen med at omdanne rådata til et sæt meningsfulde attributter (features), der kan bruges til maskinlæring eller mønstergenkendelse.
- feature selectionProces hvor en delmængde af relevante features (inputvariable) udvælges til brug i en model.
- feature store-pipelineEn pipeline der automatiserer processen med at oprette, validere og levere features til en feature store.
- few-shot chain-of-thoughtFew-shot chain-of-thought er en prompting-teknik, hvor man giver sprogmodellen nogle få eksempler, der hver især indeholder et ræsonnementstrin, så modellen lærer at ræsonnere før den svarer.
- Few-shot classificationEn klassifikationsmetode, hvor en model lærer at genkende nye klasser med kun få træningseksempler per klasse.
- few-shot klassifikationEn maskinlæringsopgave, hvor en model skal klassificere nye klasser baseret på meget få labeled eksempler (typisk 1-5 per klasse).
- few-shot klassifikatorEn klassifikator der kan genkende nye klasser efter træning på kun få eksempler per klasse.
- Few-shot learningFew-shot learning er en maskinlæringsparadigme, hvor en model trænes til at generalisere fra et meget lille antal mærkede eksempler per klasse.
- Few-shot object detectionTeknik inden for computer vision, der gør det muligt at detektere objekter fra nye klasser med kun få annoterede eksemplarer.
- few-shot promptingFew-shot prompting er en prompting-teknik, hvor brugeren inkluderer et lille antal eksempler (typisk 2-5) i prompten for at guide modellens respons uden at opdatere modelvægtene.
- few-shot regressionEn maskinlæringsteknik, hvor en model trænes til at forudsige kontinuerte værdier baseret på kun få eksempler.
- FGSMFGSM er et hurtigt gradientbaseret angreb, der genererer adversarial examples ved at tilføje støj i retning af gradientens fortegn.
- Fine-tuningTræning af en forudtrænet model på en specifik opgave med et mindre datasæt for at tilpasse modellens vægte.
- finjusteringFinjustering er processen med at videreoplære en allerede trænet model på en specifik, ofte mindre, mængde data for at tilpasse den til en bestemt opgave eller domæne.
- forstærkende læringForstærkende læring er en maskinlæringsteknik, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger eller straf.
- forstærkningslæringEn type maskinlæring, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger.
- forstærkningslæringForstærkningslæring er en maskinlæringsteknik, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger eller straf for sine handlinger.
- forstærkningslæringsalgoritmeEn algoritme der træner en agent til at tage handlinger i et miljø for at maksimere en kumulativ belønning.
- fortolkningsteknikEn metode til at forstå eller forklare, hvordan en AI-model træffer beslutninger.
- fortræningsmålEt fortræningsmål er den specifikke opgave, en sprogmodel optimeres på under den indledende træning på store mængder umærkede data.
- ForudtræningForudtræning er en teknik, hvor en model først trænes på en stor, generel datasæt for at lære bredrepræsentationer, før den finjusteres på en specifik opgave.
- forventningsmaksimeringForventningsmaksimering (EM) er en iterativ metode til at finde maksimum likelihood-estimater for parametre i statistiske modeller med latente variable.
- forward-mode ADEn teknik inden for automatisk differentiering, hvor derivater beregnes ved at propagere tangentinformation fremad gennem beregningsgrafen, én uafhængig variabel ad gangen.
- foundation model promptingPraksis med at designe input-prompter til at styre fundamentale modellers output.
- fuld fine-tuningEn træningsmetode hvor alle parametre i en prætrænet model opdateres under tilpasning til en ny opgave.
- full fine tuningFull fine tuning er en finjusteringsmetode, hvor samtlige parametre i en prætrænet model opdateres under træning på en specifik opgave.
- function call APIEn API, der gør det muligt for en sprogmodel at returnere strukturerede kald til eksterne funktioner i stedet for naturligt sprog.
- Function callingEvnen hos en sprogmodel til at generere strukturerede kald til eksterne funktioner eller API'er baseret på brugerens hensigt.
- funktionskaldTeknik, hvor en sprogmodel kan anmode om at udføre en foruddefineret funktion og integrere resultatet i sit svar.
- generalized zero-shot learningGeneralized zero-shot learning (GZSL) er en læringsteknik, hvor modellen under testning klassificerer både sete og hidtil usete klasser, i modsætning til traditionel zero-shot learning, der kun tester på usete klasser.
- glidende vindueEn teknik, hvor et vindue af fast størrelse glider over en sekvens for at udføre en operation på hvert delafsnit.
- GloVe-embeddingsGloVe (Global Vectors for Word Representation) er en teknik til at generere ordindlejringer ved at faktorisere en ord-samtidighedsmatrix baseret på globale tekststatistikker.
- GPU-accelerationGPU-acceleration er brug af en grafikprocessor (GPU) til at udføre parallelle beregninger hurtigere end en almindelig CPU.
- GPU-accelereretGPU-accelereret betyder at udnytte en grafikprocessor (GPU) til at udføre beregninger hurtigere end en almindelig CPU, især til parallelle opgaver som træning af neurale netværk.
- gradientnedstigningGradientnedstigning er en iterativ optimeringsalgoritme, der minimerer en funktion ved at bevæge sig i modsat retning af gradienten.
- Greedy decodingEn sekvensgenereringsstrategi, der ved hvert trin vælger det mest sandsynlige næste token.
- greedy searchGreedy search er en dekodningsstrategi, der ved hvert trin vælger det mest sandsynlige næste token uden at overveje fremtidige konsekvenser.
- grounding pipelineEn grounding-pipeline er et system, der forbinder en sprogmodels output med eksterne datakilder eller sensoriske input for at forankre modellens svar i faktisk viden eller virkeligheden.
- Guardrail ValidatorEn komponent eller system, der kontrollerer AI-output mod foruddefinerede sikkerhedsregler (guardrails) for at forhindre skadeligt eller uhensigtsmæssigt indhold.
- guardrail-layerEt guardrail-layer er en ekstra komponent i en AI-model, der håndhæver sikkerheds- eller adfærdsbegrænsninger ved at filtrere eller ændre modeloutputtet.
- guardrail-stackingTeknikken at anvende flere lag af sikkerhedsrestriktioner (guardrails) i en AI-pipeline for at øge robusthed og forhindre uønsket output.
- GuardrailsEt sæt af regler, filtre eller mekanismer, der forhindrer en AI-model i at producere skadelige, upassende eller uønskede output.
- guardrails-configurationGuardrails-configuration er opsætningen af regler, begrænsninger og kontrolmekanismer, der sikrer, at en AI-model opfører sig sikkert og etisk forsvarligt.
- Guardrails-frameworkEt guardrails-framework er et system af regler, validatorer og korrektioner, der anvendes til at styre og begrænse output fra sprogmodeller for at sikre sikkerhed, overholdelse og pålidelighed.
- Guardrails-pipelineEn Guardrails-pipeline er en sekvens af sikkerhedsforanstaltninger, der validerer, filtrerer og korrigerer input og output i en AI-model for at forhindre uønsket eller skadelig adfærd.
- Hallucination detectionHallucination detection er processen med at identificere eller kvantificere hallucinationer i output fra sprogmodeller.
- He initializationEn metode til at initialisere vægte i neurale netværk, der tager højde for ReLU-aktiveringsfunktionens egenskaber ved at sætte variansen til 2/n_in.
- hierarchical planningEn metode inden for AI, hvor et komplekst problem opdeles i hierarkiske delmål eller delopgaver, som planlægges og løses på forskellige abstraktionsniveauer.
- hierarkisk clusteringHierarkisk clustering er en metode til at gruppere data i et hierarki af klynger, hvor klyngerne indlejres i hinanden i et dendrogram.
- hybrid parallelismHybrid parallelism kombinerer data- og modelparallelisme for at fordele træningen af store neurale netværk på tværs af flere GPU'er eller noder.
- hybrid rankingHybrid ranking er en søgeteknik, der kombinerer mindst to forskellige rangeringsmetoder, typisk en leksikalsk (f.eks. BM25) og en semantisk (f.eks. cosine similarity), for at forbedre relevansen af søgeresultater.
- hybrid retrieval-pipelineEn søgepipeline der kombinerer to eller flere forskellige retrieval-metoder — typisk en semantisk (dense) og en leksikalsk (sparse) — for at forbedre kvaliteten af de hentede dokumenter i en RAG-arkitektur.
- hybrid søgningSøgemetode der kombinerer leksikalsk søgning (f.eks. BM25) med vektorbaseret semantisk søgning for at forbedre relevans og dækning.
- hybrid søgningHybrid søgning kombinerer dense vector search (semantisk søgning) med sparse keyword search (f.eks. BM25) for at forbedre relevans og recall i informationssøgning.
- hybrid søgningHybrid søgning kombinerer nøgleordsbaseret (f.eks. BM25) og vektorbaseret (f.eks. embedding-cosine-lighed) søgning for at forbedre relevans og dækning i informationsgenfinding.
- hybrid søgningsalgoritmeEn hybrid søgningsalgoritme kombinerer to eller flere forskellige søgemetoder, typisk leksikalsk (f.eks. BM25) og semantisk (vektor-søgning), for at opnå bedre resultater end hver metode alene.
- hybrid søgningsmetodeEn søgningsmetode der kombinerer traditionel nøgleordsbaseret søgning (fx BM25) med semantisk søgning baseret på vektorembeddings for at forbedre relevansen.
- hybrid søgningsmodelEn søgestrategi der kombinerer traditionel søgning baseret på nøgleord (f.eks. BM25) med semantisk søgning baseret på vektorembeddings for at forbedre relevansen af søgeresultater.
- hyperparametersøgningEn systematisk metode til at finde optimale hyperparametre til en maskinlæringsmodel.
- ikke-superviseret læringEn maskinlæringsmetode, hvor modellen lærer mønstre i data uden brug af forhåndsannoterede labels.
- image augmentationTeknik til at øge mangfoldigheden af træningsdata ved at anvende tilfældige, men realistiske transformationer på eksisterende billeder.
- Image classificationBilledklassifikation er opgaven at tildele et klassemærke til et inputbillede baseret på dets visuelle indhold.
- Image generationTeknik med kunstig intelligens til at skabe nye billeder baseret på en given betingelse eller tilfældig støj.
- image segmentationTeknik der opdeler et digitalt billede i flere segmenter eller regioner for at forenkle analyse.
- image-to-image generationBillede-til-billede generation er en teknik inden for generativ AI, hvor et inputbillede transformeres til et outputbillede, ofte styret af en tekstprompt eller en målstil.
- implicit bias-afbødningImplicit bias-afbødning er processen med at reducere utilsigtede skævheder i AI-modellers adfærd, som opstår fra underliggende stereotyper eller skæve træningsdata.
- In-context learningIn-context learning er en metode, hvor en sprogmodel lærer at udføre en opgave udelukkende ved hjælp af eksempler i prompten, uden at opdatere sine vægte.
- incremental learning algorithmEn type maskinlæringsalgoritme, der opdaterer sin model løbende efterhånden som nye data bliver tilgængelige, uden at skulle genlære hele datasættet.
- indirekte prompt injectionIndirekte prompt injection er en form for prompt injection-angreb, hvor modellen angribes via en sekundær kilde (f.eks. en hjemmeside eller et dokument) i stedet for direkte brugerinput.
- inference accelerationInference acceleration betegner teknikker og metoder til at reducere beregningstiden og ressourceforbruget ved at anvende en trænet AI-model til inferens.
- inference optimizationSamling af teknikker til at reducere beregningsomkostningerne og forsinkelsen ved at køre en trænet model, uden at ændre på træningen.
- inference pipelineEn inference pipeline er en sekvens af forarbejdningstrin, der anvender en trænet model til at producere forudsigelser fra rå inputdata.
- inference-modeI inferens-tilstand kører en model uden træning, kun til at lave forudsigelser.
- inferens accelerationTeknikker til at øge hastigheden af inferens i neurale netværk uden at ændre modelarkitekturen væsentligt.
- Instruction fine-tuningEn teknik hvor en prætrænet sprogmodel viderefinjusteres på et datasæt af instruktioner og forventede svar for at forbedre dens evne til at følge instruktioner.
- instruktionsfinjusteringInstruktionsfinjustering er en træningsmetode, hvor en fortrænet sprogmodel finjusteres på et datasæt af instruktion-svar-par for at forbedre modellens evne til at følge instruktioner.
- int8 kvantiseringPræcisionsreduktion af modelvægte og aktiveringer til 8-bit heltalsværdier for at opnå lavere hukommelsesforbrug og hurtigere inferens.
- interpolationsmetodeEn metode til at estimere værdier mellem kendte datapunkter, ofte anvendt i maskinlæring til at udfylde manglende data eller generere nye repræsentationer.
- interpretabilitetsmetodeEn metode til at gøre en maskinlæringsmodel beslutningsproces forståelig for mennesker.
- interpretabilitetsværktøjVærktøj der bruges til at analysere og visualisere, hvordan en AI-model træffer beslutninger.
- Inverse reinforcement learningInverse reinforcement learning (IRL) er en teknik, hvor en agent lærer en belønningsfunktion ud fra observeret adfærd.
- iterationsbaseret optimeringEn optimeringsmetode der gentagne gange opdaterer parametre baseret på en fejlfunktions gradient for at minimere fejlen.
- iterativ træningTræning af en model gentagne gange i cyklusser, hvor hver iteration forbedrer modellen baseret på tidligere resultater.
- JailbreakTeknik til at omgå sikkerhedsforanstaltninger og restriktioner i en sprogmodel for at få den til at producere ellers blokerede outputs.
- jailbreak-angrebEt jailbreak-angreb er et forsøg på at omgå en AI-models sikkerhedsforanstaltninger ved hjælp af specialdesignede prompter eller kontekster.
- jailbreak-metodeEn metode til at manipulere en sprogmodel til at ignorere dens sikkerhedstræning og generere forbudt eller skadeligt indhold.
- jailbreak-promptEn jailbreak-prompt er en specialdesignet prompt, der forsøger at omgå en AI-models sikkerhedsrestriktioner og få den til at generere ellers blokeret indhold.
- jailbreak-teknikEn metode til at omgå de sikkerhedsforanstaltninger, der er indbygget i en sprogmodel, for at få den til at producere indhold, den normalt ville blokere.
- jax.vmapjax.vmap er en funktion i JAX, der automatisk vektoriserer en funktion ved at tilføje en batch-dimension.
- k-fold cross-validationK-fold cross-validation er en valideringsteknik, hvor datasættet opdeles i k lige store dele, og modellen trænes og evalueres k gange, hver gang med en anden del som testdata og resten som træningsdata.
- k-meansEn clustering-algoritme, der deler et datasæt i k grupper ved at minimere den samlede afstand mellem punkterne og deres nærmeste gruppecentrum.
- k-means clusteringEn iterativ algoritme til at partionere et datasæt i k clusters, hvor hvert punkt tilhører det cluster med nærmeste centroid.
- kausal sprogmodelleringKausal sprogmodellering er en træningsteknik for sprogmodeller, hvor målet er at forudsige næste token givet alle foregående tokens i en strengt venstre-mod-højre retning.
- kernel-tæthedsestimatKernel-tæthedsestimat er en ikke-parametrisk metode til at estimere sandsynlighedstætheden af en tilfældig variabel baseret på en stikprøve.
- Knowledge distillationEn teknik hvor en kompakt 'elevmodel' trænes til at efterligne adfærden fra en større 'lærermodel' ved at bruge dens output-sandsynligheder.
- Knowledge Graph CompletionTeknik til at forudsige manglende kanter (relationer) i en vidensgraf baseret på eksisterende entiteter og relationer.
- knowledge graph embeddingTeknik der repræsenterer entiteter og relationer i en videnstruktur (knowledge graph) som vektorer i et kontinuerligt rum.
- KV cacheEn KV cache er en hukommelsesstruktur, der gemmer Key- og Value-vektorerne fra tidligere attention-beregninger i en transformer-model for at undgå genberegning under autoregressiv generering.
- kvantiseringTeknik til at reducere præcisionen af en models vægte og aktiveringer for at formindske modelstørrelse og øge inferenshastighed.
- kvantiseringsbevidst træningEn træningsmetode, hvor kvantiseringens effekter simuleres under træning for at opnå en model, der bevarer præcision efter kvantisering.
- L1-regulariseringL1-regularisering er en regulariseringsteknik, der tilføjer en straf proportional med summen af de absolutte værdier af modelparametrene for at fremme sparsomhed.
- L1-regularizationTeknik der tilføjer en straf proportional med summen af de absolutte værdier af modelvægte for at fremme sparsommelighed.
- L2-regulariseringL2-regularisering er en regulariseringsteknik, der tilføjer en straf proportional med kvadratet af modelparametrenes værdi for at mindske overfitting.
- L2-regularizationEn reguleringsteknik, der tilføjer en straf til tabet baseret på kvadratet af vægtenes L2-norm for at forhindre overfitting.
- labelingProcessen med at tildele etiketter (labels) til data som grundlag for træning af en maskinlæringsmodel.
- Langevin dynamicsLangevin dynamics er en stokastisk differentialligningsbaseret metode til at generere prøver fra en sandsynlighedsfordeling ved at tilføje støj til gradienten af fordelingens energi.
- LassoLasso er en regulariseringsmetode til lineær regression, der anvender L1-straf for at fremme sparsommelighed og automatisk variabelselektion.
- Lasso-regressionLasso-regression er en lineær regressionsmetode, der anvender L1-regularisering til at udvælge variable og forhindre overfitting ved at straffe absolutte koefficientstørrelser.
- latent diffusionLatent diffusion er en generativ teknik, der udfører diffusionsprocessen i et latenterum i stedet for pixelrummet, hvilket reducerer beregningsomkostningerne.
- latent space interpolationTeknik hvor man gradvist skifter mellem to punkter i et latent rum for at skabe nye, meningsfulde output.
- latent space traversalTeknik inden for generative modeller, hvor man bevæger sig gennem latent rum for at generere nye prøver, typisk via interpolation mellem latente vektorer.
- latent space walkEn teknik, hvor man gradvist ændrer latente vektorer for at generere en jævn overgang mellem punkter i et generativt models latentrum.
- Layer normalizationLayer normalization er en normaliseringsteknik, der standardiserer aktiveringerne over feature-dimensionen for hvert træningseksempel ved at trække middelværdien og dividere med standardafvigelsen.
- LeakyReLUAktiveringsfunktion der tillader en lille negativ gradient for negative input.
- LeakyReLULeakyReLU er en aktiveringsfunktion der tillader en lille, positiv gradient for negative input, hvilket adresserer problemet med døende neuroner i ReLU.
- learning rate warmupEn træningsteknik, hvor learning rate gradvist øges fra en lille værdi til den planlagte startværdi over et antal steps eller epochs.
- leave-one-out cross-validationEn krydsvalideringsteknik hvor modellen trænes på alle dataundtagen én observation, som bruges til test, og dette gentages for hver observation.
- left-side truncationTeknik til at forkorte en sekvens ved at fjerne tidlige dele og bevare de seneste, typisk anvendt i sprogmodeller til at holde sig inden for kontekstvinduet.
- lineær interpolationEn metode til at estimere en værdi mellem to kendte punkter ved at antage en lineær sammenhæng.
- lineær regressionEn statistisk metode der modellerer sammenhængen mellem en afhængig variabel og en eller flere uafhængige variable ved at tilpasse en lineær ligning til observerede data.
- LLM-as-a-JudgeTeknik hvor en sprogmodel (fx GPT-4) bruges til at evaluere eller score output fra en anden sprogmodel, typisk ved at give en karakter eller vurdere kvalitet ud fra en rubrik.
- LLM-pipelineEn LLM-pipeline er en struktureret sekvens af behandlingstrin, der forbereder input, kalder en sprogmodel og efterbehandler outputtet til en specifik opgave.
- load balancingFordeling af arbejdsbyrde (beregning, data) på tværs af flere ressourcer (GPU'er, servere) for at optimere ydeevne og undgå overbelastning.
- LoRALoRA (Low-Rank Adaptation) er en teknik til parameter-effektiv finjustering, hvor der tilføjes trænelige lavrankede matricer til de eksisterende vægte i en fortrænet model.
- LoRA-alphaEn hyperparameter i LoRA, der skalerer den lavrangs-opdatering af vægtene under finjustering.
- LoRA-justeringEn parameter-effektiv finjusteringsmetode, der tilpasser store sprogmodeller ved at indsætte lav-rank opdateringer i vægtmatricer i stedet for at opdatere alle parametre.
- LoRA-opsætningOpsætning og konfiguration af LoRA (Low-Rank Adaptation) til finjustering af store sprogmodeller.
- LoRA-opsætningLoRA-opsætning refererer til konfigurationen og anvendelsen af Low-Rank Adaptation (LoRA) til at finjustere store sprogmodeller ved at indsætte trænbare, lavrangs-matricer.
- LoRA-rankLoRA-rank er en hyperparameter, der bestemmer dimensionen af de lav-rankede matricer, der bruges til at tilpasse en fortrænet model i LoRA-fintuning.
- LoRA-vægteLoRA-vægte er en lille mængde trænlige, lavrangsmatricer, der lægges til de frosne basisvægte i en stor sprogmodel for at opnå effektiv fintuning.
- Low-Rank AdaptationLow-Rank Adaptation (LoRA) er en parameter-effektiv finjusteringsteknik, hvor de oprindelige vægte i en forudtrænet model fryses, og der i stedet indsættes trænede, lavrangstillægsmatricer i modellens lag.
- masked self-attentionEn mekanisme i transformer-modeller hvor hvert element i en sekvens kun kan se tidligere elementer (og sig selv) via attention, typisk ved at anvende en maske over fremtidige positioner.
- maskeret sprogmodelleringEn træningsteknik, hvor en del af tokens i en inputsekvens skjules, og modellen trænes til at forudsige de maskerede tokens baseret på konteksten.
- MCP-protokolEn protokol til at strukturere og overføre kontekst mellem forskellige AI-modeller eller -komponenter i et system.
- meta learningMaskinlæringsteknik, hvor en model trænes til at lære at lære, så den hurtigt kan tilpasse sig nye opgaver med få eksempler.
- meta-learnerEn meta-learner er en model eller algoritme, der lærer at tilpasse sig nye opgaver med få eksempler ved at træne på en distribution af opgaver.
- meta-læringMeta-læring er en maskinlæringsteknik, hvor en model lærer at forbedre sin egen indlæringsproces på tværs af flere opgaver.
- ML-pipelineEn ML-pipeline er en struktureret sekvens af databehandlings- og modeltrin, der automatiserer et maskinlærings workflow fra rådata til produktion.
- MLOpsMLOps er et sæt af praksisser, der kombinerer maskinlæring, DevOps og data engineering for at sikre pålidelig og effektiv implementering og vedligeholdelse af ML-modeller i produktion.
- MLOps-pipelineEn automatiseret sekvens af trin, der håndterer hele livscyklussen for maskinlæringsmodeller: fra dataforberedelse og træning til implementering, overvågning og genoptræning.
- model compressionSamling af teknikker, der reducerer størrelsen og beregningsbehovet for en AI-model, samtidig med at præstationen bevares så godt som muligt.
- model forklaringModel forklaring refererer til metoder og teknikker, der anvendes til at forstå og fortolke, hvorfor en AI-model træffer bestemte beslutninger eller forudsigelser.
- model parallelismModelparallelisme er en teknik til at fordele en stor neurale netværksmodel på tværs af flere enheder ved at opdele selve modellen i dele.
- model pruningEn teknik, hvor overflødige parametre i en neural netværk fjernes for at reducere modelstørrelse og beregningsomkostninger.
- Model servingModel serving er processen med at hoste en trænet maskinlæringsmodel og eksponere den via en API, så andre systemer eller brugere kan sende data til modellen og få forudsigelser tilbage.
- model serving pipelineEn model serving pipeline er et automatiseret system, der håndterer forbehandling, inferens og efterbehandling af data, så en maskinlæringsmodel kan betjenes som en API i produktion.
- model snapshotEn model snapshot er en gemt kopi af en models vægte og tilstand på et bestemt tidspunkt under træning.
- model snapshot-lagringTeknikken at gemme en models vægte og tilstand på et bestemt tidspunkt under træning.
- model-based reinforcement learningEn tilgang inden for reinforcement learning, hvor agenten lærer en model af miljøets dynamik og bruger denne model til at planlægge eller simulere handlinger.
- model-checkpointEn gemt tilstand af en models vægte og optimeringstilstand under træning, så processen kan genoptages eller evalueres senere.
- model.eval()En metode i PyTorch der skifter modellen til evalueringstilstand, hvilket deaktiverer dropout og fikserer batch-normaliseringslag.
- modelkomprimeringModelkomprimering er en samling af teknikker til at reducere størrelsen og beregningskompleksiteten af en trænet maskinlæringsmodel uden væsentligt tab af præcision.
- modelkomprimeringTeknikker til at reducere størrelsen og beregningsomkostningen af en AI-model uden væsentligt tab af nøjagtighed.
- modelkomprimerings-teknikEn teknik til at reducere størrelsen og/eller beregningskompleksiteten af en AI-model med minimalt tab af ydeevne.
- Monte Carlo-simuleringMonte Carlo-simulering er en beregningsmetode, der bruger tilfældig sampling til at løse problemer, der er deterministiske i naturen.
- multi-agent reinforcement learningEn gren af reinforcement learning, hvor flere agenter interagerer i et fælles miljø og lærer at optimere deres politikker, enten kooperativt, konkurrerende eller i blandede scenarier.
- multi-klasse billedklassifikationMulti-klasse billedklassifikation er opgaven at tildele et inputbillede én klasseetikette fra et foruddefineret sæt af flere (≥3) kategorier, typisk ved hjælp af en maskinlæringsmodel.
- multimodal fusionMultimodal fusion er processen med at kombinere information fra flere forskellige datatyper (modaliteter) som tekst, billede og lyd for at skabe en samlet repræsentation.
- multimodal learningMultimodal læring er en maskinlæringsteknik, hvor en model trænes på data fra flere forskellige modaliteter (fx tekst, billeder, lyd) samtidigt for at lære tværmodale repræsentationer.
- MuZero-søgningEn Monte Carlo-træsøgning, der anvender en lært model af dynamik og belønning i et latent repræsentationsrum.
- Naive BayesEn familie af probabilistiske klassifikationsalgoritmer baseret på Bayes' sætning med antagelse om betinget uafhængighed mellem features givet klassen.
- Nesterov momentumEn forbedring af momentum-optimering, hvor gradienten beregnes efter en foreløbig opdatering af parametrene.
- neural retrievalNeural retrieval er en metode inden for informationsgenfinding, hvor neurale netværk bruges til at finde relevante dokumenter eller data baseret på en forespørgsel.
- neural style transferNeural style transfer er en teknik, der anvender dybe neurale netværk til at overføre stilen fra ét billede til indholdet af et andet.
- neural text-to-speechNeural text-to-speech er en teknik, der bruger dybe neurale netværk til at omdanne skrevet tekst til naturligt lydende tale.
- NF4-kvantiseringNF4-kvantisering er en 4-bit kvantiseringsmetode, der bruger et normaliseret float-format til at repræsentere vægte i neurale netværk, udviklet til QLoRA for at reducere hukommelsesforbrug uden væsentligt tab af præcision.
- NLP-pipelineEn sekvens af forarbejdningstrin, der behandler rå tekst til en struktureret repræsentation, typisk i natural language processing.
- nucleus samplingEn stikprøveteknik til tekstgenerering, hvor man vælger fra den mindste mængde tokens, hvis kumulative sandsynlighed overstiger en tærskel p.
- Object detectionComputer vision-teknik til at lokalisere og klassificere objekter i billeder eller video.
- OCR-scanningOCR-scanning er en teknologi, der omdanner billeder af tekst til maskinlæsbar tekst ved hjælp af mønstergenkendelse og kunstig intelligens.
- OCR-teknologiOCR-teknologi er en teknik til at genkende og digitalisere tekst fra billeder eller scannede dokumenter.
- offline data augmentationOffline data augmentation er en teknik, hvor træningsdata udvides ved at anvende transformationer på forhånd, før modellen trænes.
- one shot learningOne shot learning er en maskinlæringsteknik, hvor en model trænes til at genkende nye klasser baseret på kun ét træningseksempel per klasse.
- one-shot klassifikationEn maskinlæringsteknik, hvor en model klassificerer nye datapunkter efter kun at have set ét eksempel per klasse.
- online augmenteringspipelineEn online augmenteringspipeline er en real-time dataforøgelsesproces, der anvender transformationer direkte på træningsdata under modeltræning i stedet for at forberede augmenterede data på forhånd.
- online data augmentationTeknik hvor dataforøgelse anvendes i realtid under træning, så hver epoch genererer nye varianter af træningsdata.
- Optical character recognitionOptical character recognition (OCR) er en teknologi til at omdanne billeder af trykt eller håndskrevet tekst til maskinlæsbar tekst.
- ord-embeddingEn teknik inden for naturlig sprogbehandling, hvor ord repræsenteres som tætte vektorer i et kontinuert vektorrum.
- ordindlejringEn ordindlejring er en teknisk metode, der kortlægger ord til tætte vektorer i et kontinuert vektorrum, så ord med lignende betydning har lignende repræsentationer.
- overlap-tokensOverlap-tokens refererer til enten (1) overlappende vinduer af tokens i sekvensbehandling eller (2) antallet af fælles tokens mellem to sæt anvendt i evalueringsmetrikker.
- padding tokenEt padding token er et specialtoken, der tilføjes til korte sekvenser for at opnå ensartet længde i et batch.
- parallel computingParallel computing er en beregningsmetode, hvor mange beregninger eller processer udføres samtidigt ved at opdele et problem i mindre delopgaver, der løses simultant.
- parallel decodingParallel decoding er en inferensteknik, hvor flere tokens genereres samtidigt i stedet for sekventielt for at fremskynde sprogmodeller.
- Parallel Function CallingTeknik hvor en LLM kalder flere funktioner samtidigt i én enkelt tur, i stedet for sekventielt.
- parameter-effektiv fine-tuningParameter-effektiv fine-tuning betegner en samling af teknikker, hvor kun et lille antal ekstra parametre opdateres under finjustering, mens hovedparten af en fortrænet models parametre fryses.
- parameter-effektiv finjusteringParameter-effektiv finjustering (PEFT) refererer til en klasse af metoder, der finjusterer store fortrænede modeller ved kun at opdatere et lille antal parametre, mens resten forbliver frosne.
- Parameter-Efficient Fine-TuningParameter-Efficient Fine-Tuning (PEFT) er en samling teknikker, der opdaterer kun et lille antal modelparametre under finjustering, mens størstedelen af den forudtrænede model fryses.
- Parameter-justeringProces hvor en models parametre ændres for at forbedre ydeevnen, typisk ved hyperparameteroptimering eller finjustering.
- parametereffektiv finjusteringParametereffektiv finjustering er en teknik til at tilpasse store sprogmodeller til specifikke opgaver ved kun at opdatere et lille antal parametre, hvilket reducerer beregnings- og hukommelsesomkostninger markant.
- patch-embeddingEn teknik i vision transformers hvor et billede opdeles i flade udsnit (patches), og hvert udsnit omdannes til en vektor (embedding) via en lineær projektion.
- PCAPCA er en statistisk metode til dimensionalitetsreduktion ved at transformere data til et nyt koordinatsystem, hvor de største varianser ligger langs de første akser.
- PEFTParameter-Efficient Fine-Tuning (PEFT) er en samling af teknikker, der muliggør effektiv transfer learning af store sprogmodeller ved at opdatere et minimalt antal parametre, ofte gennem indsættelse af trænbare adaptere eller lavrangetilpasninger.
- PEFT-metodePEFT-metoder er en familie af fine-tuning-teknikker, der kun opdaterer et lille antal parametre for at tilpasse en stor model til en specifik opgave.
- PEFT-teknikParameter-Efficient Fine-Tuning (PEFT) er en samling af teknikker, der muliggør finjustering af store sprogmodeller ved at opdatere et lille antal parametre, hvilket reducerer beregningsomkostninger og hukommelseskrav.
- persona-patternPersona-pattern er en prompt engineering-teknik, hvor en AI-model tildeles en bestemt rolle eller karakter for at styre dens svarstil og indhold.
- pipeline parallelismPipeline parallelism er en distribueret træningsteknik, hvor en model opdeles i sekventielle stadier, der hver behandles af en separat enhed, og data sendes gennem stadierne som i en pipeline.
- planning algorithmEn algoritme, der genererer en sekvens af handlinger for at opnå et specifikt mål ud fra en given tilstand og et sæt mulige handlinger.
- Policy gradientPolicy gradient er en kategori af reinforcement learning-algoritmer, der optimerer en policy direkte via gradient-ascent på den forventede belønning.
- policy gradient-algoritmeEn policy gradient-algoritme er en metode inden for reinforcement learning, der optimerer en politik direkte ved at estimere gradienten af den forventede belønning med hensyn til politikparametrene og udføre gradient ascent.
- Pooling layerEt pooling-layer er et nedtagningslag i et convolutional neural network der reducerer rummelige dimensioner.
- position-embeddingEn teknik i transformer-modeller, der indlejrer information om token-positioner i sekvensen for at give modellen en forståelse af rækkefølge.
- positional encodingEn teknik, der tilføjer positionsinformation til inputrepræsentationer i transformer-modeller, så modellen kan skelne rækkefølgen af elementer i en sekvens.
- positionsinterpoleringTeknik til at udvide kontekstlængden i transformermodeller ved at skalere positionsindekser, så de passer ind i det oprindelige positionsinterval.
- Post-Layer NormalizationPost-Layer Normalization er en teknik i transformer-arkitekturer, hvor layer normalization placeres efter hvert sublag (attention og feed-forward) i stedet for før.
- Post-training quantizationPost-training quantization er en teknik, hvor vægte og aktiveringer i en allerede trænet model konverteres til en lavere præcision (fx 8-bit heltal) for at reducere modelstørrelse og øge inferenshastighed uden yderligere træning.
- post-træningskvantiseringPost-træningskvantisering er en teknik hvor en allerede trænet maskinlæringsmodel konverteres til at bruge lavere præcision (fx 8-bit heltal) i stedet for 32-bit flydende tal, hvilket reducerer modellens størrelse og accelererer inferens uden at kræve genoptræning.
- PPOPPO er en policy-gradient algoritme inden for reinforcement learning, der optimerer en policy ved at tage forsigtige opdateringer, der holder den nye policy tæt på den gamle via en clipped surrogate-objektivfunktion.
- PPO-clipPPO-clip er en reinforcement learning-algoritme, der opdaterer en politik ved at maksimere en clipped surrogate objective, hvilket forhindrer for store ændringer i politikken.
- PPO-penaltyPPO-penalty er en variant af PPO-algoritmen, der bruger en KL-divergens-straf i stedet for clipping for at begrænse policy-opdateringer.
- Pre-Layer NormalizationPræ-lag normalization er en teknik, hvor layer normalization placeres før hvert dellag (attention eller feed-forward) i en transformerblok, i modsætning til post-layer normalization.
- preference optimizationEn træningsteknik, der justerer en models adfærd baseret på præferencedata, typisk i form af parvis sammenligning af output.
- prefix cacheEn teknik, der gemmer mellemregninger (key-value-cache) for et indledende prompt-segment, så gentagen inferens med samme prefix kan genbruge dem og undgå genberegning.
- prefix tuningEn parameter-effektiv finjusteringsteknik, hvor et lille antal trænbare præfikstokens indsættes foran inputtet i hvert Transformerlag, mens de oprindelige modelvægte fryses.
- PReLUEn aktiveringsfunktion der udvider ReLU med en læreparameter α for negative indputs, så funktionen bliver f(x)=max(0,x)+α·min(0,x).
- preprocessingForberedelse og transformation af rådata til et format, der er egnet til maskinlæringsalgoritmer.
- preprocessing-pipelineEn sekvens af automatiserede datatransformationer, der anvendes på rådata før en maskinlæringsmodel trænes eller anvendes.
- preprocessing-stepEt preprocessing-step er en operation i en databehandlingspipeline, hvor rådata renses, transformeres eller forberedes til videre analyse eller modeltræning.
- pretext taskEn hjælpeopgave, som en model trænes på under self-supervised learning for at lære repræsentationer, der senere kan overføres til en downstream-opgave.
- pretext-task designEn teknik inden for selvovervåget læring, hvor en hjælpeopgave (pretext task) designes til at tvinge modellen til at lære nyttige repræsentationer uden brug af manuelle labels.
- PretrainingPrætræning (pretraining) er en træningsfase hvor en maskinlæringsmodel først trænes på en stor, generel datasæt, typisk uden opsyn eller med selvovervågning, for at lære generelle repræsentationer, efterfulgt af finjustering på en specifik opgave.
- prompt cachingOptimeringsteknik hvor dele af et prompt (typisk starten) gemmes i cache, så gentagen behandling undgås, hvilket reducerer latency og omkostninger.
- prompt craftingPrompt crafting er den systematiske udformning og optimering af instruktioner (prompts) til sprogmodeller for at opnå specifikke, relevante svar.
- prompt engineerEn prompt engineer er en specialist, der designer, tester og optimerer prompts til sprogmodeller for at opnå præcise og nyttige output.
- Prompt engineeringPrompt engineering er den systematiske praksis at designe, formatere og optimere inputprompter for at styre adfærden af store sprogmodeller (LLM'er) mod et ønsket output.
- Prompt injectionEt sikkerhedsangreb, hvor en angriber indsætter ondsindet instruktion i en prompt for at tilsidesætte eller omgå systemets tilsigtede instruktioner.
- prompt optimizationProces med at justere og forbedre prompts for at maksimere præcision og relevans af en sprogmodels output.
- prompt patternEn prompt pattern er en genanvendelig skabelon eller struktur til at formulere en prompt for at opnå forudsigelige og ensartede svar fra en sprogmodel.
- Prompt templateEn skabelon til prompts, der bruges til at strukturere input til en sprogmodel ved at indsætte variabler i en foruddefineret tekst.
- Prompt TuningPrompt tuning er en parametereffektiv finjusteringsmetode, hvor et lille sæt af lærbare 'bløde prompts' (kontinuerte vektorer) sættes foran input-embeddings, mens den fortrænede models vægte forbliver frosne.
- prompt-optimeringsalgoritmeAlgoritme der automatisk forbedrer prompts for at optimere modeloutput.
- pruningPruning er en teknik til at reducere størrelsen af et neuralt netværk ved at fjerne overflødige vægte eller neuroner.
- prætræningsmålEn objektivfunktion, der anvendes under ubegrænset eller selvovervåget før-træning af en sprogmodel, typisk med henblik på at lære generelle sprogrepræsentationer.
- Q-learningEn model-fri forstærkningslæringsalgoritme, der lærer en optimal politik ved at estimere den forventede fremtidige belønning for hver handling i en given tilstand.
- QATEn træningsteknik, hvor modellen lærer at kompensere for kvantiseringsfejl, så den efterfølgende kvantisering medfører minimal præcisionstab.
- QLoRAQLoRA er en metode til effektiv finjustering af store sprogmodeller ved at kvantisere basismodellen og anvende lavrank-adaptere (LoRA), hvilket reducerer hukommelsesforbruget markant.
- QLoRA-adapterEn QLoRA-adapter er en lavrangs-adapter, der trænes med kvantisering af basis-modellens vægte for at reducere hukommelsesforbruget under finjustering.
- QLoRA-adapterEn adapter til finjustering af store sprogmodeller, der kombinerer kvantisering af modelvægte med low-rank opdateringer for at reducere hukommelsesforbrug.
- QLoRA-finetuningTeknik, der kombinerer modelkvantisering med LoRA for at finjustere store sprogmodeller med markant reduceret hukommelsesforbrug.
- QLoRA-finteknikQLoRA-finteknik er en metode til effektiv finjustering af store sprogmodeller ved hjælp af kvantiseret LoRA, der reducerer hukommelsesforbruget markant.
- QLoRA-fintuningEffektiv fintuningsmetode der kombinerer 4-bit kvantisering med LoRA for at reducere hukommelsesforbruget ved fintuning af store sprogmodeller.
- QuantizationTeknik til at reducere præcisionen af tal i en model for at mindske hukommelses- og beregningsbehov.
- quantization-aware fine-tuningEn finjusteringsproces, der simulerer kvantiseringseffekter under træningen, så den endelige kvantiserede model bevarer nøjagtigheden.
- Quantization-aware trainingQuantization-aware training (QAT) er en træningsteknik, hvor kvantiseringseffekter simuleres under træningen for at opnå høj nøjagtighed efter efterfølgende kvantisering.
- Query-by-committeeQuery-by-committee er en aktiv læringsteknik, hvor et ensemble af modeller (et udvalg) stemmer om hvilke uetiketérbare datapunkter der er mest informative at få etiket for.
- RAGRAG (Retrieval-Augmented Generation) er en teknik, hvor en sprogmodel suppleres med ekstern viden hentet fra en database for at forbedre svar.
- RAG-evalueringRAG-evaluering er processen med at vurdere kvaliteten og effektiviteten af et RAG-system, typisk gennem metrikker som korrekthed, relevans og faithfulness.
- RAG-modelEn RAG-model er en sprogmodel, der kombinerer en generator med en ekstern vidensbase via hentning for at forbedre kvaliteten og relevansen af genererede svar.
- RAG-pipelineEn RAG-pipeline er en systemarkitektur, der kombinerer en retriever til at hente relevante dokumenter fra en ekstern videnbase og en generator til at producere svar baseret på disse dokumenter.
- RAG-retrieverKomponent i en RAG-pipeline, der henter relevante dokumenter eller passager fra en videnbase baseret på en forespørgsel.
- Random initializationTeknik til at sætte en models parametre (vægte og bias) til tilfældige værdier inden træning.
- re-rankerEn metode til at forbedre søgeresultater ved at anvende en sekundær, mere præcis model til at genrangere et lille antal kandidater fra en første hurtig søgning.
- re-rankingTeknik, hvor en indledende liste af resultater fra en første søgning eller retrieval bliver sorteret eller filtreret igen ved hjælp af en mere avanceret model for at forbedre relevansen.
- ReActReAct er en prompting-teknik, hvor en sprogmodel veksler mellem at generere ræsonnementstrin og udføre handlinger (fx kald af værktøjer) for at løse en opgave.
- ReAct-agentEn ReAct-agent er en AI-agent, der skiftevis ræsonnerer (Reasoning) og handler (Acting) i en loop for at løse opgaver, ved at generere tanker, udføre handlinger og observere resultater.
- ReAct-loopEn iterativ proces hvor en sprogmodel skiftevis ræsonnerer (Reasoning) og handler (Acting) ved at generere tanker og udføre handlinger, ofte i interaktion med eksterne værktøjer.
- red teamEn 'red team' er en gruppe, der systematisk forsøger at finde sårbarheder, bias eller utilsigtet adfærd i et AI-system ved at simulere ondsindede angreb eller ekstreme input.
- Red teamingEn systematisk metode til at teste AI-modellers sikkerhed og robusthed ved at simulere angreb eller adversariale inputs.
- red-team-øvelseEn red-team-øvelse er en struktureret proces, hvor et hold (red team) systematisk forsøger at afdække sårbarheder og utilsigtet adfærd i en AI-model eller et system ved at simulere angreb eller manipulere input.
- regulariseringRegularisering er en teknik, der tilføjer en straf til modellens tabfunktion for at forhindre overfitting.
- RegularizationRegularization er en teknik, der tilføjer en straf til modellens tabsfunktion for at forhindre overfitting ved at begrænse modellens kompleksitet.
- Reinforcement learningReinforcement learning er en maskinlæringsmetode, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger eller straf for sine handlinger.
- reinforcement learning from human feedbackEn teknik til at finjustere sprogmodeller ved at bruge menneskelige præferencer som belønningssignal i forstærkningslæring.
- relativ positional encodingEn metode til at indkode positioner i en transformer ved at repræsentere den relative afstand mellem elementer i stedet for absolutte positioner.
- ReLUReLU er en aktiveringsfunktion, der returnerer inputværdien, hvis den er positiv, ellers nul.
- reparameterization trickEn teknik til at omparametrisere stokastiske variable, så gradienter kan estimeres ved backpropagation i neurale netværk.
- rerankerEn reranker er en sekundær model, der tager en liste af kandidater fra en indledende søgning og omrangere dem efter relevans ved hjælp af en mere præcis, men langsommere, metode.
- RerankingReranking er en teknik, hvor en indledende liste af kandidater (ofte fra en retriever) omrangordnes af en mere avanceret model for at forbedre relevans og præcision.
- reranking-træningTræning af en reranker-model, der forbedrer rækkefølgen af kandidater fra et indledende søge- eller genereringstrin.
- Residual connectionEn residual connection er en forbindelse i et neuralt netværk, der springer et eller flere lag over og adderer indgangssignalet til lagets output.
- resume training checkpointEt resume training checkpoint er en gemt tilstand af en models vægte, optimizerens tilstand og evt. batchgenerator, som gør det muligt at genoptage træningen fra et bestemt tidspunkt.
- resumé-genereringAutomatisk generering af et kortfattet referat fra en længere tekst ved hjælp af sprogmodeller.
- RetrievalHentning af relevant information fra en ekstern kilde, typisk en vektordatabase eller et dokumentindeks.
- Retrieval systemEt system der finder og henter relevante informationer fra en database eller et korpus.
- Retrieval-Augmented GenerationRetrieval-augmented generation (RAG) er en teknik, hvor en sprogmodel udvides med en ekstern vidensbase for at forbedre nøjagtigheden og reducere hallucinationer.
- retrieval-pipelineEn struktureret sekvens af trin til at finde og hente relevante dokumenter eller information fra en videnbase, typisk brugt i RAG-systemer.
- reverse-mode ADEn teknik til effektiv beregning af gradienter ved at anvende kædereglen baglæns gennem en beregningsgraf.
- reward shapingTeknik inden for forstærkningslæring, hvor den egentlige belønning modificeres med en ekstra hjælpebelønning for at guide læringsprocessen.
- Ridge regressionRidge regression er en reguleringsteknik, der anvender L2-straf for at mindske overfitting i lineære regressionsmodeller.
- right-side truncationRight-side truncation er en metode til at begrænse en sekvens af tokens til en maksimal længde ved at fjerne tokens fra begyndelsen (venstre side), så de nyeste (højre) tokens bevares.
- RLHFRLHF er en træningsteknik, hvor en model finjusteres ved at optimere en belønningsmodel, der er lært fra menneskelige præferencer, typisk ved hjælp af forstærkningslæring.
- RLHF-træningTræningsmetode hvor en model optimeres via forstærkningslæring baseret på menneskelig feedback.
- robust optimizationRobust optimization er en træningsteknik, der forbedrer en models modstandsdygtighed over for worst-case forstyrrelser i inputdata, typisk ved at optimere over en usikkerhedsmængde.
- rød-holdsøvelseEn struktureret testmetode, hvor et hold (rød-hold) forsøger at finde sårbarheder, fejl eller utilsigtede adfærd i en AI-model.
- rødholdEt rødhold er en gruppe af mennesker eller AI-systemer, der bevidst forsøger at finde sårbarheder eller udnytte fejl i et AI-system for at teste dets robusthed.
- SACSAC (Soft Actor-Critic) er en forstærkningslæringsalgoritme, der kombinerer maksimal entropi med actor-critic-metoder for at opnå stabil og sample-effektiv træning.
- safety guardrailsSikkerhedshegn er regler, filtre eller begrænsninger indbygget i en AI's pipeline for at sikre ansvarlig og sikker brug.
- score matchingScore matching er en metode til at estimere en sandsynlighedstæthed ved at minimere forskellen mellem modelens og dataens score (gradient af log-tætheden).
- SegmentationOpdeling af et billede eller en tekst i meningsfulde dele.
- selective scanSelektiv scanning er en mekanisme i state space-modeller, der dynamisk vælger hvilke input-tokens der skal behandles, baseret på deres relevans, for at forbedre effektiviteten over lange sekvenser.
- selektiv scanningEn teknik i transformermodeller, hvor modellen kun behandler de mest relevante dele af inputtet for at øge effektiviteten.
- self-attention-mekanismeEn neural netværksmekanisme, der beregner vægtede repræsentationer af en sekvens ved at lade hvert element 'kigge på' alle andre elementer i sekvensen.
- self-consistency decodingEn inferensteknik, der forbedrer pålideligheden af sprogmodellers output ved at generere flere svar og vælge det mest konsistente.
- Self-distillationSelf-distillation er en træningsteknik, hvor en model lærer af sine egne forudsigelser, ofte ved at bruge en tidligere version af sig selv som lærer.
- self-distillation lossEt træningstab, hvor en model lærer fra sine egne forudsigelser (ofte en tidligere version eller en glidet gennemsnitsmodel) for at forbedre generalisering.
- self-distillation pipelineEn træningspipeline hvor en model fungerer som sin egen lærer ved at bruge egne forudsigelser som soft labels til at forbedre sin egen præstation.
- self-paced learningSelf-paced learning er en træningsstrategi, hvor modellen dynamisk vælger sværhedsgraden af træningseksempler baseret på dens nuværende præstation.
- Selv-konsistens (self-consistency)En metode, hvor en sprogmodel genererer flere uafhængige tankekæder og vælger det mest konsistente svar.
- Selv-konsistens (self-consistency)En metode til at forbedre ræsonneringsresultater fra sprogmodeller ved at sample flere svar og vælge det mest konsistente.
- selv-konsistensafstemningTeknik til at justere en sprogmodels output ved at sikre konsistens på tværs af flere genererede svar for samme forespørgsel.
- selvovervåget fortræningEn træningsmetode hvor en model lærer repræsentationer fra ustrukturerede data ved at konstruere og løse en selvdefineret prædiktiv opgave.
- selvovervåget repræsentationslæringSelvovervåget repræsentationslæring er en træningsmetode, hvor en model lærer nyttige repræsentationer af data ved at forudsige dele af inputtet fra andre dele, uden manuelle labels.
- Semantic searchSøgemetode, der bruger betydningen af ord og sætninger til at finde relevante resultater, i stedet for nøjagtig ordmatch.
- semantisk indekseringSemantisk indeksering er en teknik, der kortlægger dokumenter og forespørgsler til et semantisk vektorrum ved hjælp af maskinlæring, således at information kan genfindes baseret på betydning snarere end nøjagtige ordmatch.
- semantisk søgemaskineEn semantisk søgemaskine er en søgemaskine, der forstår betydningen og hensigten bag en brugers forespørgsel ved hjælp af naturlig sprogforståelse, videnrepræsentation og maskinlæring for at levere mere relevante resultater end traditionel nøgleordsbaseret søgning.
- semantisk søgemodelEn semantisk søgemodel bruger vektorrepræsentationer (embeddings) af tekst til at finde dokumenter baseret på meningsindhold frem for eksakte ordmatch.
- semantisk søgningSemantisk søgning er en søgeteknik, der forstår brugerens hensigt og ordbetydning i stedet for at matche nøjagtige søgeord.
- semantisk søgningSøgemetode der fortolker forespørgsler ud fra betydning snarere end nøjagtig ordmatch.
- semi-supervised classificationKlassifikationsmetode hvor modellen trænes på en kombination af få annoterede og mange uannoterede data for at forbedre præcisionen.
- semi-supervised clusteringHalvovervåget clustering er en metode, hvor en lille mængde mærkede data bruges til at forbedre clustering af en stor mængde umærkede data.
- semi-supervised learningEn maskinlæringsteknik, der kombinerer en lille mængde mærkede data med en stor mængde umærkede data for at træne en model.
- sen fusionSen fusion er en teknik i multimodal læring, hvor separate repræsentationer fra forskellige modaliteter kombineres på et sent tidspunkt i forarbejdningen, typisk efter individuelle enkodere.
- SentencePieceSentencePiece er en subord-tokeniseringsalgoritme, der behandler input som en ubrudt strøm og lærer et ordforråd af delord uden forudgående tokenisering.
- sfærisk interpolationEn interpolationsmetode mellem to punkter på en kugleoverflade, hvor bevægelsen sker langs en storcirkel.
- SHAPSHAP er en metode baseret på spilteori til at forklare output fra maskinlæringsmodeller ved at tildele hver feature en bidragsværdi.
- sigmoidSigmoidefunktionen er en matematisk funktion med en S-formet kurve, der afbilder enhver reel værdi til et interval mellem 0 og 1.
- simuleringSimulering er at efterligne en virkelig proces eller et system ved hjælp af en computermodel, ofte for at studere adfærd, træne AI eller forudsige udfald.
- simuleringsbaseret træningEn træningsmetode hvor en AI-model lærer i et simuleret miljø i stedet for i den virkelige verden.
- snapshot checkpointEn snapshot checkpoint er en gemt kopi af en models vægte, optimeringsstat og tilhørende metadata på et bestemt tidspunkt under træning, så træningen kan genoptages eller evalueres senere.
- soft gatingSoft gating er en teknik i neurale netværk, hvor en blød vægtning (typisk via softmax) anvendes til at kombinere output fra flere eksperter eller stier, så alle bidrager proportionelt.
- SoftmaxEn normaliseret eksponentialfunktion, der omdanner en vektor af vilkårlige reelle tal til en sandsynlighedsfordeling.
- softmax-aktiveringEn aktiveringsfunktion der normaliserer en vektor af vilkårlige reelle tal til en sandsynlighedsfordeling over klasser.
- softmax-temperaturSoftmax-temperatur er en skalarparameter, der styrer 'blødheden' af softmax-funktionens outputfordeling.
- sparse retrievalSparse retrieval betegner metoder til informationsgenfinding, der bruger sparse vektorer (overvejende nul) til at repræsentere dokumenter og forespørgsler, typisk baseret på termfrekvenser som i TF-IDF eller BM25.
- sparse retrieval-modelEn model der bruger sparse vektorer (mange nuller) til at repræsentere dokumenter og forespørgsler, og matcher dem ved fælles tokens.
- sparse retrieverEn sparsom retriever er en informationssøgningsmetode, der bruger sparse vektorer (få ikke-nul elementer) til at repræsentere dokumenter og forespørgsler, typisk baseret på TF-IDF eller BM25.
- Speculative decodingTeknik til at fremskynde generering fra sprogmodeller ved at lade en hurtig draftmodel foreslå tokens, som verificeres parallelt af en større model.
- speculative decoding-pipelineEn teknik der fremskynder generering af tekst i store sprogmodeller ved at lade en hjælper-model generere foreløbige tokens, som hovedmodellen verificerer parallelt.
- Speech recognitionTalegenkendelse er en teknologi, der konverterer talt sprog til tekst.
- Speech-to-textTeknologi der konverterer talt sprog til skriftlig tekst.
- speech-to-text-systemEt system der konverterer talt sprog til maskinlæsbar tekst.
- Stochastic gradient descentStokastisk gradient descent (SGD) er en optimeringsalgoritme, der opdaterer modelparametre ved hjælp af gradienten beregnet på en enkelt eller et lille antal tilfældigt udvalgte træningseksempler.
- stokastisk gradientnedstigningStokastisk gradientnedstigning (SGD) er en iterativ optimeringsalgoritme, der opdaterer modelparametre ved at følge den negative gradient af tabsfunktionen estimeret fra en enkelt eller et lille antal tilfældige datapunkter.
- stratified cross-validationStratificeret krydsvalidering er en variant af krydsvalidering, hvor data opdeles i folder, der bevarer den samme klassefordeling som det oprindelige datasæt.
- Structured outputEn teknik, hvor en AI-model tvinges til at generere output i et foruddefineret format, typisk JSON.
- structured pruningStruktureret beskæring er en modelkompressionsteknik, der fjerner hele strukturer (kanaler, filtre, lag) fra et neuralt netværk.
- struktureret beskæringTeknik til modelkomprimering hvor hele strukturer, såsom kanaler, filtre eller lag, fjernes fra en neuralnetværksmodel for at reducere størrelse og beregningsomkostninger, samtidig med at den overordnede arkitektur bevares.
- Student-teacher frameworkEn træningsteknik, hvor en mindre 'elev'-model lærer af en større 'lærer'-models forudsigelser eller repræsentationer.
- Style transferStyle transfer er en deep learning-teknik, hvor en models stil overføres til et andet billedes indhold.
- subword-tokenEn token der repræsenterer en underordnet enhed af et ord, typisk et hyppigt forekommende n-gram eller morfem, brugt i subword-tokenisering.
- subword-token-algoritmeEn algoritme der deler ord i underenheder (subwords) for at håndtere ukendte ord og begrænse ordforrådsstørrelse i sprogmodeller.
- Subword-tokeniseringSubword-tokenisering er en metode til at opdele ord i mindre meningsfulde enheder, så modellen kan håndtere ord, den ikke har set før.
- subword-tokenizationEn tokeniseringsteknik, hvor ord opdeles i mindre enheder (subwords) baseret på frekvens, så modellen kan håndtere ukendte ord og morfologisk variation.
- subword-tokenizerEn tokeniseringsmetode der opdeler ord i mindre enheder (subwords) baseret på frekvens, så modellen kan håndtere ukendte ord.
- Super-resolutionTeknik til at rekonstruere et højopløst billede fra et lavopløst input.
- Supervised learningSupervised learning er en maskinlæringsteknik, hvor en model trænes på et mærket datasæt med input-output-par for at lære at forudsige output for nye input.
- supervised learning-algoritmeEn algoritme der trænes på et mærket datasæt, hvor input-output-par lærer modellen at forudsige output for nye input.
- supervised learning-teknikEn teknik inden for maskinlæring, hvor en model trænes ved hjælp af et mærket datasæt, hvor hvert eksempel har en korrekt outputværdi.
- superviseret læringSuperviseret læring er en maskinlæringsmetode, hvor en model trænes på et mærket datasæt, så den kan forudsige output for nye, usete data.
- symbolsk reasoningSymbolsk reasoning er en metode inden for kunstig intelligens, hvor viden repræsenteres ved hjælp af symboler og logiske regler, og hvor inferens udføres gennem symbolmanipulation.
- syntetisk datagenereringSyntetisk datagenerering er processen med at skabe kunstige data, der efterligner egenskaberne ved rigtige data, ofte brugt til træning af AI-modeller.
- syntetisk træningsdataKunstigt fremstillede data, der bruges til at træne maskinlæringsmodeller, ofte for at kompensere for mangel på rigtige data eller for at forbedre modelrobusthed.
- System promptEn system prompt er en indledende besked til en sprogmodel, der angiver kontekst, rolle eller adfærdsregler, som modellen skal følge gennem hele samtalen.
- System prompt engineeringTeknikken at designe og optimere systemprompten for at styre adfærden af en sprogmodel.
- sætnings-embeddingEn vektorrepræsentation af en hel sætning, som indfanger dens semantiske betydning i et fast antal dimensioner.
- t-SNEt-SNE er en ikke-lineær dimensionalitetsreduktionsteknik, der bruges til at visualisere højdimensionelle data i et lavdimensionelt rum (typisk 2D eller 3D) ved at bevare lokale nabo-strukturer.
- tanh activationTanh-aktivering er en matematisk funktion, der anvendes i neuroner for at kortlægge input til output mellem -1 og 1.
- tanh-aktiveringsfunktionTanh er en matematisk aktiveringsfunktion, der skalerer input til værdier mellem -1 og 1 og bruges i neurale netværk.
- target networkEt separat neuralt netværk, der bruges som et stabilt mål under Q-læring for at reducere svingninger i træningen.
- teacher ensembleEt teacher ensemble er en samling af flere forudtrænede modeller (teachers), der i fællesskab vejleder træningen af en enkelt student model, typisk ved at aggregerer deres forudsigelser eller logits.
- teacher-student setupEn træningsteknik, hvor en stor, prætrænet model (læreren) vejleder en mindre model (eleven) ved at overføre viden via bløde labels eller logits.
- temperatur-scalingEn post-processing teknik, der justerer en neural netværks softmax-udgang ved at dividere logitterne med en temperaturparameter for at forbedre kalibreringen af sandsynligheder.
- TemperatureEn parameter, der skalerer logits før softmax for at styre tilfældigheden i tokensampling.
- temperatursamplingTemperatursampling er en afkodningsstrategi, hvor logitterne fra en sprogmodel skaleres med en temperaturparameter inden softmax, hvilket styrer fordelingens skarphed.
- temperaturskaleringEn metode til at skalere logits i en blød maksimeringsfunktion for at kontrollere 'skarpheden' af den resulterende sandsynlighedsfordeling.
- testdatasætsplitOpdeling af et datasæt i separate delmængder (træning, validering, test) for at evaluere en models generaliseringsevne.
- testningEvaluering af en maskinlæringsmodel på et separat testdatasæt for at måle dens præstation på ikke sete data.
- text augmentationTeknik til at generere syntetiske træningseksempler i naturlig sprogbehandling ved at anvende transformationer som synonymudskiftning, backtranslation eller tilføjelse af støj.
- text segmentationOpdeling af tekst i mindre, meningsfulde enheder som sætninger, afsnit eller chunks.
- text-to-image generationTeknik til at generere billeder ud fra en tekstbeskrivelse ved hjælp af en AI-model.
- Text-to-speechTeknologi der konverterer skrevet tekst til syntetisk tale.
- tidlig fusionEn fusionsteknik hvor data fra flere modaliteter kombineres på inputniveau, før de behandles af en model.
- tokeniseringTokenisering er processen med at opdele en tekst i mindre enheder (tokens), typisk ord, underord eller tegn, som modellen kan behandle.
- TokenizationTokenization er processen med at opdele en tekst i mindre enheder kaldet tokens, som kan være ord, underord eller tegn.
- TokenizerEn tokenizer er et værktøj der opdeler tekst i mindre enheder (tokens) til brug i sprogmodeller.
- Tool callingEn teknik hvor en sprogmodel kan anmode om at udføre en foruddefineret funktion (værktøj) og indlejre resultatet i en samtale.
- Tool useEvnen hos en sprogmodel til at interagere med eksterne værktøjer som API'er, databaser eller regnemaskiner for at udføre opgaver, der kræver ekstern beregning eller information.
- ToolformerToolformer er en metode til at finjustere en sprogmodel, så den kan lære at bruge eksterne værktøjer gennem få eksempler.
- Top-kSelektions- eller samplingmetode, hvor kun de k mest sandsynlige elementer (f.eks. tokens eller dokumenter) bevares.
- top-k filtreringEn dekodningsstrategi for sprogmodeller, hvor kun de k mest sandsynlige tokens overvejes ved hvert generationstrin.
- top-k gatingEn teknik i mixture-of-experts-modeller, hvor gaten vælger de k mest relevante eksperter baseret på en vægtet scoring.
- top-k retrievalEn retrieval-metode, hvor de k mest relevante dokumenter eller elementer fra en samling hentes frem baseret på en relevansscore.
- Top-k samplingTop-k sampling er en stokastisk tekstgenereringsteknik, hvor kun de k mest sandsynlige tokens overvejes ved næste forudsigelse.
- Top-p samplingEn stokastisk dekodningsstrategi, hvor næste token vælges fra et sæt af tokens med kumulativ sandsynlighed over en grænse p.
- Transfer learningOverførsel af viden fra en allerede trænet model til en ny, relateret opgave for at forbedre indlæringseffektivitet og præstation.
- Tree of ThoughtEn prompting-teknik, hvor modellen udforsker flere tænkestier samtidigt for at finde den bedste løsning.
- træningsbatchEn underopdeling af træningsdata, som anvendes i én frem- og tilbagepassage under træning af en neural netværksmodel.
- TTSTeknologi der konverterer skrevet tekst til talt tale.
- udfoldet RNNEn teknik hvor en tilbagevendende neuralt netværk (RNN) rulles ud over tidstrin, så det cykliske graf bliver til et feedforward-netværk, hvilket muliggør backpropagation gennem tiden (BPTT).
- UMAPUMAP er en ikke-lineær dimensionalitetsreduktionsteknik, der bruges til visualisering og klustering af højdimensionelle data.
- Unigram-tokeniseringUnigram-tokenisering er en subword-tokeniseringsteknik, der træner et unigram-sprogmodel over et korpus og vælger det mest sandsynlige segmenteringsmønster for hvert ord.
- unstructured pruningEn metode til at komprimere neurale netværk ved at fjerne individuelle vægte eller forbindelser uden hensyn til struktur.
- unsupervised learning algorithmEn type maskinlæringsalgoritme, der finder mønstre i data uden at bruge foruddefinerede etiketter.
- Uovervåget indlæringEn type maskinlæring, hvor modellen trænes på data uden mærkater og selv skal finde mønstre eller strukturer.
- uovervåget læringUovervåget læring er en maskinlæringsmetode, hvor modellen trænes på umærkede data uden angivelse af korrekte svar.
- uovervåget læringEn maskinlæringsteknik, hvor en model trænes på data uden labels for at finde skjulte mønstre eller strukturer.
- upaaret billede-til-billede translationEn teknik inden for computervision, hvor en model oversætter billeder fra et domæne til et andet uden brug af parrede træningseksempler.
- usikkerhedsprøvetagningEn aktiv læringsteknik hvor modellen vælger de data at blive mærket, som den er mest usikker på.
- variansreduktionSæt af metoder til at mindske variansen af en estimator uden at øge bias.
- variationel inferensEn metode til at tilnærme en kompleks posterior-fordeling i bayesiansk statistik og maskinlæring ved at optimere en enklere fordeling.
- vector retrievalVectoretrieval er processen med at finde de mest relevante elementer i en vektordatabase ved at sammenligne en forespørgselsvektor med en samling af indlejrede vektorer.
- vektorbaseret søgningVektorbaseret søgning er en metode, hvor data repræsenteres som vektorer i et højdimensionelt rum, og lighed måles ved afstandsberegninger som cosinus-lighed eller euklidisk distance.
- vektorindeksEn datastruktur der organiserer vektorer i et højdimensionelt rum for at muliggøre hurtig lighedssøgning.
- vektorindekseringVektorindeksering er en metode til at gemme og effektivt søge i højdimensionelle vektorer, typisk repræsentationer af data som tekst eller billeder, ved at organisere dem i en datastruktur der muliggør hurtig nearest neighbor-søgning.
- vektorindeksstrukturEn datastruktur designet til at indeksere og effektivt søge i højdimensionelle vektorer, typisk anvendt til lighedssøgning.
- vektoriseringVektorisering er processen med at omdanne data eller operationer til en vektorrepræsentation, ofte for at udnytte parallelle beregninger eller maskinlæringsmodeller.
- vektoriseringsmetodeEn metode til at omdanne ikke-numeriske data, såsom tekst eller billeder, til numeriske vektorer, som maskinlæringsmodeller kan behandle.
- Vibe codingEn uformel tilgang til programmering, hvor udvikleren bruger naturlige sprogprompter til at interagere med en AI-model for at generere eller modificere kode.
- Voice cloningTeknik til at syntetisere en persons stemme ved hjælp af maskinlæring, typisk baseret på få lydoptagelser.
- vægtbeskæringVægtbeskæring er en modelkomprimeringsteknik, hvor ubetydelige vægte i en neuralt netværk fjernes for at reducere modelstørrelse og beregningsbyrde uden væsentligt præcisionstab.
- vægtinitialiseringTeknik til at fastsætte startværdierne for en neural netværks modelparametre før træning.
- Weight decayWeight decay er en regulariseringsteknik der tilføjer en straf proportional med vægtenes størrelse til tabsfunktionen, typisk implementeret som L2-regularisering.
- Weight initializationTeknik til at fastsætte startværdier for en neural netværks vægte før træning.
- WGANEn type generativt adversart netværk, der bruger Wasserstein-afstanden til at stabilisere træning og undgå mode collapse.
- WGAN-GPWGAN-GP er en forbedret version af Wasserstein GAN, der anvender en gradientstraffunktion (gradient penalty) i stedet for vægtklipning for at opfylde Lipschitz-betingelsen.
- white-box adversarial attackEt white-box adversarial attack er et angreb mod en maskinlæringsmodel, hvor angriberen har fuld adgang til modellens arkitektur, vægte og parametre.
- WordPieceWordPiece er en tokniseringsteknik, der opdeler ord i hyppige underordsekvenser ved at lære et vokabular af subword-enheder.
- WordPiece-tokenizerEn subord-tokeniseringsalgoritme, der opdeler ord i kendte delordsenheder ved hjælp af en grådig længste-match-fremgangsmåde og en foruddefineret vokabular.
- world model-læringLæring af en intern model af verden, der kan simulere fremtidige tilstande og belønninger.
- XAI-metodeEn XAI-metode er en teknik, der gør det muligt at forstå og fortolke output fra en AI-model.
- Xavier initializationXavier-initiering er en metode til at initialisere vægtene i et neuralt netværk, så variansen af output fra hvert lag bevares, hvilket forhindrer gradienter i at forsvinde eller eksplodere.
- Zero initializationInitialisering af alle vægte i et neuralt netværk til nul.
- Zero-shot chain-of-thoughtEn prompting-teknik, hvor en sprogmodel opfordres til at generere ræsonnementstrin uden at få vist eksempler, typisk ved at tilføje 'Lad os tænke trin for trin' til prompten.
- Zero-shot classificationKlassifikation af datapunkter uden forudgående træning på specifikke klasser ved at udnytte semantiske repræsentationer.
- Zero-shot detectionEn teknik inden for objektdetektion, hvor en model identificerer objekter fra kategorier, den ikke har set under træning.
- Zero-shot learningZero-shot learning er en maskinlæringsteknik, hvor en model klassificerer objekter fra klasser, den ikke har set under træning, ved hjælp af semantiske repræsentationer eller beskrivelser.
- zero-shot object detectionZero-shot object detection er en teknik inden for computer vision, hvor en model kan lokalisere og klassificere objekter fra klasser, den ikke har set under træning.
- Zero-shot promptingEn prompt-teknik, hvor en sprogmodel udfører en opgave uden at have set nogen eksempler på opgaven i prompterne.