øvet
1181 termer- A2CA2C er en synkron reinforcement learning-algoritme, der kombinerer en policy (actor) med en værdifunktion (critic) og bruger advantage-estimater til at reducere varians.
- A3CEn forstærkningslæringsalgoritme, der kombinerer actor-critic med asynkron parallel træning for at stabilisere og fremskynde indlæring.
- abstraktiv resumé-genereringEn NLP-teknik, der genererer et kort resumé af en tekst ved at formulere nye sætninger, ikke blot udvælge eksisterende.
- Active LearningActive learning er en maskinlæringsteknik, hvor algoritmen aktivt vælger de mest informative datapunkter til manuel annotering for at optimere modelpræstation med minimalt antal mærkede data.
- Actor-criticEn familie af reinforcement learning-algoritmer, der kombinerer en policy-baseret aktør (actor) og en værdibaseret kritiker (critic) for at forbedre træningseffektivitet.
- AdamAdam er en adaptiv optimeringsalgoritme, der kombinerer momentum og RMSprop til effektiv træning af neurale netværk.
- Adam-optimizerEn adaptiv optimeringsalgoritme, der kombinerer momentum og RMSProp, og som justerer læringsraten for hver parameter baseret på første og andet moment af gradienterne.
- AdamWAdamW er en optimeringsalgoritme, der modificerer Adam ved at dekopplere vægtdæmpning (weight decay) fra de adaptive gradientestimater.
- adapterAdapter er en parameter-effektiv finjusteringsteknik, hvor små trænbare moduler indsættes i en forudtrænet models lag for at tilpasse den til en ny opgave uden at ændre de originale vægte.
- Adapter-modulEt letvægts neuralt netværksmodul, der indsættes mellem lagene i en fortrænet model, så kun adapterne trænes under finjustering, mens resten af modellen fryses.
- adapterbaseret finjusteringEn parameter-effektiv finjusteringsmetode, hvor små neurale moduler (adaptere) indsættes i et prætrænet sprogmodel-lag, og kun disse adaptere opdateres under træning.
- adapterlagEt adapterlag er et lille neuralt lag, der indsættes i en forudtrænet model og trænes for at tilpasse modellen til en ny opgave, uden at ændre de oprindelige vægte.
- AdapterLayerEt lille neuralt netværk med en flaskehals, der indsættes mellem lagene i en fortrænet model, så kun adapterlagets parametre opdateres under finjustering, mens resten af modellen forbliver frossen.
- AdaptersEn parameter-effektiv finjusteringsmetode, hvor små neurale moduler indsættes i en fortrænet model, så kun disse trænes.
- adaptiv learning rateEn teknik i træning af neurale netværk, hvor læringsraten automatisk justeres under træningen for at forbedre konvergens.
- adversarial attackEt adversarisk angreb er en bevidst, lille perturbation af et input til en AI-model, der får modellen til at lave en fejl.
- Adversarial exampleEt adversarial example er en input, der er blevet manipuleret med små, uopdagede ændringer for at få en model til at lave en forkert forudsigelse.
- adversarial robustnessAdversarial robustness betegner en maskinlæringsmodel's evne til at modstå bevidst fremstillede, små perturbationer i inputdata, der har til formål at narre modellen til at lave fejl.
- adversarial trainingAdversarial training er en træningsteknik, hvor modellen trænes på både originale og bevidst forstyrrede (adversarial) eksempler for at øge robusthed over for modangreb.
- adversariel domænetilpasningAdversariel domænetilpasning er en teknik inden for transfer learning, der bruger en modstandsdrevet (adversarial) træningsproces til at lære domæne-invariante repræsentationer ved at minimere en klassifikationsfejl på kildedomænet samtidig med at en domæneklassifikator bedrages.
- afstandsmetrikEn afstandsmetrik er en funktion, der kvantificerer afstanden mellem to punkter i et rum, ofte brugt til at måle lighed eller forskellighed i maskinlæring.
- agent workflowEn struktureret sekvens af handlinger, hvor autonome AI-agenter samarbejder om at udføre komplekse opgaver.
- agent-baseret arkitekturEn softwarearkitektur, hvor et system består af autonome enheder (agenter), der interagerer indbyrdes og med omgivelserne for at nå individuelle eller fælles mål.
- AgentarkitekturEn agentarkitektur definerer strukturen af en AI-agent, herunder hvordan den opfatter miljøet, træffer beslutninger og udfører handlinger.
- agentbaseret modelleringAgentbaseret modellering er en simulationsmetode, hvor individuelle agenter med egne regler interagerer og skaber kompleks kollektiv adfærd.
- Agentic workflowEn agentic workflow er en arbejdsgang, hvor en AI-agent autonomt udfører en række trin, ofte ved brug af værktøjer og feedback, for at opnå et komplekst mål.
- AI alignmentForskning og praksis, der sigter mod at sikre, at kunstig intelligens-systemer handler i overensstemmelse med menneskelige værdier og intentioner.
- AI-sikkerhedsforskningForskning, der fokuserer på at sikre, at kunstig intelligens-systemer er pålidelige, sikre og i overensstemmelse med menneskelige værdier.
- AI-sikkerhedsingeniørEn ingeniør med speciale i at identificere, analysere og afbøde sikkerhedsrisici ved AI-systemer.
- algorithmic fairnessAlgorithmic fairness betegner fraværet af systematisk bias eller diskrimination i algoritmers resultater, så forskellige grupper behandles retfærdigt.
- alignmentAlignment betegner problemet med at sikre, at kunstig intelligens handler i overensstemmelse med menneskelige værdier, intentioner og mål.
- alignment trainingTræning af en AI-model for at sikre, at dens adfærd overholder menneskelige værdier, intentioner og sikkerhedshensyn.
- alignmentsforskningForskningsområde inden for kunstig intelligens der sigter mod at sikre, at AI-systemers adfærd og mål overensstemmer med menneskelige værdier og intentioner.
- alignmentsproblemProblemet med at sikre, at kunstig intelligens handler i overensstemmelse med menneskelige intentioner og værdier.
- argmax-afkodningEn deterministisk afkodningsstrategi, hvor modellen ved hvert tidsskridt vælger det token med højest sandsynlighed.
- argmax-politikEn deterministisk politik, der for hver tilstand vælger den handling med højest estimeret værdi.
- artistic style transferArtistic style transfer er en teknik inden for computer vision, hvor en models stil fra et billede (f.eks. et maleri) overføres til indholdet af et andet billede, så resultatet beholder indholdets struktur men får stilens visuelle karakteristika.
- AttentionEn mekanisme i neurale netværk der vægter forskellige dele af inputtet forskelligt.
- attention scoreDen rå værdi, der beregnes som prikproduktet mellem en query- og en key-vektor i en attention-mekanisme, før softmax-normalisering.
- attention-mekanismeEn komponent i neurale netværk der vægter input-sekvensens elementer efter relevans, så modellen kan fokusere på de vigtigste dele af data.
- AUCAUC er et mål for en models evne til at skelne mellem positive og negative klasser, uafhængigt af klassifikationstærskel.
- AUC-PRAUC-PR måler arealet under præcision-genkaldelseskurven og opsummerer modellens ydeevne ved alle klassifikationstærskler.
- AUC-ROCAUC-ROC er en metrik, der måler et binært klassifikationssystems evne til at skelne mellem positive og negative klasser på tværs af alle klassifikationstærskler.
- augmenteringspipelineEn augmenteringspipeline er en række automatiserede transformationer anvendt på træningsdata for at øge datasættets variation og forbedre modelgeneralisation.
- AutoencoderEt autoencoder er et neuralt netværk, der trænes uovervåget til at lære en komprimeret repræsentation af inputdata ved at rekonstruere output, der ligner input så meget som muligt.
- AutogradAutograd er en automatisk differentieringsteknik, der beregner gradienter af en funktion i forhold til dens input ved at opbygge et beregningsgraf og anvende kædereglen.
- automatic differentiationAutomatisk differentiering er en samling teknikker til effektivt at beregne nøjagtige afledede af funktioner defineret af computerprogrammer.
- automatisk opsummeringTeknik inden for naturlig sprogbehandling, der automatisk producerer en kortfattet version af en længere tekst.
- autonom agentEn autonom agent er et system, der uafhængigt kan handle og træffe beslutninger i et miljø for at opfylde sine mål.
- autonom kørselEvnen for et køretøj til at navigere og operere uden menneskelig indgriben ved hjælp af sensorer, kameraer, radar og AI.
- autonomiAutonomi er evnen for et AI-system til at træffe beslutninger og udføre handlinger uden ekstern styring inden for et givent domæne.
- autoregressiv generationEn genereringsteknik, hvor hvert nyt token i en sekvens forudsiges baseret på alle tidligere genererede tokens.
- autoregressiv modelEn autoregressiv model forudsiger fremtidige værdier i en sekvens baseret på en lineær eller ikke-lineær kombination af tidligere værdier.
- Average PrecisionAverage Precision (AP) er et mål for præcisionen af en model over alle recall-niveauer, ofte brugt i informationssøgning og objektdetektion.
- backpropBackpropagation er en algoritme, der beregner gradienter af en tabsfunktion med hensyn til netværksvægte ved hjælp af kædereglen, hvilket muliggør gradient descent-optimering.
- BackpropagationBackpropagation er en algoritme, der beregner gradienten af en tabsfunktion med hensyn til netværkets vægte ved hjælp af kædereglen, hvilket muliggør gradientbaseret optimering i neurale netværk.
- Backpropagation gennem tidBackpropagation gennem tid (BPTT) er en algoritme til at beregne gradienter i tilbagevendende neurale netværk ved at udrulle netværket over tid og anvende den almindelige backpropagation på det udrullede netværk.
- Backpropagation Through Time (BPTT)BPTT er en algoritme til at beregne gradienter i tilbagevendende neurale netværk ved at udfolde netværket over tid og anvende almindelig backpropagation.
- balanced accuracyBalanceret nøjagtighed er gennemsnittet af recall for hver klasse, ofte defineret som (sensitivity + specificity)/2.
- batch gradient descentBatch gradient descent er en variant af gradient descent, hvor gradienten beregnes over hele træningsdatasættet i én iteration.
- batch inference engineEn batch inference engine er et system, der behandler flere datapunkter samtidigt i en enkelt kørsel af en trænet model.
- batch normaliseringTeknik der normaliserer aktiveringer i et neuralt netværk ved at justere deres gennemsnit og varians inden for hver mini-batch under træning.
- Batch normalizationBatch normalization er en teknik, der normaliserer outputtet fra et lag i et neuralt netværk ved at trække batch-middelværdien og dividere med batch-standardafvigelsen for at reducere intern kovariateskift.
- batch-normaliseringslagEt batch-normaliseringslag er et lag i et neuralt netværk, der normaliserer aktiveringerne i et mini-batch ved at justere gennemsnit og varians for at stabilisere træningen.
- Bayes' theoremBayes' sætning er en matematisk formel, der beskriver den betingede sandsynlighed for en begivenhed givet en anden begivenhed.
- Bayesiansk inferensBayesiansk inferens er en statistisk metode, der opdaterer sandsynligheden for en hypotese baseret på ny evidens ved hjælp af Bayes' sætning.
- BCEBCE (Binary Cross Entropy) er en tabfunktion til binær klassifikation, der måler forskellen mellem sandsynligheder og sande binære etiketter.
- BDI-arkitekturBDI-arkitektur er en softwarearkitektur for intelligente agenter baseret på eksplicitte repræsentationer af overbevisninger (beliefs), ønsker (desires) og intentioner (intentions).
- Beam searchBeam search er en heuristisk søgealgoritme, der til hvert tidstrin holder styr på de k mest sandsynlige sekvenser (stråler) for at generere outputtekst i sekvens-til-sekvens-modeller.
- beam search decodingBeam search er en afkodningsstrategi, der til hvert tidspunkt holder styr på de k mest sandsynlige sekvenser (beams) og udvælger den endelige sekvens med højest samlet sandsynlighed.
- beam widthBeam width er en hyperparameter i beam search, der bestemmer antallet af mest sandsynlige sekvenser, der bevares ved hvert dekodningstrin.
- benchmark-rammeværkEt benchmark-rammeværk er et standardiseret sæt af værktøjer og metoder til at evaluere og sammenligne AI-modellers ydeevne på specifikke opgaver.
- benchmarkingBenchmarking er den systematiske proces med at evaluere og sammenligne en AI-models ydeevne på standardiserede testdatasæt og opgaver.
- BERTBERT er en præ-trænet transformermodel, der bruger bidirektionel kontekst til at lære dybe ordrepræsentationer.
- BERT-baseBERT-base er en specifik konfiguration af BERT-modellen med 12 lag, 768 skjulte enheder og 12 opmærksomhedshoveder, hvilket giver cirka 110 millioner parametre.
- BERT-largeBERT-large er den store version af BERT-modellen med 340 millioner parametre, trænet på store mængder ustruktureret tekst.
- beskæringTeknik til at reducere størrelsen af en model ved at fjerne overflødige parametre eller forgreninger.
- beskæringsrateDen andel af parametre eller forbindelser i et neuralt netværk der fjernes under beskarring for at reducere modelstørrelse uden væsentligt tab af nøjagtighed.
- betinget forventningDen forventede værdi af en stokastisk variabel givet en anden stokastisk variabel eller begivenhed.
- Bi-EncoderEn Bi-Encoder er en neural netværksarkitektur, der bruger to separate enkodere til at kortlægge to inputstrenge (f.eks. en forespørgsel og et dokument) hver for sig til vektorer, hvorefter ligheden måles.
- bi-GRUbi-GRU er en arkitektur, hvor to GRU'er (Gated Recurrent Units) behandler en sekvens i hver sin retning for at opfange kontekst fra både fortid og fremtid.
- bias test datasætEt datasæt konstrueret til at afsløre og kvantificere skævhed (bias) i en AI-models forudsigelser.
- bias test metrikEn bias test metrik er et kvantitativt mål, der vurderer, om en AI-model udviser systematisk forskelsbehandling over for bestemte grupper baseret på beskyttede attributter som køn eller race.
- bias testingBias testing er en systematisk evaluering af en AI-models output for at identificere og måle skævheder baseret på følsomme attributter som køn, race eller alder.
- bias-detektionBias-detektion er processen med at identificere systematiske fejl eller skævheder i en AI-models output, som kan føre til uretfærdig eller diskriminerende behandling.
- bias-detektionsframeworkEt bias-detektionsframework er en samling af værktøjer, metrikker og retningslinjer designet til at identificere, måle og afhjælpe bias i maskinlæringsmodeller.
- bias-detektionsmetodeEn teknik eller metode til at identificere systematisk skævhed eller unfairness i en AI-models output eller træningsdata.
- bias-detektionsværktøjVærktøj til at identificere og kvantificere bias i AI-systemers data, modeller eller output.
- bias-mitigationBias-mitigation er en samling af teknikker, der anvendes til at identificere, måle og reducere systematiske skævheder i AI-modellers data, træning eller beslutninger.
- bias-mitigationsstrategiEn bias-mitigationsstrategi er en systematisk metode til at reducere eller eliminere bias i AI-modellers data, træning eller output.
- bias-mitigationsteknikTeknikker til at reducere eller eliminere skævheder i kunstig intelligens, typisk opdelt i præ-processing, in-processing og post-processing metoder.
- bias-variance-afvejningKompromis mellem bias (systematisk fejl) og varians (følsomhed over for træningsdata) i en model, der påvirker dens generaliseringsevne.
- bias-varians-afvejningAfvejningen mellem bias (systematisk fejl) og varians (følsomhed over for datasvingninger) i en model, hvor reduktion af den ene typisk øger den anden.
- bias-værdiEn bias-værdi refererer enten til en systematisk afvigelse i en models forudsigelser eller til et konstant led i en lineær model/neuron, der tillader fleksibel tilpasning.
- Bidirectional GRUEn variant af GRU der behandler sekvenser i både fremad- og bagudrettet retning.
- Bidirectional RNNEn type recurrent neural network (RNN), der behandler en sekvens i både fremad- og bagudrettet retning, så hvert tidstrin har adgang til kontekst fra både fortid og fremtid.
- bidirektional GRUEn variant af GRU (Gated Recurrent Unit) der behandler sekvenser i både fremad- og bagudrettet retning for at fange kontekst fra begge sider.
- BiGRUEn BiGRU er et neuralt netværk bestående af to GRU'er, der læser en inputsekvens henholdsvis forfra og bagfra og sammenkæder deres skjulte tilstande for at fange kontekst fra begge retninger.
- billedklassifikationsalgoritmeEn algoritme der automatisk tildeler en foruddefineret klasse-etiket til et inputbillede baseret på dets visuelle indhold.
- biLSTMEn type rekurrent neurale netværk, der behandler sekvenser i både fremad- og bagudgående retning for at fange kontekst fra begge sider.
- biLSTM-CRFbiLSTM-CRF er en arkitektur, der anvender en bidirectional LSTM til at fange kontekst fra begge sider af et ord og en CRF til at lære sekvensafhængigheder mellem etiketterne.
- Binary cross-entropyBinary cross-entropy er en tabsfunktion, der måler forskellen mellem to binære sandsynlighedsfordelinger, typisk anvendt til binær klassifikation.
- binary cross-entropy lossEn tabfunktion, der måler forskellen mellem sandsynligheder for to klasser i binær klassifikation.
- binær krydsentropiEn loss-funktion til binær klassifikation, der måler forskellen mellem forudsagte sandsynligheder og faktiske binære labels.
- binær log lossBinær log loss er en tabsfunktion for binær klassifikation, der straffer forkerte forudsigelser logaritmisk baseret på sandsynlighedsudgange.
- black-box adversarial attackEt black-box adversarial attack er et angreb på en maskinlæringsmodel, hvor angriberen kun har adgang til modellens input-output-adfærd og ikke kender modellens arkitektur, parametre eller træningsdata.
- BLEUAutomatisk metrik der måler n-gram-præcision mellem genereret tekst og reference, justeret med brevity-straf.
- BLEU-4BLEU-4 er en automatisk evalueringsmetrik til maskinoversættelse, der måler n-gram-overlap mellem en kandidat-tekst og en eller flere referencetekster, vægter ligeligt, og anvender en straf for korte oversættelser.
- BLEU-scoreBLEU-score er en automatisk metrik til evaluering af maskinoversættelse, der måler n-gram-overlap mellem en kandidatoversættelse og en eller flere referenceoversættelser.
- bottleneck layerEt lag i et neuralt netværk med færre neuroner end de omkringliggende lag, som tvinger netværket til at lære en komprimeret repræsentation af inputdata.
- BPE-segmenteringBPE-segmentering er en datakomprimeringstilpasset metode til deling af ord i underord-enheder baseret på hyppigste tegnpar.
- BPE-tokenEn BPE-token er en enhed af tekst genereret af Byte Pair Encoding, en subord-tokeniseringsalgoritme, der opdeler ord i hyppigt forekommende underenheder.
- BPE-tokeniseringBPE-tokenisering er en subword-tokeniseringsalgoritme, der iterativt fusionerer de hyppigste tegnpar til et nyt token.
- BPE-tokenizerEn tokeniseringsteknik, der anvender Byte Pair Encoding til at opdele tekst i underordsenheder (subwords) ved iterativt at flette de hyppigste tegnpar.
- BPE-vokabulariumEt vokabularium af subword-tokens, genereret ved Byte Pair Encoding-algoritmen.
- Byte Pair EncodingByte Pair Encoding (BPE) er en subord-tokeniseringsalgoritme, der opdeler ord i hyppige underenheder (subwords) ved iterativt at flette de hyppigste tegnpar.
- CAIConstitutional AI (CAI) er en metode til at justere sprogmodellers adfærd ved hjælp af et sæt skrevne principper (en 'forfatning'), som modellen trænes til at følge.
- CAI-justeringProces med at tilpasse en konversationel AI's adfærd til menneskelige forventninger, sikkerhedsretningslinjer eller specifikke opgaver.
- Categorical cross-entropyCategorical cross-entropy er en tabsfunktion, der måler forskellen mellem den sande sandsynlighedsfordeling over klasser og den forudsagte fordeling.
- CBOWCBOW er en neural netværksarkitektur til at lære ordindlejringer ved at forudsige et målord ud fra dets kontekst.
- chain ruleKædereglen er en matematisk formel til at beregne den afledte af en sammensat funktion, og den er central i backpropagation til at opdatere vægte i neurale netværk.
- Chain-of-thoughtEn prompting-teknik, hvor modellen opfordres til at generere en ræsonnerende tankekæde trin for trin, før den giver et endeligt svar.
- chain-of-thought-patternEn prompting-teknik, hvor modellen opfordres til at generere en række mellemliggende ræsonnementstrin, før den afgiver det endelige svar.
- Chain-of-thought-promptingEn prompting-teknik hvor modellen opfordres til at generere mellemliggende ræsonnementstrin før det endelige svar for at forbedre nøjagtighed på komplekse opgaver.
- checkpoint-filEn checkpoint-fil er en lagret tilstand af en model under træning, der indeholder vægte, optimeringstilstand og metadata.
- checkpoint-frekvensInterval for, hvor ofte en models tilstand gemmes under træning.
- checkpointingCheckpointing er teknikken at gemme en models vægte og optimerertilstand på bestemte tidspunkter under træning, så træningen kan genoptages fra det punkt.
- Chinchilla scalingChinchilla scaling er et princip inden for scaling laws, der siger at antallet af modelparametre og træningstokens bør skaleres proportionelt (cirka 20 tokens per parameter) for at opnå optimal ydelse for en given computerressource.
- Chinchilla scaling lawsChinchilla scaling laws beskriver det optimale forhold mellem modelstørrelse og mængden af træningsdata for at opnå den bedste performance inden for en given beregningsressource.
- Chinchilla skaleringsloveChinchilla skaleringslove er en samling empiriske fund om det optimale forhold mellem modelstørrelse og træningsdatamængde for sprogmodeller under en fast beregningsbudget, som viste at model og data bør skaleres nogenlunde lige meget.
- Chinchilla-optimalEn træningsstrategi for store sprogmodeller, hvor modelstørrelse og mængde af træningsdata skaleres ligeligt for at opnå optimal udnyttelse af en given beregningsressource.
- chunk-overlap-strategiEn teknik hvor dokumentchunks overlapper for at bevare kontekst ved splitpunkter.
- chunk-overlap-tokensAntallet af tokens, der overlapper mellem på hinanden følgende tekstchunks i en chunking-strategi.
- chunk-størrelseAntallet af tokens eller tegn pr. segment ved opdeling af et dokument til brug i retrieval-augmented generation.
- chunk-størrelseStørrelsen af de tekststykker (chunks) som et dokument opdeles i før indeksering eller behandling.
- chunk-størrelsesparameterParameter der bestemmer den maksimale størrelse af tekststykker (chunks) ved opdeling af dokumenter i forbindelse med indeksering.
- chunk-størrelsesstrategiStrategi til valg af størrelsen på de segmenter (chunks), som et dokument opdeles i før indeksering i en RAG-pipeline, med afvejning mellem informationsmængde og præcision.
- chunking-strategiEn metode til at opdele en tekst i mindre, semantisk eller strukturelt afgrænsede enheder (chunks) for at forbedre informationsgenfinding og behandling i RAG-systemer og sprogmodeller.
- clusteringClusteranalyse er en uovervåget læringsmetode, der grupperer datapunkter i klynger baseret på lighed.
- CNNEn CNN (Convolutional Neural Network) er et neuralt netværk designet til at bearbejde data med grid-lignende topologi, såsom billeder, ved hjælp af konvolutionelle lag til at lære hierarkiske mønstre.
- CNN-arkitekturArkitekturen for et konvolutionelt neuralt netværk består af en stak af konvolutionslag, aktiveringsfunktioner, poolinglag og til sidst fuldt forbundne lag, designet til at udtrække hierarkiske træk fra inputdata som billeder.
- common sense reasoningEvnen til at ræsonnere ud fra almen viden om verden, som mennesker opfatter som indlysende.
- computer vision-modelEn computer vision-model er en maskinlæringsmodel trænet til at fortolke og forstå visuel information fra billeder eller video.
- computer vision-systemEt computer vision-system er et integreret sæt af hardware og software, designet til at give computere evnen til at fortolke og forstå visuelle data fra den virkelige verden.
- Concept driftÆndring i den statistiske fordeling af måldata over tid, hvilket får en model til at blive mindre præcis.
- conditional computationConditional computation er en teknik i neurale netværk, hvor kun en delmængde af modellens parametre aktiveres baseret på input, hvilket reducerer beregningsomkostningerne.
- Conditional GANConditional GAN (cGAN) er en variant af Generative Adversarial Network (GAN), hvor generator og diskriminator modtager en betingelsesvariabel (fx en klasse-etiket) udover støj, så genereringen kan styres.
- conditional image generationEn generativ model der producerer billeder betinget af en given input, såsom en tekstbeskrivelse eller et klasseetikette.
- conditional routingEn teknik, hvor en models eller systems beslutnings-flow dynamisk dirigeres til forskellige behandlingsveje baseret på input-specifikke betingelser.
- Conditional VAEEn generativ model, der udvider VAE med betingelsesvariable for at styre outputtet.
- confusion matrixEn tabel, der opsummerer en klassifikationsmodels præstation ved at sammenligne forudsagte og faktiske klasser.
- Constitutional AIConstitutional AI er en metode til AI-sikkerhed og -alignment, hvor en model trænes ved hjælp af et sæt skrevne principper (en 'forfatning') til at styre sin adfærd gennem selvforbedring og feedback.
- context cacheEn teknik, der gemmer mellemliggende repræsentationer (KV-cache) af tidligere behandlede tokens for at undgå genberegning under inferens af sprogmodeller.
- Context cachingTeknik til at gemme og genbruge tidligere beregnede repræsentationer af en kontekst for at reducere latens og beregningsomkostninger.
- Context engineeringContext engineering er den systematiske praksis at designe, strukturere og optimere den kontekst, der præsenteres for en sprogmodel for at styre dens output og opførsel.
- context window extensionTeknikker til at udvide den maksimale kontekstlængde en sprogmodel kan bearbejde i én fremadrettet passage.
- context window lengthDen maksimale mængde tokens en sprogmodel kan behandle i én sekvens.
- context window sizeMaksimalt antal tokens en sprogmodel kan behandle i én sekvens.
- contrastive learningEn selvovervåget læringsmetode, hvor en model lærer repræsentationer ved at trække lignende eksempler tættere sammen og skubbe forskellige eksempler fra hinanden.
- contrastive learning objectiveEn træningsmetode hvor en model lærer at skelne mellem lignende og forskellige datapunkter ved at maksimere ligheden mellem positive par og minimere ligheden mellem negative par.
- contrastive lossEn loss-funktion der minimerer afstanden mellem positive par (lignende datapunkter) og maksimerer afstanden mellem negative par (forskellige datapunkter) i repræsentationsrummet.
- ConvNetConvNet er en type neuralt netværk, der primært bruger konvolutionslag til at udtrække hierarkiske mønstre fra inputdata som billeder.
- ConvNet-lagEt lag i et convolutional neural network, der udfører foldning for at ekstrahere lokale mønstre.
- ConvNet-modelEn neural netværksarkitektur, der anvender konvolutionslag til at lære hierarkiske repræsentationer af strukturelle data, typisk billeder.
- convolutionEn matematisk operation, der anvender et filter (kernel) på inputdata for at detektere mønstre, og som udgør den grundlæggende byggesten i konvolutionelle neurale netværk.
- convolutional layerEt convolutional layer er et neuralt netværkslag, der anvender foldningsoperationer (konvolution) på inputdata for at ekstrahere hierarkiske træk, typisk i form af feature maps.
- Convolutional neural networkEt neuralt netværk der anvender konvolutionelle lag til at ekstrahere hierarkiske træk fra input som billeder.
- corpus-BLEUCorpus-BLEU er en evalueringsmetrik for maskinoversættelse, der beregner n-gram præcision over hele korpuset og straffer for korte oversættelser via en brevity penalty.
- cosine annealingEn læringsrate-planlægningsteknik, der reducerer læringsraten efter en cosinusfunktion over et eller flere cyklusser.
- cosine distanceCosine distance er et mål for forskellen mellem to vektorer, defineret som 1 minus cosinus af vinklen mellem dem.
- cosine similarityCosinus-lighed er en metrik, der måler ligheden mellem to ikke-nul vektorer ved at beregne cosinus af vinklen mellem dem.
- cosine warmupCosine warmup er en learning rate-schedule, der starter med en lineær stigning (warmup) efterfulgt af en cosinusformet nedgang (cosine decay).
- cosinus-afstandCosinus-afstand måler forskellen mellem to vektorer som 1 minus cosinus-ligheden, hvor værdien går fra 0 (identisk retning) til 2 (modsat retning).
- Cost FunctionEn cost function, også kaldet tabsfunktion, kvantificerer forskellen mellem en models forudsigelser og de faktiske værdier.
- cross encoderCross encoder er en neural netværksarkitektur, der behandler et par af sekvenser (fx forespørgsel og dokument) samtidigt og direkte beregner en relevansscore eller relation mellem dem.
- cross validationEn teknik til at evaluere en models præstation ved at opdele data i flere undergrupper, træne på nogle og teste på resten, gentagne gange.
- cross-attentionCross-attention er en mekanisme i Transformer-modeller, hvor attention beregnes mellem to forskellige sekvenser, typisk en encoder og en decoder.
- cross-attention lagFenomen i transformer-modeller hvor kryds-opmærksomhedsmekanismen introducerer en forsinkelse i at tilpasse information mellem kilde- og målsekvens.
- cross-attention modulEt modul i transformer-arkitekturer der beregner opmærksomhedsfordelingen mellem to forskellige sekvenser (f.eks. en encoder- og en decoder-sekvens) i stedet for inden for én sekvens.
- cross-encoder modelEn cross-encoder model er en transformer-baseret arkitektur, der tager to tekster som input og direkte producerer en sammenligningsscore, typisk til re-ranking eller parvis klassifikation.
- Cross-entropiCross-entropi er en tabsfunktion, der måler forskellen mellem to sandsynlighedsfordelinger, ofte den sande fordeling og den forudsagte.
- Cross-entropy lossCross-entropy loss er en tabfunktion, der måler forskellen mellem den sande fordeling og den forudsagte fordeling ved at beregne den negative logaritme af sandsynligheden for de korrekte klasser.
- cross-modalBetegnelse for processer, modeller og teknikker der arbejder på tværs af forskellige modaliteter (fx tekst, billede, lyd) for at lære fælles repræsentationer eller udføre opgaver der kræver forståelse af relationer mellem modaliteter.
- cross-modal learningLæring på tværs af forskellige datatyper som tekst, billede og lyd.
- cross-modal representationEn repræsentation, der fanger information på tværs af forskellige modaliteter (fx tekst, billede, lyd) i et fælles latent rum.
- cross-modal retrievalTeknik til at søge og matche data på tværs af forskellige modaliteter, fx tekst og billede.
- CUDAEn parallel computerplatform og programmeringsmodel fra NVIDIA til generel databehandling på GPU'er.
- CUDA-driverCUDA-driveren er et lav-niveau softwarelag, der muliggør kommunikation mellem operativsystemet og NVIDIA GPU'er og gør det muligt for CUDA-programmer at køre.
- CUDA-kerneEn CUDA-kerne er en parallel processor-enhed i NVIDIA's GPU'er, designet til at udføre mange tråde samtidigt.
- CUDA-værktøjssætCUDA-værktøjssæt er en samling udviklingsværktøjer, biblioteker og drivere fra NVIDIA til programmering af CUDA-aktiverede GPU'er.
- cuDNNEt optimeret NVIDIA-bibliotek med GPU-accelererede operationer til dybe neurale netværk.
- Curriculum learningTræningsstrategi hvor data præsenteres i en stigende sværhedsgrad for at forbedre læring og konvergens.
- Curriculum schedulerEn strategi under træning, der bestemmer rækkefølgen og tempoet for præsentationen af træningseksempler, typisk fra let til svært.
- CVAEEn CVAE er en variant af variational autoencoder (VAE), der betinger den latente repræsentation på en ekstra inputvariabel for at generere betingede uddata.
- CycleGANEn type generativt modstridende netværk der muliggør uparret billed-til-billede-oversættelse ved hjælp af cykluskonsistens.
- cyklus-konsistensstabTab, der måler, hvor godt en model bevarer information ved transformation frem og tilbage mellem domæner.
- dark knowledgeDark knowledge betegner den ekstra information, der ligger i en lærerende models bløde sandsynlighedsfordelinger, og som overføres til en elevmodel under viden destillation.
- Data DistillationTeknik til at overføre viden fra en stor model eller et stort datasæt til en mindre, mere effektiv model eller et komprimeret datasæt.
- Data driftData drift betegner ændringer i fordelingen af inputdata over tid, som kan forringe en models præstation.
- Data parallelismData parallelism er en distribueringsteknik, hvor en model kopieres til flere enheder, og hver enhed trænes på en delmængde af data, mens gradienter synkroniseres.
- data-drift-detektionData-drift-detektion er processen med at overvåge og identificere ændringer i inputdatafordelingen over tid for at opdage, når en model modtager data, der afviger fra træningsdataene.
- data-drift-overvågningData-drift-overvågning er processen med at løbende overvåge og detektere ændringer i fordelingen af inputdata i en maskinlæringsmodel over tid.
- databiasDatabias er systematisk skævhed i et datasæt, der fører til uretfærdige eller ukorrekte resultater i en AI-model.
- datapipeline-orchestratorEt system der planlægger, overvåger og koordinerer udførelsen af trin i en datapipeline.
- dataset distillationDataset distillation er en teknik, hvor man komprimerer et stort datasæt til et lille syntetisk datasæt, der bevarer nok information til at træne en model med sammenlignelig ydeevne.
- datasæt-biasSystematisk skævhed i et datasæt, der fører til partiske eller urimelige forudsigelser i en AI-model.
- DBSCANDBSCAN er en tæthedsbaseret klyngealgoritme, der grupperer datapunkter baseret på deres nærhed og antallet af naboer, og som kan identificere støj.
- DCGANEn DCGAN er en generativ adversarial netværksarkitektur, der anvender dybe konvolutionelle neurale netværk til både generator og diskriminator.
- DCGAN-diskriminatorDCGAN-diskriminator er det neurale netværk i en DCGAN, der klassificerer inputbilleder som ægte eller falske ved hjælp af konvolutionelle lag, batch-normalisering og Leaky ReLU-aktivering.
- DCGAN-generatorDCGAN-generatoren er den del af et Deep Convolutional GAN, der genererer syntetiske billeder ved hjælp af transponerede convolutionelle lag.
- DDIMDDIM er en klasse af diffusionsmodeller der muliggør deterministisk og hurtig sampling ved at omgå Markov-kæde-antagelsen.
- DDPGDDPG er en reinforcement learning-algoritme, der kombinerer en deterministisk policy-gradient-metode med deep learning til kontinuerlige handlingsrum.
- DecoderEn neural netværkskomponent, der transformerer en latent repræsentation til en output-sekvens, ofte ved autoregressiv generering.
- decoder stackStakken af identisk opbyggede decoderlag i en transformerarkitektur, der transformerer en målsekvens til en outputsekvens ved hjælp af selvopmærksomhed, krydsopmærksomhed og feedforward-netværk.
- decoder-onlyEn transformer-model, som kun består af decoder-lag med kausal maskering og bruges til autoregressiv tekstgenerering.
- decoder-only modelEn transformer-model udelukkende bestående af dekoderblokke, typisk brugt til autoregressiv tekstgenerering.
- Decoder-only TransformerEn decoder-only transformer er en transformerarkitektur, der kun består af decoderblokke og anvendes til autoregressiv generering af sekvenser uden en separat encoder.
- decoderblokEn decoderblok er en komponent i transformer-arkitekturen, der består af et maskeret multi-head attention-lag, et kryds-opmærksomhedslag og et feed-forward neuralt netværk, arrangeret med residualforbindelser og lag-normalisering.
- decoderlagEt enkelt lag i en transformer-dekoder, typisk bestående af selvopmærksomhed (maskeret), krydsopmærksomhed (hvis encoder findes) og et feed-forward-netværk.
- deep feedforward networkEt dybt feedforward-netværk er et neuralt netværk med flere lag, hvor information flyder fra input til output uden cykler.
- deep GRUEn deep GRU er et neuralt netværk med flere stablede GRU-lag, der muliggør læring af hierarkiske tidsmæssige repræsentationer.
- deep learningDeep learning er en underkategori af maskinlæring, der anvender neurale netværk med mange lag (dybe arkitekturer) til at lære hierarkiske repræsentationer af data.
- deep learning frameworkEn softwareplatform med værktøjer til at designe, træne og implementere dybe neurale netværk.
- deep LSTMEt neuralt netværk med flere LSTM-lag stablet oven på hinanden for at lære hierarkiske tidsmæssige repræsentationer.
- deep neural networkEt dybt neuralt netværk er et neuralt netværk med flere skjulte lag mellem input og output.
- Deep Q-learningDeep Q-learning er en forstærkningslæringsalgoritme, der bruger et dybt neuralt netværk til at tilnærme Q-funktionen, som vurderer kvaliteten af handlinger i en given tilstand.
- deep Q-networkDeep Q-network (DQN) er en forstærkningslæringsalgoritme, der bruger et dybt neuralt netværk til at approksimere Q-værdifunktionen, så en agent kan lære optimale politikker direkte fra højdimensionelle sensoriske input.
- Deep reinforcement learningDel af maskinlæring hvor en agent lærer at træffe beslutninger gennem interaktion med et miljø ved hjælp af dybe neurale netværk til at tilnærme værdi- eller politikfunktioner.
- deep-RL-agentEn agent i reinforcement learning, der bruger dybe neurale netværk til at tilnærme politik eller værdifunktion.
- deepfakeDeepfake er syntetisk medie (video, billede eller lyd) genereret ved hjælp af deep learning-modeller, typisk ved at bytte eller manipulere ansigter.
- DekoderblokDekoderblok er en central komponent i transformer-arkitekturen, der bruger selvopmærksomhed og krydsopmærksomhed til at generere outputsekvenser.
- deliberativ arkitekturEn arkitektur til sprogmodeller, der eksplicit genererer og evaluerer mellemliggende ræsonnementstrin før et endeligt svar.
- demographic parityEn fairness-metrik, der kræver, at sandsynligheden for en positiv forudsigelse er den samme på tværs af beskyttede grupper.
- Denoising autoencoderEn denoising autoencoder er en autoencoder, der trænes til at rekonstruere et rent input fra en støjfyldt version.
- Denoising Diffusion Probabilistic ModelEn generativ model, der lærer at generere data ved at vende en gradvis støjtilførselsproces om.
- Dense Passage RetrievalEn teknik inden for informationssøgning, der repræsenterer tekstpassager som tætte vektorer (embeddings) og finder relevante passager via vektorlighedssøgning.
- dense retrievalDense retrieval er en metode til informationssøgning, der bruger tætte vektorer (embeddings) til at repræsentere forespørgsler og dokumenter og beregner lighed mellem dem for at finde relevante resultater.
- dense retrieverEn retriever, der bruger tætte vektorrepræsentationer (embedding) til at matche en forespørgsel med relevante dokumenter i et vektorrum.
- dense rewardEn tæt belønningsfunktion i forstærkningslæring, der giver feedback ved hvert tidskridt.
- depthwise separable convolutionEn convolutionsteknik der dekomponerer en standard convolution i en dybdevis convolution efterfulgt af en punktvis convolution, hvilket reducerer antallet af parametre og beregninger.
- Diffusion modelEn generativ model, der lærer at reversere en gradvis støjproces for at generere data fra tilfældig støj.
- diffusion model trainingTræningsprocessen for diffusionsmodeller, hvor modellen lærer at omvende en gradvis støjtilføjelsesproces for at generere data.
- diffusion samplingEn metode til at generere nye data ved at reversere en støjtilførselsproces i en diffusionsmodel.
- diffusionsmodelEn generativ model, der lærer at omvendt en støjtilførselsproces for at generere data fra tilfældig støj.
- dimensionalitetsreduktionTeknikker til at reducere antallet af variable (dimensioner) i et datasæt, samtidig med at den væsentlige information bevares.
- direct preference optimizationEn metode til at finjustere sprogmodeller ved at optimere direkte på par af foretrukne og ikke-foretrukne svar, uden brug af reinforcement learning.
- direkte prompt injectionEn sårbarhed i LLM'er, hvor en angriber indlejrer ondsindede instruktioner i inputteksten for at tilsidesætte modellens tilsigtede adfærd.
- discriminatorEn neural netværkskomponent, der klassificerer inputdata som ægte eller falsk i et generativt adversarisk netværk.
- discriminator lossDiscriminator loss er tabet for diskriminatoren i et GAN, der måler hvor godt den adskiller rigtige fra genererede data.
- discriminator networkEt neuralt netværk der klassificerer om et input er ægte eller genereret.
- disentangled representationEn latent repræsentation, hvor hver dimension uafhængigt kontrollerer én faktor af variation i data.
- disentanglet repræsentationslæringDisentanglet repræsentationslæring er en metode inden for dyb delæring, hvor en models indre repræsentation opdeles i uafhængige, fortolkbare faktorer, så ændring af én faktor kun påvirker én bestemt egenskab i data.
- DistilBERTEn mindre og hurtigere version af BERT, trænet ved hjælp af knowledge distillation.
- DistillationEn teknik hvor en lille 'student'-model trænes til at efterligne opførselen af en stor 'teacher'-model, typisk ved at minimere en kombination af hard labels og soft labels (logits).
- distillation lossDistillation loss er tabsfunktionen i knowledge distillation, der måler forskellen mellem en lærer- og en elevmodels bløde sandsynlighedsfordelinger.
- distillation temperatureParametret i viden-destillering, der styrer blødheden af sandsynlighedsfordelinger fra lærermodellen.
- distribueret GPU-klyngeEn samling af flere GPU'er forbundet via et højhastighedsnetværk, der arbejder som én enhed for at udføre parallelle beregninger.
- distributional robustnessDistributional robustness refererer til en models evne til at opretholde præstation, når testfordelingen afviger fra træningsfordelingen.
- diversitetsprøvetagningDiversitetsprøvetagning er en prøveudtagningsmetode, der vælger et repræsentativt sæt af data ved at maksimere variationen i egenskaber mellem prøverne.
- DNNEn dyb neurale netværk er et neuralt netværk med mange skjulte lag, der kan lære komplekse mønstre.
- DomænetilpasningTeknik til at tilpasse en maskinlæringsmodel, der er trænet på et kildedomæne, til at fungere godt på et måldomæne med en anden fordeling.
- domænetilpasningTeknik inden for maskinlæring, hvor en model trænet på et kildedomæne tilpasses til at fungere godt på et måldomæne med en anden datadistribution.
- domænetilpasningsmetodeEn metode til at tilpasse en maskinlæringsmodel trænet på et kildedomæne til at fungere effektivt på et måldomæne med en anden datafordeling.
- domænetilpasningsteknikEn domænetilpasningsteknik er en metode til at justere en model, der er trænet på et kildedomæne, så den præsterer godt på et andet, men relateret, måldomæne.
- downstream taskEn opgave, der løses ved at finjustere en forudtrænet model på en specifik datamængde.
- DPODPO er en metode til at tilpasse sprogmodeller ved at optimere direkte på præferencepar uden brug af reinforcement learning.
- DPO-algoritmeDPO-algoritme er en metode til at justere en sprogmodels præferencer direkte via parrede sammenligninger, uden at træne en separat belønningsmodel.
- DPO-pipelineEn komplet arbejdsgang til at træne en sprogmodel ved hjælp af Direct Preference Optimization, hvor modellen lærer at foretrække menneskelige præferencer uden en separat belønningsmodel.
- DPO-træningDPO-træning er en metode til at finjustere sprogmodeller direkte på præferencedata uden brug af en belønningsmodel.
- DPO-træningEn træningsmetode, der optimerer en sprogmodel direkte ud fra præferencepar uden behov for et belønningsmodul.
- DreamerDreamer er en modelbaseret forstærkningslæringsalgoritme, der lærer en verdensmodel fra erfaring og bruger den til at planlægge og lære adfærd via forestillede trajektorier.
- DreamerV2DreamerV2 er en modelbaseret forstærkningslæringsalgoritme, der lærer en latent verdensmodel via en rekurrent state-space model (RSSM) og optimerer en politik ved at rulle frem i latent rum.
- DreamerV3DreamerV3 er en modelbaseret forstærkningslæringsalgoritme, der lærer en verdensmodel fra erfaring og bruger den til at planlægge gennem imaginære baner for at opnå høj præstation på tværs af mange opgaver.
- DropoutDropout er en regulariseringsteknik, hvor tilfældige neuroner midlertidigt fjernes under træning for at mindske overfitting.
- dropout-lagEt dropout-lag er et regulariseringslag i et neuralt netværk, der tilfældigt deaktiverer en brøkdel af neuronerne under træning for at forhindre overfitting.
- dropout-rateHyperparameter der angiver sandsynligheden for at en neuron deaktiveres under dropout-regulering.
- Dropout-regulariseringDropout-regularisering er en teknik under træning af neurale netværk, hvor tilfældigt udvalgte neuroner midlertidigt deaktiveres for at mindske risikoen for overfitting.
- dVAEEn dVAE (discrete Variational Autoencoder) er en type variational autoencoder, der kortlægger kontinuerte inputdata til et diskret latent repræsentationsrum via kvantisering.
- early stoppingEarly stopping er en reguleringsteknik, hvor træningen afbrydes, når modellens ydeevne på en valideringsmængde ikke længere forbedres.
- Edge inferenceKørsel af en trænet maskinlæringsmodel på en lokal enhed (fx mobiltelefon eller IoT-enhed) i stedet for i skyen.
- Edge TPUEdge TPU er en lille, strømbesparende ASIC fra Google, der accelererer inferens af maskinlæringsmodeller på edge-enheder.
- egenskabsrumEt flerdimensionelt rum, hvor hver dimension svarer til en egenskab eller et træk ved data.
- ekstraktiv resumé-genereringEn automatisk metode til at skabe et resumé af en tekst ved at udvælge de vigtigste sætninger eller sætningsdele direkte fra kildeteksten.
- Elastic Net-regressionElastic Net-regression er en lineær regressionsmodel, der kombinerer L1- og L2-regulering for at opnå både variabelselektion og håndtering af multikollinearitet.
- Elastic Net-regulariseringElastic Net-regularisering er en kombination af L1- og L2-regulering, der både kan udvælge variable og håndtere multikollinearitet.
- ELBO-objectiveELBO (Evidence Lower Bound) er en nedre grænse for log-marginal likelihood, der bruges som optimeringsmål i variational inference.
- embedding spaceEt flerdimensionalt vektorrum, hvor hvert punkt repræsenterer en entitet (ord, sætning, billede) som en tæt vektor.
- embedding space dimensionDimensionen af det vektorrum, som en embedding-model projicerer data ind i.
- Embedding space-geometriStudiet af de geometriske egenskaber ved det vektorrum, hvor neurale netværks embedding-vektorer ligger, herunder afstande, retninger og struktur.
- Embedding-matrixEn embedding-matrix er en vægtmatrix i et neuralt netværk, der kortlægger diskrete tokens til kontinuerte vektorer med lav dimensionalitet.
- embedding-rumEmbedding-rum er et abstrakt vektorrum, hvor diskrete objekter (fx ord, billeder) repræsenteres som kontinuerte vektorer, så semantiske relationer svarer til geometriske afstande og retninger.
- embeddingdimensionAntallet af dimensioner i en embedding-vektor, som bestemmer hvor mange egenskaber modellen kan indfange for hvert objekt.
- embeddinglagEt lag i et neuralt netværk, der kortlægger diskrete kategoriske input, såsom ord eller tokens, til tætte vektorer af faste dimensioner.
- embeddingmodelEn model der konverterer sprogdata (ord, sætninger, dokumenter) til tætte vektorer (embeddings) i et kontinuerligt vektorrum, så semantisk lighed afspejles i afstanden mellem vektorerne.
- embeddingmodelEn neural netværksmodel, der kortlægger diskrete objekter (ord, sætninger, dokumenter) til kontinuerte vektorer i et højdimensionelt rum, kaldet embeddings.
- embeddingopslagEmbeddingopslag er processen med at slå en embedding op i en vektordatabase eller fra en indlejringstavle i en model.
- embeddingspaceEt embeddingspace er et vektorrum, hvor hvert diskret element (fx et ord, billede) repræsenteres af en kontinuert vektor.
- embodied cognitionTeorien om at kognitive processer er formet af kroppens interaktion med verden, ikke kun af hjernens abstrakte beregninger.
- Emergent abilityEvne der opstår i en stor sprogmodel, som ikke var til stede i mindre modeller og ikke var eksplicit trænet for.
- empirisk kumulativ fordelingsfunktionDen empiriske kumulative fordelingsfunktion (ECDF) er en ikke-parametrisk estimator af den sande kumulative fordelingsfunktion, baseret på observerede data.
- EncoderEn neural netværkskomponent, der transformerer inputdata til en latent repræsentation.
- encoder-decoderEn arkitektur med to neurale netværk: en encoder, der komprimerer input til en latent repræsentation, og en decoder, der genererer output fra denne repræsentation.
- encoder-decoder-transformerEn encoder-decoder-transformer er en variant af transformer-arkitekturen, der består af en encoder, der behandler inputsekvensen, og en decoder, der genererer outputsekvensen ved hjælp af krydsopmærksomhed over encoderens repræsentationer.
- encoder-embeddingEn encoder-embedding er en kontekstualiseret vektorrepræsentation af et inputtoken genereret af encoderdelen af en transformerarkitektur.
- encoder-onlyEn transformerarkitektur der kun består af encoder-delen, typisk brugt til repræsentationslæring og forståelsesopgaver.
- encoder-only modelEn transformer-baseret model bestående udelukkende af encoder-stakken, som genererer en kontekstafhængig repræsentation af inputsekvensen.
- encoder-only transformerEn transformerarkitektur der udelukkende består af encoderblokke, anvendt til at generere kontekstuelle repræsentationer af inputsekvenser, typisk til klassifikation eller forståelse.
- encoderblokEn encoderblok er en byggesten i en transformer-arkitektur, der består af et multi-head self-attention-lag og et feed-forward neuralt netværk, omgivet af residualforbindelser og lag-normalisering.
- environment dynamicsDe regler, der bestemmer, hvordan et miljø ændrer sig som reaktion på en agents handlinger, typisk beskrevet ved en overgangsfunktion i en Markov-beslutningsproces.
- environment modelEn model, der repræsenterer dynamikken i et miljø, typisk brugt i forstærkningslæring til at forudsige næste tilstand og belønning givet en handling.
- equal opportunityEqual opportunity (lighed i muligheder) er et fairness-kriterium, der kræver, at en models sande positive rate (TPR) er ens på tværs af værdier af en beskyttet attribut.
- equalized oddsEt fairness-kriterium i maskinlæring, der kræver, at sandsynligheden for en positiv forudsigelse er den samme på tværs af grupper for både positive og negative sande labels.
- ETL-pipelineETL-pipeline er en dataarbejdsproces, der udtrækker data fra kilder, transformerer dem til analyseformål og indlæser dem i et målsystem.
- eval-målingProces eller metode til at kvantificere en AI-models ydeevne ved hjælp af standardiserede metrikker.
- eval-målingsprotokolEn standardiseret procedure til måling og evaluering af en AI-models ydeevne, typisk omfattende både metrikker og et sæt testdata.
- eval-pipelineEn eval-pipeline er en struktureret sekvens af trin til systematisk evaluering af en AI-models ydeevne, typisk indeholdende dataindlæsning, kørsel af inference, beregning af metrikker og rapportering.
- evalueringsdatasætEt datasæt, der bruges til at måle en models præstation efter træning, typisk for at vurdere generaliseringsevne.
- evalueringsprotokolEn standardiseret fremgangsmåde og sæt af regler for at evaluere en AI-models ydeevne, herunder valg af data, metrikker og evalueringsmetode.
- expectationForventningsværdi (forventning) er et mål for den gennemsnitlige værdi af en stokastisk variabel, vægtet med sandsynligheder.
- Expected Calibration ErrorExpected Calibration Error (ECE) er en metrik, der måler afvigelsen mellem en models forudsagte sandsynligheder og de faktiske observerede frekvenser, typisk opdelt i intervaller (bins).
- experiment metadataMetadata om et eksperiment, herunder parametre, data, kode, resultater og miljø.
- Experiment trackingSystematisk dokumentation og logning af parametre, data, metrikker og kode for maskinlæringseksperimenter.
- experiment tracking toolEt system der registrerer parametre, målinger og artefakter fra maskinlæringseksperimenter.
- expert capacityEvne for en del af en model til at specialisere sig i og håndtere viden inden for et bestemt domæne.
- expert networkEt ensemble af specialiserede delmodeller (eksperter) styret af en portmekanisme, der vælger eller vægter eksperternes output baseret på inputtet.
- ExplainabilityExplainability betegner egenskaben ved et AI-system, at dets beslutninger og adfærd kan forklares på en forståelig måde for mennesker.
- F1 scoreDet harmoniske gennemsnit af præcision og recall, der bruges som en samlet metrik for en klassifikationsmodels nøjagtighed.
- FairnessFairness refererer til princippet om, at AI-systemer ikke må udvise systematisk bias eller diskrimination over for bestemte grupper.
- fairness auditEn fairness audit er en systematisk gennemgang af en AI-model for at identificere og adressere bias og diskrimination.
- fairness constraintEn fairness constraint er en betingelse, der pålægges en model for at sikre, at dens forudsigelser ikke diskriminerer på baggrund af beskyttede karakteristika som køn eller race.
- fairness-metricEn fairness-metric er et kvantitativt mål der evaluerer om en models forudsigelser opfylder et bestemt fairness-kriterium på tværs af grupper.
- fairness-metrikEn fairness-metrik er en kvantitativ måling af, i hvor høj grad en AI-models beslutninger er retfærdige på tværs af demografiske grupper.
- faktaaccuracyFaktaaccuracy er en metrik, der måler andelen af faktuelle påstande i en models output, som er korrekte.
- feature engineeringFeature engineering er processen med at udvælge, transformere og skabe relevante inputvariable (features) fra rådata for at forbedre præstationen af maskinlæringsmodeller.
- feature mapEn feature map er en output-matrise fra et konvolutionelt lag i et neuralt netværk, der repræsenterer tilstedeværelsen af specifikke visuelle mønstre i inputdata.
- feature selectionProces hvor en delmængde af relevante features (inputvariable) udvælges til brug i en model.
- feature spaceFeature space er et multidimensionelt rum, hvor hver dimension svarer til en feature (træk) ved dataene, og hvert datapunkt er et punkt i dette rum.
- feature storeEt feature store er et centraliseret lager til lagring, deling og genbrug af maskinlæringstræk på tværs af projekter.
- feature store-pipelineEn pipeline der automatiserer processen med at oprette, validere og levere features til en feature store.
- few-shot chain-of-thoughtFew-shot chain-of-thought er en prompting-teknik, hvor man giver sprogmodellen nogle få eksempler, der hver især indeholder et ræsonnementstrin, så modellen lærer at ræsonnere før den svarer.
- Few-shot classificationEn klassifikationsmetode, hvor en model lærer at genkende nye klasser med kun få træningseksempler per klasse.
- few-shot indlæringsmodelEn model der er trænet til at genkende nye klasser eller udføre nye opgaver med kun få træningseksempler.
- few-shot klassifikationEn maskinlæringsopgave, hvor en model skal klassificere nye klasser baseret på meget få labeled eksempler (typisk 1-5 per klasse).
- few-shot klassifikatorEn klassifikator der kan genkende nye klasser efter træning på kun få eksempler per klasse.
- Few-shot learningFew-shot learning er en maskinlæringsparadigme, hvor en model trænes til at generalisere fra et meget lille antal mærkede eksempler per klasse.
- Few-shot object detectionTeknik inden for computer vision, der gør det muligt at detektere objekter fra nye klasser med kun få annoterede eksemplarer.
- few-shot promptingFew-shot prompting er en prompting-teknik, hvor brugeren inkluderer et lille antal eksempler (typisk 2-5) i prompten for at guide modellens respons uden at opdatere modelvægtene.
- few-shot regressionEn maskinlæringsteknik, hvor en model trænes til at forudsige kontinuerte værdier baseret på kun få eksempler.
- FGSMFGSM er et hurtigt gradientbaseret angreb, der genererer adversarial examples ved at tilføje støj i retning af gradientens fortegn.
- Fine-tuningTræning af en forudtrænet model på en specifik opgave med et mindre datasæt for at tilpasse modellens vægte.
- finjusteringFinjustering er processen med at videreoplære en allerede trænet model på en specifik, ofte mindre, mængde data for at tilpasse den til en bestemt opgave eller domæne.
- Forklarbar AIForklarbar AI (XAI) betegner metoder og teknikker, der gør det muligt for mennesker at forstå, fortolke og have tillid til resultater og beslutninger fra kunstig intelligens.
- ForklarlighedEvnen til at forstå og fortolke, hvordan en AI-model når frem til sine beslutninger eller forudsigelser.
- forstærkende læringForstærkende læring er en maskinlæringsteknik, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger eller straf.
- forstærkningslæringForstærkningslæring er en maskinlæringsteknik, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger eller straf for sine handlinger.
- forstærkningslæringEn type maskinlæring, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger.
- forstærkningslæringsalgoritmeEn algoritme der træner en agent til at tage handlinger i et miljø for at maksimere en kumulativ belønning.
- forsvindende gradientProblem i træning af dybe neurale netværk, hvor gradienterne (hældningerne) bliver eksponentielt mindre, når de bakker gennem netværket, hvilket forhindrer vægtopdateringer i de tidligere lag.
- forsvindende gradient-problemFænomenet hvor gradienterne aftager eksponentielt gennem lagene i et dybt neurale netværk under backpropagation, hvilket gør tidlige lag næsten umulige at træne.
- fortolkelig AIFortolkelig AI refererer til AI-systemer, hvis beslutninger og output kan forstås og forklares af mennesker.
- fortolkningsteknikEn metode til at forstå eller forklare, hvordan en AI-model træffer beslutninger.
- fortrænet billedmodelEn fortrænet billedmodel er et neuralt netværk, der er blevet trænet på en stor billeddatabase (f.eks. ImageNet) og derefter genbruges eller finjusteres til specifikke opgaver inden for computer vision.
- fortrænet modelEn model, der er trænet på en stor, generel datasæt og efterfølgende finjusteres til en specifik opgave.
- fortrænet sprogmodelEn sprogmodel, der er trænet på en stor tekstkorpus og efterfølgende finjusteres til specifikke opgaver.
- FortræningFortræning er den indledende træningsfase, hvor en model lærer generelle repræsentationer fra store mængder umærkede data.
- FortræningFortræning er den indledende fase i træningen af en dyb læringsmodel, hvor den lærer generelle repræsentationer fra store mængder umærkede data.
- fortræningsdataData brugt til at træne en AI-model fra bunden, inden eventuel finjustering.
- fortræningsdatasætEt fortræningsdatasæt er en stor samling af tekst-, billed- eller andre data, som en maskinlæringsmodel trænes på i en indledende fase (fortræning) for at lære generelle mønstre og repræsentationer.
- fortræningsfaseDen indledende træning af en maskinlæringsmodel på et stort, ofte ikke-annoteret datasæt for at lære generelle repræsentationer.
- fortræningsmålEt fortræningsmål er den specifikke opgave, en sprogmodel optimeres på under den indledende træning på store mængder umærkede data.
- fortræningsmålEt fortræningsmål er den specifikke opgave eller det mål, som en model optimeres mod under den indledende træning på store, umærkede datasæt, før den eventuelt finjusteres til specifikke opgaver.
- fortræningstrinEt fortræningstrin er en fase i maskinlæring, hvor en model trænes på et stort, generelt datasæt for at lære grundlæggende repræsentationer.
- forudtrænet ord-embeddingEn forudtrænet ord-embedding er en vektorrepræsentation af ord, der er lært på et stort tekstkorpus og derefter genbrugt i andre NLP-opgaver.
- forudtrænet sprogmodelEn sprogmodel der er trænet på en stor generel tekstmængde, typisk ved selvovervåget læring, for derefter at blive finjusteret til specifikke opgaver.
- forudtrænet transformerEn transformer-baseret sprogmodel der er blevet forudtrænet på et stort korpus og efterfølgende finjusteres til specifikke NLP-opgaver.
- forudtrænet transformer-modelEn transformer-model, der er blevet trænet på en stor og generel datasæt (foruddannelse) og efterfølgende kan finjusteres til specifikke opgaver.
- forudtrænet transformer-modelEn transformer-model, der er blevet trænet på en stor mængde tekstdata for at lære generelle sprogmønstre, inden den eventuelt finjusteres til specifikke opgaver.
- forventningsmaksimeringForventningsmaksimering (EM) er en iterativ metode til at finde maksimum likelihood-estimater for parametre i statistiske modeller med latente variable.
- Foundation modelEn stor, forudtrænet model trænet på bredt data, der kan finjusteres til en bred vifte af opgaver.
- foundation model promptingPraksis med at designe input-prompter til at styre fundamentale modellers output.
- foundation-model-arkitekturDen underliggende arkitektur af en foundation model, typisk en transformer-baseret neurale netværksstruktur, der muliggør prætræning på store datasæt.
- foundation-model-træningTræning af en foundation-model på store, diverse datasæt vha. selvovervåget læring.
- foundation-model-træningFoundational model træning er den indledende fase, hvor en stor model trænes på massive, ustrukturerede datasæt ved hjælp af selvsuperviserede læringsmetoder.
- foundation-model-træningsdataDe omfattende datasæt, der anvendes til at træne en foundation model, typisk bestående af store mængder ustruktureret tekst, billeder eller andet indhold fra internettet.
- foundation-model-træningsomkostningOmkostningerne ved at træne en foundation-model, typisk målt i GPU-timer, energi og finansielle ressourcer.
- fuld fine-tuningEn træningsmetode hvor alle parametre i en prætrænet model opdateres under tilpasning til en ny opgave.
- full fine tuningFull fine tuning er en finjusteringsmetode, hvor samtlige parametre i en prætrænet model opdateres under træning på en specifik opgave.
- function call APIEn API, der gør det muligt for en sprogmodel at returnere strukturerede kald til eksterne funktioner i stedet for naturligt sprog.
- Function callingEvnen hos en sprogmodel til at generere strukturerede kald til eksterne funktioner eller API'er baseret på brugerens hensigt.
- funktionskaldTeknik, hvor en sprogmodel kan anmode om at udføre en foruddefineret funktion og integrere resultatet i sit svar.
- fællessandsynlighedsfordelingEn fællessandsynlighedsfordeling beskriver sandsynligheden for samtidige hændelser af to eller flere stokastiske variable.
- Fβ-scoreFβ-score er det vægtede harmoniske gennemsnit af præcision og recall, hvor β angiver, hvor mange gange recall er vigtigere end præcision.
- GANEt generativt neuralt netværk bestående af to konkurrerende netværk: en generator og en diskriminator.
- gating networkEt gating network er en komponent i en blanding af eksperter (MoE), der bestemmer, hvilke eksperter der skal aktiveres for et givet input.
- generaliseringEn models evne til at præstere korrekt på nye, usete data efter træning på et begrænset datasæt.
- generaliseringsfejlGeneraliseringsfejl er den fejl, en model begår på nye, hidtil usete data, i modsætning til træningsfejlen.
- generaliseringsgabForskellen mellem en models præstation på træningsdata og på hidtil usete data.
- generalizationEvnen hos en model til at præstere korrekt på nye, usete data efter at være trænet på et begrænset datasæt.
- generalization errorGeneralization error er den forventede fejl på nye, usete data, målt på testfordelingen.
- generalization gapForskellen mellem en models præstation på træningsdata og på hidtil usete testdata.
- generalized zero-shot learningGeneralized zero-shot learning (GZSL) er en læringsteknik, hvor modellen under testning klassificerer både sete og hidtil usete klasser, i modsætning til traditionel zero-shot learning, der kun tester på usete klasser.
- generativ adversarial networkEt generativt adversarial network (GAN) er en maskinlæringsarkitektur, hvor to neurale netværk – en generator og en diskriminator – konkurrerer mod hinanden for at generere realistiske syntetiske data.
- generativ modelEn generativ model er en statistisk model, der lærer den fælles sandsynlighedsfordeling over data og kan generere nye syntetiske datapunkter.
- Generative Adversarial NetworkEt neuralt netværk bestående af to modeller, en generator og en diskriminator, der trænes samtidigt i et konkurrencepræget spil, hvor generatoren forsøger at producere data, der kan narre diskriminatoren.
- generatorEn generator er en neural netværkskomponent der genererer nye data (f.eks. billeder, tekst) fra en latent repræsentation.
- generator-netværkDel af et generativt adversarielt netværk (GAN), der genererer syntetiske data, typisk for at narre diskriminator-netværket.
- gennemsnitlig præcisionMetrik der beregner det gennemsnitlige præcisionsniveau over alle recall-niveauer for en rangordnet resultatliste.
- gennemsnitlig præcisionMål for kvaliteten af en rangeringsmodel, beregnet som gennemsnittet af præcisionen ved hver relevant position.
- glidende vindueEn teknik, hvor et vindue af fast størrelse glider over en sekvens for at udføre en operation på hvert delafsnit.
- global kontekstvektorEn vektorrepræsentation, der opsummerer informationen fra hele inputsekvensen i en transformer- eller seq2seq-model.
- GloVeGloVe er en uovervåget læringsalgoritme, der producerer tætte ordvektorer ved at faktorisere en ord-med-forekomstmatrix.
- GloVe-embeddingsGloVe (Global Vectors for Word Representation) er en teknik til at generere ordindlejringer ved at faktorisere en ord-samtidighedsmatrix baseret på globale tekststatistikker.
- GloVe-modelEn model der lærer ordvektorer ved at udnytte globale co-forekomststatistikker fra et korpus.
- GPT-4OpenAIs fjerde generation af sprogmodeller i GPT-serien, trænet på store mængder tekst og kode.
- GPU-klyngeEn GPU-klynge er en samling af flere GPU'er forbundet via et højhastighedsnetværk, der arbejder sammen om at udføre parallelle beregninger.
- gradient clipperEn teknik under træning af neurale netværk, hvor gradienter begrænses til en maksimal værdi for at forhindre eksploderende gradienter.
- Gradient clippingEn teknik i træning af neurale netværk, der begrænser størrelsen af gradienter under backpropagation for at forhindre eksploderende gradienter.
- gradient clipping thresholdEn hyperparameter, der sætter en maksimal grænse for gradienternes størrelse under træning af neurale netværk for at forhindre eksploderende gradienter.
- Gradient descentGradient descent er en iterativ optimeringsalgoritme, der minimerer en funktion ved at opdatere parametre i modsat retning af gradienten af funktionen.
- gradientnedstigningGradientnedstigning er en iterativ optimeringsalgoritme, der minimerer en funktion ved at bevæge sig i modsat retning af gradienten.
- Greedy decodingEn sekvensgenereringsstrategi, der ved hvert trin vælger det mest sandsynlige næste token.
- grounded language learningEn tilgang til sprogindlæring, hvor betydning forankres i perception, handling eller anden ikke-sproglig erfaring.
- GroundingGrounding er processen hvorved en sprogmodel eller et AI-system forbinder symbolske repræsentationer med virkelige verdeners data, såsom billeder, lyd eller fysiske objekter.
- grounding dataData, der bruges til at forankre en AI-models output i faktiske, verificerbare oplysninger.
- grounding moduleEt grounding module er en komponent i en AI-model, der forbinder symbolske repræsentationer (fx sprog) med ikke-symbolske data (fx visuelle eller taktile input) for at give modellen en forståelse af den fysiske verden.
- grounding pipelineEn grounding-pipeline er et system, der forbinder en sprogmodels output med eksterne datakilder eller sensoriske input for at forankre modellens svar i faktisk viden eller virkeligheden.
- GRUEn GRU er en variant af en rekurrent neural netværksenhed, der bruger gate-mekanismer til at kontrollere informationsflow og afhjælpe forsvindende gradient-problemet.
- GRU-celleGRU-celle er en type tilbagevendende neural netværkscelle med to porte (reset og update), der regulerer informationsflowet og mindsker problemet med forsvindende gradienter.
- GRU-lagEt GRU-lag er et neuralt netværkslag baseret på en portstyret recurrent enhed, der løser problemet med forsvindende gradienter i traditionelle RNN’er ved hjælp af opdaterings- og nulstillingsporte.
- GRU-netværkGRU-netværk er en variant af et tilbagevendende neuralt netværk (RNN), der bruger opdaterings- og nulstille-porte til at kontrollere informationsstrømmen og afhjælpe forsvindende gradienter.
- guardrail-layerEt guardrail-layer er en ekstra komponent i en AI-model, der håndhæver sikkerheds- eller adfærdsbegrænsninger ved at filtrere eller ændre modeloutputtet.
- guardrail-stackingTeknikken at anvende flere lag af sikkerhedsrestriktioner (guardrails) i en AI-pipeline for at øge robusthed og forhindre uønsket output.
- GuardrailsEt sæt af regler, filtre eller mekanismer, der forhindrer en AI-model i at producere skadelige, upassende eller uønskede output.
- guardrails-configurationGuardrails-configuration er opsætningen af regler, begrænsninger og kontrolmekanismer, der sikrer, at en AI-model opfører sig sikkert og etisk forsvarligt.
- Guardrails-frameworkEt guardrails-framework er et system af regler, validatorer og korrektioner, der anvendes til at styre og begrænse output fra sprogmodeller for at sikre sikkerhed, overholdelse og pålidelighed.
- Guardrails-pipelineEn Guardrails-pipeline er en sekvens af sikkerhedsforanstaltninger, der validerer, filtrerer og korrigerer input og output i en AI-model for at forhindre uønsket eller skadelig adfærd.
- guardrails-politikEn politik eller sæt af regler, der definerer acceptable grænser for en AI-systemets adfærd og output.
- Hallucination detectionHallucination detection er processen med at identificere eller kvantificere hallucinationer i output fra sprogmodeller.
- hallucination rateHyppigheden hvormed en sprogmodel producerer faktuel forkerte eller opdigtede oplysninger.
- hallucinationstendensHallucinationstendens betegner en sprogmodels tilbøjelighed til at generere falsk, men plausibelt klingende information.
- handlingsværdfunktionEn funktion der estimerer den forventede samlede fremtidige belønning ved at tage en given handling i en given tilstand og derefter følge en bestemt politik.
- harmlessness objectiveDet mål i RLHF-træning, hvor en AI-model lærer at undgå at generere svar, der kan forårsage skade eller krænke etiske retningslinjer.
- harmlessness trainingHarmlessness training er en træningsmetode, der reducerer sandsynligheden for, at en sprogmodel genererer skadeligt, giftigt eller farligt indhold.
- harmlessness training dataHarmlessness training data er træningsdata, der er omhyggeligt udvalgt eller genereret for at lære en AI-model at undgå at producere skadelige, stødende eller farlige outputs.
- He initializationEn metode til at initialisere vægte i neurale netværk, der tager højde for ReLU-aktiveringsfunktionens egenskaber ved at sætte variansen til 2/n_in.
- hierarchical planningEn metode inden for AI, hvor et komplekst problem opdeles i hierarkiske delmål eller delopgaver, som planlægges og løses på forskellige abstraktionsniveauer.
- hierarkisk clusteringHierarkisk clustering er en metode til at gruppere data i et hierarki af klynger, hvor klyngerne indlejres i hinanden i et dendrogram.
- Hugging Face Space SDKSoftware Development Kit (SDK) til programmatisk interaktion med Hugging Face Spaces, typisk via Python-biblioteket huggingface_hub.
- Hugging Face TransformersHugging Face Transformers er et open-source Python-bibliotek, der giver adgang til forudtrænede modeller og værktøjer baseret på Transformer-arkitekturen til naturlig sprogbehandling.
- hybrid arkitekturEn hybrid arkitektur i kunstig intelligens kombinerer to eller flere forskellige arkitekturtyper eller tilgange for at udnytte styrkerne fra hver.
- hybrid parallelismHybrid parallelism kombinerer data- og modelparallelisme for at fordele træningen af store neurale netværk på tværs af flere GPU'er eller noder.
- hybrid rankingHybrid ranking er en søgeteknik, der kombinerer mindst to forskellige rangeringsmetoder, typisk en leksikalsk (f.eks. BM25) og en semantisk (f.eks. cosine similarity), for at forbedre relevansen af søgeresultater.
- hybrid retrieval-pipelineEn søgepipeline der kombinerer to eller flere forskellige retrieval-metoder — typisk en semantisk (dense) og en leksikalsk (sparse) — for at forbedre kvaliteten af de hentede dokumenter i en RAG-arkitektur.
- hybrid søgningHybrid søgning kombinerer dense vector search (semantisk søgning) med sparse keyword search (f.eks. BM25) for at forbedre relevans og recall i informationssøgning.
- hybrid søgningSøgemetode der kombinerer leksikalsk søgning (f.eks. BM25) med vektorbaseret semantisk søgning for at forbedre relevans og dækning.
- hybrid søgningHybrid søgning kombinerer nøgleordsbaseret (f.eks. BM25) og vektorbaseret (f.eks. embedding-cosine-lighed) søgning for at forbedre relevans og dækning i informationsgenfinding.
- hybrid søgningsalgoritmeEn hybrid søgningsalgoritme kombinerer to eller flere forskellige søgemetoder, typisk leksikalsk (f.eks. BM25) og semantisk (vektor-søgning), for at opnå bedre resultater end hver metode alene.
- hybrid søgningsmetodeEn søgningsmetode der kombinerer traditionel nøgleordsbaseret søgning (fx BM25) med semantisk søgning baseret på vektorembeddings for at forbedre relevansen.
- hybrid søgningsmodelEn søgestrategi der kombinerer traditionel søgning baseret på nøgleord (f.eks. BM25) med semantisk søgning baseret på vektorembeddings for at forbedre relevansen af søgeresultater.
- hyperparameterEn hyperparameter er en konfigurationsparameter, der sættes inden træning og styrer læringsprocessen, i modsætning til modelparametre, som læres fra data.
- hyperparameteroptimeringProces med at finde de optimale hyperparametre for en maskinlæringsmodel for at maksimere dens ydeevne.
- hyperparametersøgningEn systematisk metode til at finde optimale hyperparametre til en maskinlæringsmodel.
- Image generationTeknik med kunstig intelligens til at skabe nye billeder baseret på en given betingelse eller tilfældig støj.
- image segmentationTeknik der opdeler et digitalt billede i flere segmenter eller regioner for at forenkle analyse.
- image-to-image generationBillede-til-billede generation er en teknik inden for generativ AI, hvor et inputbillede transformeres til et outputbillede, ofte styret af en tekstprompt eller en målstil.
- implicit biasImplicit bias refererer til systematiske skævheder i en AI-models output, der ikke er bevidst indprogrammeret, men som opstår fra skævheder i træningsdata, modelarkitektur eller træningsproces.
- implicit bias-afbødningImplicit bias-afbødning er processen med at reducere utilsigtede skævheder i AI-modellers adfærd, som opstår fra underliggende stereotyper eller skæve træningsdata.
- implicit bias-fældenDen ubevidste og utilsigtede introduktion af bias i AI-systemer, ofte gennem skæve træningsdata eller modelantagelser, som fører til systematisk uretfærdige resultater.
- In-context learningIn-context learning er en metode, hvor en sprogmodel lærer at udføre en opgave udelukkende ved hjælp af eksempler i prompten, uden at opdatere sine vægte.
- incremental learningIncremental learning er en maskinlæringsteknik, hvor en model opdateres løbende med nye data uden at blive genoptrænet fra bunden, samtidig med at den bevarer tidligere erhvervet viden.
- incremental learning algorithmEn type maskinlæringsalgoritme, der opdaterer sin model løbende efterhånden som nye data bliver tilgængelige, uden at skulle genlære hele datasættet.
- incremental learning scenarioEn læringssituation hvor en model trænes på en strøm af data, der ankommer over tid, og modellen skal tilpasse sig ny information uden at glemme tidligere læring.
- indirekte prompt injectionIndirekte prompt injection er en form for prompt injection-angreb, hvor modellen angribes via en sekundær kilde (f.eks. en hjemmeside eller et dokument) i stedet for direkte brugerinput.
- Inductive biasInductive bias betegner de antagelser, en maskinlæringsalgoritme anvender for at foretrække bestemte hypoteser frem for andre, når den generaliserer fra træningsdata.
- inference accelerationInference acceleration betegner teknikker og metoder til at reducere beregningstiden og ressourceforbruget ved at anvende en trænet AI-model til inferens.
- inference optimizationSamling af teknikker til at reducere beregningsomkostningerne og forsinkelsen ved at køre en trænet model, uden at ændre på træningen.
- inference pipelineEn inference pipeline er en sekvens af forarbejdningstrin, der anvender en trænet model til at producere forudsigelser fra rå inputdata.
- Inference serverEn server eller tjeneste, der kører en trænet AI-model og leverer inferensresultater via en API.
- inference-timeDen fase i en modellevetid, hvor en trænet model bruges til at generere forudsigelser på nye data.
- inferens accelerationTeknikker til at øge hastigheden af inferens i neurale netværk uden at ændre modelarkitekturen væsentligt.
- InfiniBandInfiniBand er et højhastighedsnetværksinterface med lav latenstid, der bruges til at forbinde computere i datacentre og supercomputere.
- Instruction fine-tuningEn teknik hvor en prætrænet sprogmodel viderefinjusteres på et datasæt af instruktioner og forventede svar for at forbedre dens evne til at følge instruktioner.
- instruktions-fine-tuning-datasætEt datasæt af (instruktion, output)-par, der bruges til at finjustere en sprogmodel til at følge anvisninger.
- instruktionsfinjusteringInstruktionsfinjustering er en træningsmetode, hvor en fortrænet sprogmodel finjusteres på et datasæt af instruktion-svar-par for at forbedre modellens evne til at følge instruktioner.
- int8 kvantiseringPræcisionsreduktion af modelvægte og aktiveringer til 8-bit heltalsværdier for at opnå lavere hukommelsesforbrug og hurtigere inferens.
- Intelligent agentEn intelligent agent er en autonom enhed, der opfatter sit miljø gennem sensorer, træffer beslutninger baseret på viden og mål, og handler i miljøet gennem aktuatorer for at opnå et specifikt formål.
- intern repræsentationDen kodning af inputdata, som en neural netværksmodel lærer i sine skjulte lag, og som fanger de relevante strukturer og mønstre.
- intern repræsentationDe indre (skjulte) repræsentationer af data, som en neural netværksmodel lærer i sine skjulte lag.
- interpolationsmetodeEn metode til at estimere værdier mellem kendte datapunkter, ofte anvendt i maskinlæring til at udfylde manglende data eller generere nye repræsentationer.
- interpretabilitetsmetodeEn metode til at gøre en maskinlæringsmodel beslutningsproces forståelig for mennesker.
- interpretabilitetsværktøjVærktøj der bruges til at analysere og visualisere, hvordan en AI-model træffer beslutninger.
- InterpretabilityEvnen til at forstå og forklare, hvordan en AI-model træffer beslutninger.
- InterpretabilityInterpretability er en models evne til at give menneskeligt forståelige forklaringer på sine forudsigelser og interne repræsentationer.
- invers kumulativ fordelingsfunktionFunktion der givet en sandsynlighed p returnerer den værdi x, for hvilken den kumulative fordelingsfunktion (CDF) er lig p.
- Inverse reinforcement learningInverse reinforcement learning (IRL) er en teknik, hvor en agent lærer en belønningsfunktion ud fra observeret adfærd.
- iterationsbaseret optimeringEn optimeringsmetode der gentagne gange opdaterer parametre baseret på en fejlfunktions gradient for at minimere fejlen.
- iterativ træningTræning af en model gentagne gange i cyklusser, hvor hver iteration forbedrer modellen baseret på tidligere resultater.
- JailbreakTeknik til at omgå sikkerhedsforanstaltninger og restriktioner i en sprogmodel for at få den til at producere ellers blokerede outputs.
- jailbreak-angrebEt jailbreak-angreb er et forsøg på at omgå en AI-models sikkerhedsforanstaltninger ved hjælp af specialdesignede prompter eller kontekster.
- jailbreak-metodeEn metode til at manipulere en sprogmodel til at ignorere dens sikkerhedstræning og generere forbudt eller skadeligt indhold.
- jailbreak-promptEn jailbreak-prompt er en specialdesignet prompt, der forsøger at omgå en AI-models sikkerhedsrestriktioner og få den til at generere ellers blokeret indhold.
- jailbreak-teknikEn metode til at omgå de sikkerhedsforanstaltninger, der er indbygget i en sprogmodel, for at få den til at producere indhold, den normalt ville blokere.
- jailbreakingJailbreaking betegner bevidst manipulation af prompts eller input for at omgå sikkerhedsmekanismerne i et AI-system, så det producerer skadelige, uetiske eller begrænsede output.
- JAXJAX er et open source-bibliotek til højtydende numerisk computing, der kombinerer automatisk differentiering, JIT-kompilering og accelereret array-manipulation, primært til maskinlæringsforskning.
- jax.jitjax.jit er en funktion i JAX-biblioteket, der kompilerer og optimerer Python-funktioner til højtydende eksekvering ved hjælp af just-in-time (JIT) kompilering.
- jax.pmapjax.pmap er en funktion i JAX-biblioteket, der udfører automatisk parallelisering af funktioner på tværs af flere enheder ved brug af single-program multiple-data (SPMD)-paradigmet.
- jax.vmapjax.vmap er en funktion i JAX, der automatisk vektoriserer en funktion ved at tilføje en batch-dimension.
- jordforbindelseJordforbindelse er processen med at knytte sproglige symboler til virkelige verdensobjekter eller sansninger.
- jordforbindelse gennem interaktionEn metode hvorved en AI-model lærer at forbinde sproglige eller abstrakte symboler med fysiske oplevelser og handlinger gennem interaktion med omgivelserne.
- k-fold cross-validationK-fold cross-validation er en valideringsteknik, hvor datasættet opdeles i k lige store dele, og modellen trænes og evalueres k gange, hver gang med en anden del som testdata og resten som træningsdata.
- k-means clusteringEn iterativ algoritme til at partionere et datasæt i k clusters, hvor hvert punkt tilhører det cluster med nærmeste centroid.
- kalibreringskurveEn graf der viser sammenhængen mellem en models forudsagte sandsynligheder og de observerede frekvenser af positive udfald.
- Kaplan scaling lawsKaplan scaling laws beskriver, hvordan modellens tab falder som en potensfunktion af modelstørrelse, datamængde og beregningsressourcer.
- Kaplan skaleringsloveEmpiriske power-law relationer mellem neural netværks test-loss og antallet af parametre, datamængde og træningscompute.
- kategorisk krydsentropiKategorisk krydsentropi er et tabsfunktionsmål, der kvantificerer forskellen mellem de forudsagte sandsynligheder og de sande klasseetiketter i flerklasseklassifikation.
- kausal sprogmodelleringKausal sprogmodellering er en træningsteknik for sprogmodeller, hvor målet er at forudsige næste token givet alle foregående tokens i en strengt venstre-mod-højre retning.
- KerasEt højt niveau API til at bygge og træne neurale netværk, skrevet i Python og integreret i TensorFlow.
- kernel-tæthedsestimatKernel-tæthedsestimat er en ikke-parametrisk metode til at estimere sandsynlighedstætheden af en tilfældig variabel baseret på en stikprøve.
- KL-divergensMål for hvor meget en sandsynlighedsfordeling afviger fra en anden referencefordeling.
- Knowledge distillationEn teknik hvor en kompakt 'elevmodel' trænes til at efterligne adfærden fra en større 'lærermodel' ved at bruge dens output-sandsynligheder.
- Knowledge graphEn knowledge graph er en struktureret repræsentation af enheder og deres relationer, ofte i form af en graf, hvor knuder er enheder og kanter er relationer.
- Knowledge Graph CompletionTeknik til at forudsige manglende kanter (relationer) i en vidensgraf baseret på eksisterende entiteter og relationer.
- knowledge graph embeddingTeknik der repræsenterer entiteter og relationer i en videnstruktur (knowledge graph) som vektorer i et kontinuerligt rum.
- knowledge representationVidenrepræsentation er den måde, hvorpå viden struktureres og lagres, så et AI-system kan ræsonnere og træffe beslutninger.
- kodegenereringsmodelEn maskinlæringsmodel, der automatisk genererer kildekode baseret på en given beskrivelse eller kontekst.
- konfusionsmatrixEn tabel, der opsummerer ydeevnen af en klassifikationsmodel ved at vise antallet af korrekte og forkerte forudsigelser for hver klasse.
- kontekstuelt embeddingEn tæt vektorrepræsentation af et ord eller token, hvor repræsentationen afhænger af den kontekst, ordet optræder i.
- kontekstvektorEn vektor, der repræsenterer en opsummeret kontekst af en inputsekvens, ofte genereret af en encoders sidste skjulte tilstand eller som output fra en attention-mekanisme.
- kontekstvektor-rumEt flerdimensionalt vektorrum, hvor hver dimension repræsenterer et semantisk træk, og ord eller sætninger repræsenteres som vektorer, så semantisk lighed afspejles i geometrisk nærhed.
- konvolutionel autoencoderEn konvolutionel autoencoder er en type neuralt netværk, der består af et encoder-netværk med konvolutionelle lag og et decoder-netværk med transponerede konvolutionelle lag, trænet til at rekonstruere inputdata.
- krydsentropiKrydsentropi er et mål for forskellen mellem to sandsynlighedsfordelinger, ofte brugt som tabsfunktion i klassifikationsmodeller.
- Kullback-Leibler divergensEt mål for forskellen mellem to sandsynlighedsfordelinger, defineret som den forventede logaritmiske forskel mellem dem.
- kumulativ fordelingsfunktionEn funktion der angiver sandsynligheden for, at en stokastisk variabel er mindre end eller lig med en given værdi.
- KV cacheEn KV cache er en hukommelsesstruktur, der gemmer Key- og Value-vektorerne fra tidligere attention-beregninger i en transformer-model for at undgå genberegning under autoregressiv generering.
- kvantiseringTeknik til at reducere præcisionen af en models vægte og aktiveringer for at formindske modelstørrelse og øge inferenshastighed.
- kvantiseringsbevidst træningEn træningsmetode, hvor kvantiseringens effekter simuleres under træning for at opnå en model, der bevarer præcision efter kvantisering.
- L1-regulariseringL1-regularisering er en regulariseringsteknik, der tilføjer en straf proportional med summen af de absolutte værdier af modelparametrene for at fremme sparsomhed.
- L1-regularizationTeknik der tilføjer en straf proportional med summen af de absolutte værdier af modelvægte for at fremme sparsommelighed.
- L2-regulariseringL2-regularisering er en regulariseringsteknik, der tilføjer en straf proportional med kvadratet af modelparametrenes værdi for at mindske overfitting.
- L2-regularizationEn reguleringsteknik, der tilføjer en straf til tabet baseret på kvadratet af vægtenes L2-norm for at forhindre overfitting.
- Large Language ModelEn stor sprogmodel er en neural netværksbaseret model, typisk baseret på transformerarkitekturen, trænet på enorme mængder tekstdata til at generere, forstå og manipulere naturligt sprog.
- LassoLasso er en regulariseringsmetode til lineær regression, der anvender L1-straf for at fremme sparsommelighed og automatisk variabelselektion.
- Lasso-regressionLasso-regression er en lineær regressionsmetode, der anvender L1-regularisering til at udvælge variable og forhindre overfitting ved at straffe absolutte koefficientstørrelser.
- latent diffusionLatent diffusion er en generativ teknik, der udfører diffusionsprocessen i et latenterum i stedet for pixelrummet, hvilket reducerer beregningsomkostningerne.
- latent diffusion modelEn latent diffusionsmodel (LDM) er en type generativ model, der udfører diffusionsprocessen i et komprimeret latent rum (indkodet af en VAE) i stedet for i det originale pixelrum, hvilket reducerer beregningsomkostningerne markant.
- latent dynamics modelEn latent dynamics model er en model, der lærer overgangsfunktionen for en latent tilstandsrepræsentation i et system, ofte brugt til planlægning og kontrol i forstærkningslæring.
- latent repræsentationEn intern, komprimeret og ofte uobserveret vektor af numeriske værdier, som en model lærer at danne for at repræsentere inputdata på en meningsfuld måde.
- Latent spaceDet abstrakte rum af komprimerede repræsentationer som en generativ model lærer fra data.
- latent space arithmeticLatent space arithmetic betegner teknikken at udføre vektoraritmetik (addition, subtraktion) på repræsentationer i et latent rum for at manipulere eller kombinere begreber.
- latent space interpolationTeknik hvor man gradvist skifter mellem to punkter i et latent rum for at skabe nye, meningsfulde output.
- latent space traversalTeknik inden for generative modeller, hvor man bevæger sig gennem latent rum for at generere nye prøver, typisk via interpolation mellem latente vektorer.
- latent space walkEn teknik, hvor man gradvist ændrer latente vektorer for at generere en jævn overgang mellem punkter i et generativt models latentrum.
- latent world modelEn latent world model er en indlejret repræsentation af miljøets dynamik, der læres i et latent rum og bruges til planlægning og kontrol i modelbaseret forstærkningslæring.
- LDMLDM (Latent Diffusion Model) er en type diffusionsmodel, der udfører diffusionsprocessen i et latent repræsentationsrum i stedet for i pixelrummet.
- LeakyReLUAktiveringsfunktion der tillader en lille negativ gradient for negative input.
- LeakyReLULeakyReLU er en aktiveringsfunktion der tillader en lille, positiv gradient for negative input, hvilket adresserer problemet med døende neuroner i ReLU.
- LeakyReLU-lagEt aktiveringslag i neurale netværk, der anvender LeakyReLU-funktionen, som tillader en lille, ikke-nul gradient for negative inputværdier.
- Learning rateEn hyperparameter der styrer størrelsen af trinene mod en minimumsværdi af tabsfunktionen under træning af en model.
- learning rate scheduleEn strategi til dynamisk at justere indlæringshastigheden under træning af en neural model for at forbedre konvergens.
- learning rate warmupEn træningsteknik, hvor learning rate gradvist øges fra en lille værdi til den planlagte startværdi over et antal steps eller epochs.
- leave-one-out cross-validationEn krydsvalideringsteknik hvor modellen trænes på alle dataundtagen én observation, som bruges til test, og dette gentages for hver observation.
- left-side truncationTeknik til at forkorte en sekvens ved at fjerne tidlige dele og bevare de seneste, typisk anvendt i sprogmodeller til at holde sig inden for kontekstvinduet.
- LightningDataModuleEn klasse i PyTorch Lightning, der organiserer dataindlæsning, præprocessing og opdeling i trænings-, validerings- og testdatasæt på en genanvendelig måde.
- LightningModuleLightningModule er en basisklasse i PyTorch Lightning, der definerer en grænseflade til organisering af deep learning-modeller, herunder forward-pass, træningstrin og konfiguration.
- LightningTrainerLightningTrainer er en central klasse i PyTorch Lightning, der automatiserer trænings-, validerings- og test-loops samt håndterer hardware-acceleration og distribuering.
- linear warmupEn træningsteknik hvor learning rate lineært øges fra en startværdi til en mållæringrate over et bestemt antal trin.
- lineær tids modelEn model hvis tidsmæssige kompleksitet er lineær i længden af inputsekvensen, typisk opnået ved at erstatte fuld attention med tilnærmelser eller lineære transformationer.
- LLM agentEn LLM-agent er et system, der kombinerer en stor sprogmodel med evnen til at foretage handlinger, bruge værktøjer og planlægge for at nå et mål.
- LLM-as-a-JudgeTeknik hvor en sprogmodel (fx GPT-4) bruges til at evaluere eller score output fra en anden sprogmodel, typisk ved at give en karakter eller vurdere kvalitet ud fra en rubrik.
- LLM-pipelineEn LLM-pipeline er en struktureret sekvens af behandlingstrin, der forbereder input, kalder en sprogmodel og efterbehandler outputtet til en specifik opgave.
- load balancingFordeling af arbejdsbyrde (beregning, data) på tværs af flere ressourcer (GPU'er, servere) for at optimere ydeevne og undgå overbelastning.
- Log Loss KurveEn grafisk fremstilling af log loss (cross-entropy) som funktion af træningsiterationer eller epoker, brugt til at vurdere modelkonvergens og overfitting.
- log softmaxEn funktion der kombinerer softmax og logaritme, ofte brugt i neurale netværksklassifikation for numerisk stabilitet.
- logistisk regressionEn statistisk model der forudsiger sandsynligheden for en binær udfaldsvariabel ved at anvende en logistisk funktion på en lineær kombination af inputvariabler.
- logitEn logit er den rå, uomsatte outputværdi fra en model før en aktiveringsfunktion (fx softmax) omdanner den til en sandsynlighed.
- logit-scoreDen rå, unormaliserede værdi som en model producerer før anvendelse af en aktiveringsfunktion som softmax, ofte brugt til at repræsentere sandsynlighedslog-odds.
- logitsLogits er de rå, ubehandlede værdier (scorer), som en neural netværksmodel producerer før en aktiveringsfunktion som softmax, typisk i klassifikationsopgaver.
- LoRALoRA (Low-Rank Adaptation) er en teknik til parameter-effektiv finjustering, hvor der tilføjes trænelige lavrankede matricer til de eksisterende vægte i en fortrænet model.
- LoRA-adapterEn LoRA-adapter er en metode til parameter-effektiv finjustering af store sprogmodeller, hvor en lille mængde trænbare parametre tilføjes i form af lav-rangs matricer, mens de oprindelige vægte fryses.
- LoRA-justeringEn parameter-effektiv finjusteringsmetode, der tilpasser store sprogmodeller ved at indsætte lav-rank opdateringer i vægtmatricer i stedet for at opdatere alle parametre.
- LoRA-opsætningOpsætning og konfiguration af LoRA (Low-Rank Adaptation) til finjustering af store sprogmodeller.
- LoRA-opsætningLoRA-opsætning refererer til konfigurationen og anvendelsen af Low-Rank Adaptation (LoRA) til at finjustere store sprogmodeller ved at indsætte trænbare, lavrangs-matricer.
- LoRA-opsætningsparameterEn hyperparameter, der specificeres ved opsætning af LoRA-fintuning, såsom rang (rank), skaleringsfaktor (alpha) og dropout.
- LoRA-rankLoRA-rank er en hyperparameter, der bestemmer dimensionen af de lav-rankede matricer, der bruges til at tilpasse en fortrænet model i LoRA-fintuning.
- LoRA-vægteLoRA-vægte er en lille mængde trænlige, lavrangsmatricer, der lægges til de frosne basisvægte i en stor sprogmodel for at opnå effektiv fintuning.
- Loss functionEn funktion der kvantificerer forskellen mellem en models forudsigelser og de sande værdier under træning.
- loss function gradientGradienten af tabsfunktionen angiver retningen og størrelsen af den stejleste stigning af tabet i parameterrummet, og bruges til at opdatere modelparametre under træning via gradientbaseret optimering.
- loss landscapeDet højdimensionelle landskab af tabsfunktionens værdier over modellens parameterrum.
- loss-overfladeDen geometriske overflade, der beskriver værdien af tabsfunktionen over modellens parameterrum.
- Low-Rank AdaptationLow-Rank Adaptation (LoRA) er en parameter-effektiv finjusteringsteknik, hvor de oprindelige vægte i en forudtrænet model fryses, og der i stedet indsættes trænede, lavrangstillægsmatricer i modellens lag.
- LSTMLSTM er en type recurrent neural network (RNN)-arkitektur, der kan lære langvarige afhængigheder ved hjælp af en hukommelsescelle og porte, der styrer informationsflowet.
- LSTM-celleEn LSTM-celle er en byggesten i LSTM-netværk, der kan lære at gemme og glemme information over tid.
- LSTM-lagLSTM-lag er et type recurrent neural network lag der anvender gating-mekanismer til at styre informationsflowet og håndtere langtidsafhængigheder.
- LSTM-netværkEn type recurrent neuralt netværk, der er designet til at lære langtidsafhængigheder i sekventielle data ved hjælp af hukommelsesceller og gating-mekanismer.
- macro F1Macro F1 er det u vægtede gennemsnit af F1-score for hver klasse i en klassifikationsopgave, hvor alle klasser behandles lige uafhængigt af deres hyppighed.
- makro-F1Makro-F1 er gennemsnittet af F1-scorer beregnet separat for hver klasse, hvilket giver lige vægt til alle klasser uanset deres hyppighed.
- makro-F1-scoreMakro-F1-score er gennemsnittet af F1-scores beregnet separat for hver klasse, hvilket giver lige vægt til alle klasser uanset deres størrelse.
- Mamba-blokMamba-blok er den grundlæggende byggesten i Mamba-modellen, en state space model (SSM) der bruger en selektiv scanning-mekanisme til at opnå lineær tid og hukommelse i forhold til sekvenslængden.
- manifoldEn manifold er en topologisk mængde, der lokalt ligner euklidisk rum, og som i maskinlæring bruges til at beskrive den underliggende lavdimensionelle struktur i højdimensionelle data.
- manifold learningManifold learning betegner en klasse af ikke-lineære dimensionalitetsreduktionsmetoder, der antager at højdimensionelle data ligger på eller tæt på en lavdimensionel manifold.
- manifold-hypoteseAntagelsen om at højdimensionelle data i virkeligheden ligger på eller nær en laveredimensionel mangfoldighed (manifold) indlejret i det højdimensionelle rum.
- Markov Decision ProcessEn matematisk ramme til modellering af beslutningstagning i stokastiske miljøer, defineret ved tilstande, handlinger, overgangssandsynligheder, belønninger og en diskonteringsfaktor.
- masked language modelingMasked language modeling er en selvovervåget træningsmetode, hvor en model forudsiger tilfældigt maskerede tokens i en tekst baseret på konteksten.
- masked self-attentionEn mekanisme i transformer-modeller hvor hvert element i en sekvens kun kan se tidligere elementer (og sig selv) via attention, typisk ved at anvende en maske over fremtidige positioner.
- maskeret decoderlagEt lag i en Transformer-decoder der anvender maskering for at forhindre modellen i at se fremtidige tokens under autoregressiv generering.
- maskeret sprogmodelleringEn træningsteknik, hvor en del af tokens i en inputsekvens skjules, og modellen trænes til at forudsige de maskerede tokens baseret på konteksten.
- MCPMCP (Model Context Protocol) er en åben protokol, der definerer, hvordan AI-modeller kommunikerer med eksterne systemer for at hente kontekst og udføre handlinger.
- MCP-klientEn MCP-klient er en softwarekomponent, der implementerer klient-siden af Model Context Protocol (MCP) for at kommunikere med MCP-servere.
- MCP-protokolEn protokol til at strukturere og overføre kontekst mellem forskellige AI-modeller eller -komponenter i et system.
- MCP-serverEn MCP-server er en server, der implementerer Model Context Protocol (MCP) for at eksponere værktøjer, ressourcer og prompter til sprogmodeller som AI-assistenter.
- mean Average Precision (mAP)Gennemsnittet af gennemsnitlig præcision (AP) over alle klasser i en objektgenkendelses- eller informationsgenfindingsopgave.
- mean squared errorMean squared error (MSE) er gennemsnittet af de kvadrerede forskelle mellem forudsagte og faktiske værdier i en regression.
- MemoryI kunstig intelligens betegner memory evnen hos en model eller et system til at lagre og genfinde information over tid.
- memory cellEn komponent i et neuralt netværk, typisk i LSTM, der kan lagre og opdatere information over lange sekvenser.
- memory-augmented neural networkEn neural netværksarkitektur, der inkorporerer en ekstern hukommelsesstruktur, som modellen dynamisk kan læse og skrive til under behandling.
- meta learningMaskinlæringsteknik, hvor en model trænes til at lære at lære, så den hurtigt kan tilpasse sig nye opgaver med få eksempler.
- meta-learnerEn meta-learner er en model eller algoritme, der lærer at tilpasse sig nye opgaver med få eksempler ved at træne på en distribution af opgaver.
- meta-learning modelEn meta-learning model er en model, der er trænet til at lære nye opgaver hurtigt ved at udnytte erfaring fra tidligere opgaver.
- meta-læringMeta-læring er en maskinlæringsteknik, hvor en model lærer at forbedre sin egen indlæringsproces på tværs af flere opgaver.
- METEORMETEOR er en evalueringsmetrik for maskinoversættelse og tekstgenerering, der måler kvaliteten ved at sammenligne hypoteser med referencer under hensyntagen til synonymi, ordstilling og stemming.
- micro-averaged F1Micro-averaged F1 er en global gennemsnitsberegning af F1-score, der beregnes ved at aggregere sande positive, falske positive og falske negative på tværs af alle klasser og derefter beregne F1 ud fra de samlede tal.
- middel gennemsnitlig præcisionMiddel gennemsnitlig præcision (MAP) er en metrik, der måler den gennemsnitlige præcision over flere forespørgsler eller brugere, typisk brugt i informationsgenfinding og anbefalingssystemer.
- mikro-F1Mikro-F1 er en evalueringsmetrik, der beregner det harmoniske gennemsnit af præcision og recall på tværs af alle klasser ved at aggregere tællere (TP, FP, FN) globalt.
- mikro-F1-scoreMikro-F1-score er en variant af F1-score, der beregnes ved at aggregere sandt positive, falsk positive og falsk negative på tværs af alle klasser, før F1 beregnes.
- mini-batch gradient descentEn optimeringsalgoritme, der opdaterer modelparametre ved at beregne gradienten over en lille delmængde (mini-batch) af træningsdataene ad gangen.
- mini-batch SGDMini-batch SGD er en optimeringsalgoritme, der opdaterer modelvægte baseret på en lille delmængde (mini-batch) af træningsdata i stedet for hele datasættet eller enkelte eksempler.
- mini-batch sizeMini-batch size er antallet af træningseksempler, der behandles i én iteration under gradientnedstigning.
- Mixture of ExpertsEn arkitektur hvor flere specialiserede netværk (eksperter) kombineres med en gate-mekanisme, så kun et subset aktiveres per input.
- ML-pipelineEn ML-pipeline er en struktureret sekvens af databehandlings- og modeltrin, der automatiserer et maskinlærings workflow fra rådata til produktion.
- MLOpsMLOps er et sæt af praksisser, der kombinerer maskinlæring, DevOps og data engineering for at sikre pålidelig og effektiv implementering og vedligeholdelse af ML-modeller i produktion.
- MLOps-pipelineEn automatiseret sekvens af trin, der håndterer hele livscyklussen for maskinlæringsmodeller: fra dataforberedelse og træning til implementering, overvågning og genoptræning.
- MLOps-platformEn MLOps-platform er en integreret suite af værktøjer og tjenester, der understøtter hele livscyklussen for maskinlæringsmodeller fra udvikling til drift og monitorering.
- mode collapseEn fejltilstand i generative modeller, især GAN'er, hvor generatoren producerer et begrænset sæt af uddata, der kun dækker nogle få tilstande (modes) i datafordelingen i stedet for hele variationen.
- model calibrationModelkalibrering er processen med at justere en models forudsagte sandsynligheder, så de afspejler den faktiske sandsynlighed for udfald.
- model card templateEn standardiseret skabelon til at dokumentere en maskinlæringsmodel, herunder formål, ydeevne, begrænsninger og etiske overvejelser.
- model compressionSamling af teknikker, der reducerer størrelsen og beregningsbehovet for en AI-model, samtidig med at præstationen bevares så godt som muligt.
- Model driftFænomen hvor en maskinlæringsmodel gradvist mister præcision over tid, ofte på grund af ændringer i de underliggende data eller relationer.
- model forklaringModel forklaring refererer til metoder og teknikker, der anvendes til at forstå og fortolke, hvorfor en AI-model træffer bestemte beslutninger eller forudsigelser.
- model fortolkningModel fortolkning er processen med at analysere og forklare, hvordan en maskinlæringsmodel træffer beslutninger, herunder hvilke faktorer der har størst betydning for modellens output.
- model parallelismModelparallelisme er en teknik til at fordele en stor neurale netværksmodel på tværs af flere enheder ved at opdele selve modellen i dele.
- model pruningEn teknik, hvor overflødige parametre i en neural netværk fjernes for at reducere modelstørrelse og beregningsomkostninger.
- Model registryEt system til versionering, lagring og styring af maskinlæringsmodeller gennem deres livscyklus.
- model registry stageEn tilstand i et model registry, der angiver modellens placering i livscyklussen, f.eks. 'Staging' eller 'Production'.
- model reliabilityEn models evne til at levere stabile, korrekte og forudsigelige resultater under varierende betingelser og over tid.
- model reliability metricsModel reliability metrics er kvantitative mål for en models evne til at levere pålidelige, robuste og kalibrerede forudsigelser under varierende forhold.
- Model servingModel serving er processen med at hoste en trænet maskinlæringsmodel og eksponere den via en API, så andre systemer eller brugere kan sende data til modellen og få forudsigelser tilbage.
- model serving frameworkEt model serving framework er en softwareplatform, der muliggør deployment, hosting og inferens af maskinlæringsmodeller i produktion via en API.
- model serving pipelineEn model serving pipeline er et automatiseret system, der håndterer forbehandling, inferens og efterbehandling af data, så en maskinlæringsmodel kan betjenes som en API i produktion.
- model snapshotEn model snapshot er en gemt kopi af en models vægte og tilstand på et bestemt tidspunkt under træning.
- model snapshot-lagringTeknikken at gemme en models vægte og tilstand på et bestemt tidspunkt under træning.
- model-based reinforcement learningEn tilgang inden for reinforcement learning, hvor agenten lærer en model af miljøets dynamik og bruger denne model til at planlægge eller simulere handlinger.
- model-interpretabilitetModel-interpretabilitet er egenskaben ved en AI-model, der gør det muligt for mennesker at forstå og forklare dens beslutninger og forudsigelser.
- model-interpretabilitetsmetrikEn model-interpretabilitetsmetrik er et kvantitativt mål, der vurderer, hvor let en menneskelig bruger kan forstå eller fortolke en maskinlæringsmodels beslutninger.
- model.eval()En metode i PyTorch der skifter modellen til evalueringstilstand, hvilket deaktiverer dropout og fikserer batch-normaliseringslag.
- modelkompleksitetModelkompleksitet betegner en models kapacitet til at indfange mønstre i data, ofte målt ved antal parametre eller modelarkitekturens dybde.
- modelkomprimeringModelkomprimering er en samling af teknikker til at reducere størrelsen og beregningskompleksiteten af en trænet maskinlæringsmodel uden væsentligt tab af præcision.
- modelkomprimeringTeknikker til at reducere størrelsen og beregningsomkostningen af en AI-model uden væsentligt tab af nøjagtighed.
- modelkomprimerings-teknikEn teknik til at reducere størrelsen og/eller beregningskompleksiteten af en AI-model med minimalt tab af ydeevne.
- MoEMoE er en neural netværksarkitektur, der opdeler opgaven i flere specialiserede eksperter og en gate-mekanisme, der dynamisk vælger en sparsom kombination af eksperter for hvert input.
- MoE layerEt MoE-lag er et neurale netværkslag der består af flere ekspertnetværk og en gate-mekanisme, som dynamisk vælger en sparsom aktivering af eksperter for hvert input.
- Monte Carlo-simuleringMonte Carlo-simulering er en beregningsmetode, der bruger tilfældig sampling til at løse problemer, der er deterministiske i naturen.
- multi-agent reinforcement learningEn gren af reinforcement learning, hvor flere agenter interagerer i et fælles miljø og lærer at optimere deres politikker, enten kooperativt, konkurrerende eller i blandede scenarier.
- Multi-agent systemEt system bestående af flere autonome software- eller robotagenter, der interagerer i et fælles miljø for at opnå individuelle eller fælles mål.
- multi-class classificationEn klassifikationsopgave, hvor en model tildeler en instans til én af flere (tre eller flere) gensidigt udelukkende klasser.
- Multi-head attentionMulti-head attention er en mekanisme i Transformer-modeller, hvor inputtet opdeles i flere parallelle attention-hoveder, der hver især lærer forskellige repræsentationer af relationer mellem elementer i en sekvens.
- multi-head cross-attentionEn mekanisme i transformer-modeller hvor hvert hoved udfører kryds-opmærksomhed mellem to forskellige sekvenser, ofte mellem encoder og decoder.
- multi-head opmærksomhedMulti-head opmærksomhed er en mekanisme i Transformer-arkitekturen, der udfører skalær dot-produkt opmærksomhed flere gange parallelt med forskellige lineære projektioner og sammenkæder resultaterne.
- multi-head self-attentionMulti-head self-attention er en mekanisme i transformer-arkitekturer, hvor opmærksomheden beregnes parallelt over flere repræsentationsunderrum (heads) for hvert element i en sekvens.
- multiagent-systemEt system bestående af flere autonome AI-agenter, der interagerer og samarbejder om at løse opgaver.
- multilayer feedforward networkEt neuralt netværk med mindst ét skjult lag mellem input og output, hvor signaler flyder i én retning (fremad) og ikke danner cykler.
- multilayer perceptronEt multilayer perceptron er et kunstigt neuralt netværk bestående af mindst tre lag af neuroner: et inputlag, et eller flere skjulte lag og et outputlag, hvor neuronerne i hvert lag er fuldt forbundet til neuronerne i det næste lag.
- MultimodalMultimodal refererer til AI-systemer, der kan behandle og integrere information fra flere forskellige datatyper såsom tekst, billeder, lyd og video.
- multimodal AIAI-systemer der kan behandle og kombinere flere datatyper som tekst, billeder, lyd og video.
- multimodal dataData der består af eller integrerer information fra flere forskellige modaliteter som tekst, billede, lyd og video.
- multimodal embeddingEn vektorrepræsentation, der kortlægger data fra flere modaliteter (fx tekst og billeder) ind i et fælles latent rum, så lighed på tværs af modaliteter kan måles.
- multimodal fusionMultimodal fusion er processen med at kombinere information fra flere forskellige datatyper (modaliteter) som tekst, billede og lyd for at skabe en samlet repræsentation.
- multimodal fusionslagEt neuralt netværkslag der kombinerer repræsentationer fra flere datatyper (modaliteter) som tekst, billede og lyd til en fælles repræsentation.
- multimodal learningMultimodal læring er en maskinlæringsteknik, hvor en model trænes på data fra flere forskellige modaliteter (fx tekst, billeder, lyd) samtidigt for at lære tværmodale repræsentationer.
- multimodal modelEn model der kan behandle og integrere flere datatyper (fx tekst, billeder, lyd).
- MuZero-søgningEn Monte Carlo-træsøgning, der anvender en lært model af dynamik og belønning i et latent repræsentationsrum.
- målalignmentMålalignment er et begreb inden for AI-sikkerhed, der betegner bestræbelserne på at sikre, at kunstig intelligens’ mål og adfærd er i overensstemmelse med menneskelige værdier og intentioner.
- natural language generationNatural Language Generation (NLG) er den gren af naturlig sprogbehandling, der beskæftiger sig med at producere menneskelignende tekst eller tale ud fra data eller struktureret input.
- natural language understandingNatural language understanding (NLU) er den del af naturlig sprogbehandling (NLP) der fokuserer på maskinel forståelse af betydningen i menneskelig sprog.
- Nesterov momentumEn forbedring af momentum-optimering, hvor gradienten beregnes efter en foreløbig opdatering af parametrene.
- neural language modelEn neural language model er en type sprogmodel baseret på neurale netværk, der forudsiger sandsynligheden af sekvenser af ord.
- neural retrievalNeural retrieval er en metode inden for informationsgenfinding, hvor neurale netværk bruges til at finde relevante dokumenter eller data baseret på en forespørgsel.
- neural scaling lawEn empirisk lov, der beskriver, hvordan en neural netværks testfejl falder som en potensfunktion af modelstørrelse, datasætstørrelse eller beregningsressourcer.
- neural style transferNeural style transfer er en teknik, der anvender dybe neurale netværk til at overføre stilen fra ét billede til indholdet af et andet.
- neural text-to-speechNeural text-to-speech er en teknik, der bruger dybe neurale netværk til at omdanne skrevet tekst til naturligt lydende tale.
- neurale sprogmodelEn sprogmodel baseret på neurale netværk, der forudsiger sandsynligheden af sekvenser af ord.
- NF4-kvantiseringNF4-kvantisering er en 4-bit kvantiseringsmetode, der bruger et normaliseret float-format til at repræsentere vægte i neurale netværk, udviklet til QLoRA for at reducere hukommelsesforbrug uden væsentligt tab af præcision.
- NLP-pipelineEn sekvens af forarbejdningstrin, der behandler rå tekst til en struktureret repræsentation, typisk i natural language processing.
- normalfordelingEn normalfordeling er en kontinuert sandsynlighedsfordeling, der beskrives ved en klokkeformet kurve og er defineret ved middelværdi μ og standardafvigelse σ.
- normalfordelingsantagelseAntagelsen om at en given stokastisk variabel eller datasæt følger en normalfordeling.
- normaliseret confusion matrixEn normaliseret confusion matrix er en variant af confusion matrix, hvor tællingerne er skaleret til andele, typisk per række (sande klasse) eller per kolonne (forudsagt klasse).
- normalized mean squared errorEn metrik, der måler den gennemsnitlige kvadratiske afvigelse mellem observerede og forudsagte værdier, normaliseret med variansen af de observerede værdier.
- nucleus samplingEn stikprøveteknik til tekstgenerering, hvor man vælger fra den mindste mængde tokens, hvis kumulative sandsynlighed overstiger en tærskel p.
- nvccnvcc er compilerværktøjet til at oversætte CUDA C++-kode til eksekverbare filer, der kan køre på NVIDIA GPU'er.
- nvcc flagEn compiler-flag til nvcc, NVIDIA's CUDA compiler, der styrer kompileringsprocessen for CUDA-kode.
- nvcc-kompileringKompilering af CUDA-kode ved hjælp af NVIDIA CUDA Compiler (nvcc).
- Nvidia CUDACUDA er en parallel computerplatform og API, der gør det muligt for software at udnytte Nvidia GPU'er til generel databehandling.
- næste-sætnings-forudsigelseNæste-sætnings-forudsigelse er en træningsopgave, hvor en model lærer at afgøre, om en given sætning følger logisk efter en anden sætning.
- Object detectionComputer vision-teknik til at lokalisere og klassificere objekter i billeder eller video.
- objective functionEn funktion der måler, hvor godt en model opfylder et bestemt mål.
- objektdetektionsmodelEn model, der identificerer og lokaliserer objekter i et billede ved at forudsige bounding boxes og klasser.
- offline data augmentationOffline data augmentation er en teknik, hvor træningsdata udvides ved at anvende transformationer på forhånd, før modellen trænes.
- offline feature storeEt offline feature store er et centralt lager til lagring, styring og genfinding af features, der er optimeret til batch-processering, typisk brugt under modeltræning og evaluering.
- one shot learningOne shot learning er en maskinlæringsteknik, hvor en model trænes til at genkende nye klasser baseret på kun ét træningseksempel per klasse.
- one-shot klassifikationEn maskinlæringsteknik, hvor en model klassificerer nye datapunkter efter kun at have set ét eksempel per klasse.
- online augmenteringspipelineEn online augmenteringspipeline er en real-time dataforøgelsesproces, der anvender transformationer direkte på træningsdata under modeltræning i stedet for at forberede augmenterede data på forhånd.
- online data augmentationTeknik hvor dataforøgelse anvendes i realtid under træning, så hver epoch genererer nye varianter af træningsdata.
- online feature storeEt online feature store er et system til at servere maskinlæringsfunktioner (features) med lav latenstid til brug i produktion.
- ONNXONNX er en åben standard for at repræsentere maskinlæringsmodeller, så de kan overføres mellem forskellige frameworks.
- ONNX RuntimeONNX Runtime er en open-source, krydsplatforms-inferensmotor til maskinlæringsmodeller, der optimerer og udfører modeller i ONNX-formatet.
- ontologiOntologi er en formel, eksplicit specifikation af en delt konceptualisering inden for et domæne.
- opsummeringsmodelEn maskinlæringsmodel, der genererer en kortfattet, sammenhængende tekst, der bevarer hovedindholdet i en længere tekst.
- optimizerEn optimizer er en algoritme, der opdaterer modelparametre under træning for at minimere tabet.
- ord-embeddingEn teknik inden for naturlig sprogbehandling, hvor ord repræsenteres som tætte vektorer i et kontinuert vektorrum.
- ord-embeddingmodelEn model der transformerer sproglige elementer (ord, tokens) til tætte vektorer (embeddings) i et kontinuert vektorrum, så semantisk lighed afspejles i vektorafstande.
- ordembeddingEn ordembedding er en tæt, lavdimensionel vektorrepræsentation af et ord, hvor semantisk og syntaktisk lighed afspejles i vektorens afstand.
- ordindlejringEn ordindlejring er en teknisk metode, der kortlægger ord til tætte vektorer i et kontinuert vektorrum, så ord med lignende betydning har lignende repræsentationer.
- OverfittingOverfitting opstår når en model lærer støj og tilfældigheder i træningsdata, så den generaliserer dårligt til nye data.
- overgeneraliseringOvergeneralisering betegner en models tendens til at lære for brede eller forkerte mønstre, hvilket fører til dårlig præstation på nye data.
- overlap-tokensOverlap-tokens refererer til enten (1) overlappende vinduer af tokens i sekvensbehandling eller (2) antallet af fælles tokens mellem to sæt anvendt i evalueringsmetrikker.
- parallel computingParallel computing er en beregningsmetode, hvor mange beregninger eller processer udføres samtidigt ved at opdele et problem i mindre delopgaver, der løses simultant.
- parallel decodingParallel decoding er en inferensteknik, hvor flere tokens genereres samtidigt i stedet for sekventielt for at fremskynde sprogmodeller.
- Parallel Function CallingTeknik hvor en LLM kalder flere funktioner samtidigt i én enkelt tur, i stedet for sekventielt.
- parameter-effektiv fine-tuningParameter-effektiv fine-tuning betegner en samling af teknikker, hvor kun et lille antal ekstra parametre opdateres under finjustering, mens hovedparten af en fortrænet models parametre fryses.
- parameter-effektiv finjusteringParameter-effektiv finjustering (PEFT) refererer til en klasse af metoder, der finjusterer store fortrænede modeller ved kun at opdatere et lille antal parametre, mens resten forbliver frosne.
- Parameter-Efficient Fine-TuningParameter-Efficient Fine-Tuning (PEFT) er en samling teknikker, der opdaterer kun et lille antal modelparametre under finjustering, mens størstedelen af den forudtrænede model fryses.
- Parameter-justeringProces hvor en models parametre ændres for at forbedre ydeevnen, typisk ved hyperparameteroptimering eller finjustering.
- parameterantalAntallet af trænbare vægte i en AI-model, der bestemmer modellens kapacitet og kompleksitet.
- parametereffektiv finjusteringParametereffektiv finjustering er en teknik til at tilpasse store sprogmodeller til specifikke opgaver ved kun at opdatere et lille antal parametre, hvilket reducerer beregnings- og hukommelsesomkostninger markant.
- parametereffektivitetEvnen hos en model til at opnå høj ydeevne med et begrænset antal parametre.
- parameterfinjusteringParameterfinjustering er processen, hvor en allerede trænet model tilpasses til en ny, relateret opgave ved at fortsætte træningen med et mindre, opgavespecifikt datasæt, typisk med en lavere læringsrate.
- parameteropdateringProces hvor modellens vægte justeres for at minimere tabsfunktionen under træning.
- parameteropdateringsalgoritmeEn algoritme, der opdaterer en models parametre baseret på gradienten af tabsfunktionen for at minimere fejlen.
- parameteropdateringsregelReglen der specificerer, hvordan en models parametre justeres baseret på gradienten af tabfunktionen under træning.
- Parametric ReLUParametric ReLU (PReLU) er en aktiveringsfunktion, der tillader en lærebar hældning for negative input, hvilket giver modellen fleksibilitet til at tilpasse ikke-lineariteten.
- partially observable Markov decision processEn delvist observerbar Markov-beslutningsproces (POMDP) er en generel ramme for beslutningstagning, hvor agenten kun har delvis viden om miljøets tilstand.
- patch-embeddingEn teknik i vision transformers hvor et billede opdeles i flade udsnit (patches), og hvert udsnit omdannes til en vektor (embedding) via en lineær projektion.
- patch-sizePatch-størrelse er et hyperparameter, der angiver de rumlige dimensioner (højde og bredde) af de kvadratiske udsnit, et billede opdeles i, før behandling i en vision transformer eller konvolutionelt neuralt netværk.
- PCAPCA er en statistisk metode til dimensionalitetsreduktion ved at transformere data til et nyt koordinatsystem, hvor de største varianser ligger langs de første akser.
- PDFEn sandsynlighedstæthedsfunktion (PDF) beskriver sandsynligheden for, at en kontinuert stokastisk variabel antager en bestemt værdi.
- PEFTParameter-Efficient Fine-Tuning (PEFT) er en samling af teknikker, der muliggør effektiv transfer learning af store sprogmodeller ved at opdatere et minimalt antal parametre, ofte gennem indsættelse af trænbare adaptere eller lavrangetilpasninger.
- PEFT-libraryPEFT-library er et open-source-bibliotek fra Hugging Face, der implementerer parameter-effektive finjusteringsteknikker som LoRA, AdaLoRA og Prefix Tuning.
- PEFT-metodePEFT-metoder er en familie af fine-tuning-teknikker, der kun opdaterer et lille antal parametre for at tilpasse en stor model til en specifik opgave.
- PEFT-teknikParameter-Efficient Fine-Tuning (PEFT) er en samling af teknikker, der muliggør finjustering af store sprogmodeller ved at opdatere et lille antal parametre, hvilket reducerer beregningsomkostninger og hukommelseskrav.
- perceptron ruleEn læringsalgoritme for perceptroner, der justerer vægte kun ved fejlklassifikation.
- perplexityPerplexity er en metrik, der måler, hvor godt en sprogmodel forudsiger en sekvens af tokens.
- perplexity-metrikEt mål for hvor godt en sprogmodel forudsiger en sekvens af tokens, defineret som eksponentialet af den gennemsnitlige krydsentropi.
- Perplexity-scorePerplexity-score er en metrik, der måler, hvor godt en sprogmodel forudsiger en sekvens af tokens, defineret som eksponentialet af gennemsnitlig krydsentropi.
- perplexity-værdiPerplexity-værdi er en metrik, der måler, hvor godt en sprogmodel forudsiger en given tekstsekvens.
- persona-patternPersona-pattern er en prompt engineering-teknik, hvor en AI-model tildeles en bestemt rolle eller karakter for at styre dens svarstil og indhold.
- pipeline parallelismPipeline parallelism er en distribueret træningsteknik, hvor en model opdeles i sekventielle stadier, der hver behandles af en separat enhed, og data sendes gennem stadierne som i en pipeline.
- planning algorithmEn algoritme, der genererer en sekvens af handlinger for at opnå et specifikt mål ud fra en given tilstand og et sæt mulige handlinger.
- Policy gradientPolicy gradient er en kategori af reinforcement learning-algoritmer, der optimerer en policy direkte via gradient-ascent på den forventede belønning.
- policy gradient-algoritmeEn policy gradient-algoritme er en metode inden for reinforcement learning, der optimerer en politik direkte ved at estimere gradienten af den forventede belønning med hensyn til politikparametrene og udføre gradient ascent.
- policy gradient-teoremPoliy gradient-teoremet angiver en analytisk formel for gradienten af den forventede afkastsum med hensyn til politikparametre i forstærkningslæring.
- Pooling layerEt pooling-layer er et nedtagningslag i et convolutional neural network der reducerer rummelige dimensioner.
- position-embeddingEn teknik i transformer-modeller, der indlejrer information om token-positioner i sekvensen for at give modellen en forståelse af rækkefølge.
- positional encodingEn teknik, der tilføjer positionsinformation til inputrepræsentationer i transformer-modeller, så modellen kan skelne rækkefølgen af elementer i en sekvens.
- positionsinterpoleringTeknik til at udvide kontekstlængden i transformermodeller ved at skalere positionsindekser, så de passer ind i det oprindelige positionsinterval.
- Post-Layer NormalizationPost-Layer Normalization er en teknik i transformer-arkitekturer, hvor layer normalization placeres efter hvert sublag (attention og feed-forward) i stedet for før.
- Post-training quantizationPost-training quantization er en teknik, hvor vægte og aktiveringer i en allerede trænet model konverteres til en lavere præcision (fx 8-bit heltal) for at reducere modelstørrelse og øge inferenshastighed uden yderligere træning.
- post-træningskvantiseringPost-træningskvantisering er en teknik hvor en allerede trænet maskinlæringsmodel konverteres til at bruge lavere præcision (fx 8-bit heltal) i stedet for 32-bit flydende tal, hvilket reducerer modellens størrelse og accelererer inferens uden at kræve genoptræning.
- power lawEn funktionel sammenhæng hvor én størrelse varierer som en potens af en anden, typisk udtrykt som y = k·x^α; i AI bruges power laws til at beskrive skaleringsforhold som tabsfunktionens afhængighed af data eller parametre.
- power law distributionEn sandsynlighedsfordeling, hvor en lille ændring i én variabel medfører en proportional ændring i en anden variabel, karakteriseret ved en potensfunktion.
- power law scalingEmpirisk observation af, at modelpræstation (fx tab) forbedres som en potensfunktion af stigende mængde data, modelstørrelse eller beregningsressourcer.
- PPOPPO er en policy-gradient algoritme inden for reinforcement learning, der optimerer en policy ved at tage forsigtige opdateringer, der holder den nye policy tæt på den gamle via en clipped surrogate-objektivfunktion.
- PPO-clipPPO-clip er en reinforcement learning-algoritme, der opdaterer en politik ved at maksimere en clipped surrogate objective, hvilket forhindrer for store ændringer i politikken.
- PPO-penaltyPPO-penalty er en variant af PPO-algoritmen, der bruger en KL-divergens-straf i stedet for clipping for at begrænse policy-opdateringer.
- Pre-Layer NormalizationPræ-lag normalization er en teknik, hvor layer normalization placeres før hvert dellag (attention eller feed-forward) i en transformerblok, i modsætning til post-layer normalization.
- pre-trainingProcessen, hvor en model trænes på en stor generel datasæt for at lære grundlæggende repræsentationer, før den finjusteres til en specifik opgave.
- precision-recall kurveEn graf der viser afvejningen mellem præcision og recall for en klassifikationsmodel ved forskellige tærskelværdier.
- precision-recall kurveEn kurve der viser sammenhængen mellem præcision og recall ved forskellige klassifikationstærskler.
- prediction intervalEt interval inden for hvilket en fremtidig observation forventes at falde med en given sandsynlighed, givet en model.
- preference optimizationEn træningsteknik, der justerer en models adfærd baseret på præferencedata, typisk i form af parvis sammenligning af output.
- prefix cacheEn teknik, der gemmer mellemregninger (key-value-cache) for et indledende prompt-segment, så gentagen inferens med samme prefix kan genbruge dem og undgå genberegning.
- prefix tuningEn parameter-effektiv finjusteringsteknik, hvor et lille antal trænbare præfikstokens indsættes foran inputtet i hvert Transformerlag, mens de oprindelige modelvægte fryses.
- PReLUEn aktiveringsfunktion der udvider ReLU med en læreparameter α for negative indputs, så funktionen bliver f(x)=max(0,x)+α·min(0,x).
- PReLU-lagEt neuralt netværkslag, der anvender den parametrisk rettede lineære enhed (PReLU) som aktiveringsfunktion, hvilket giver mulighed for at lære hældningen for negative inputværdier under træning.
- pretext taskEn hjælpeopgave, som en model trænes på under self-supervised learning for at lære repræsentationer, der senere kan overføres til en downstream-opgave.
- pretext-task designEn teknik inden for selvovervåget læring, hvor en hjælpeopgave (pretext task) designes til at tvinge modellen til at lære nyttige repræsentationer uden brug af manuelle labels.
- pretext-task lossPretext-task loss er tabsfunktionen, der optimeres under et forløbentræningsformål (pretext task) i selvovervåget læring for at lære repræsentationer fra umærkede data.
- PretrainingPrætræning (pretraining) er en træningsfase hvor en maskinlæringsmodel først trænes på en stor, generel datasæt, typisk uden opsyn eller med selvovervågning, for at lære generelle repræsentationer, efterfulgt af finjustering på en specifik opgave.
- prompt cachingOptimeringsteknik hvor dele af et prompt (typisk starten) gemmes i cache, så gentagen behandling undgås, hvilket reducerer latency og omkostninger.
- prompt craftingPrompt crafting er den systematiske udformning og optimering af instruktioner (prompts) til sprogmodeller for at opnå specifikke, relevante svar.
- prompt engineerEn prompt engineer er en specialist, der designer, tester og optimerer prompts til sprogmodeller for at opnå præcise og nyttige output.
- Prompt engineeringPrompt engineering er den systematiske praksis at designe, formatere og optimere inputprompter for at styre adfærden af store sprogmodeller (LLM'er) mod et ønsket output.
- prompt hijackingEt angreb, hvor en ondsindet prompt overskriver eller manipulerer den oprindelige instruktion i en sprogmodel for at ændre dens opførsel.
- Prompt injectionEt sikkerhedsangreb, hvor en angriber indsætter ondsindet instruktion i en prompt for at tilsidesætte eller omgå systemets tilsigtede instruktioner.
- prompt optimizationProces med at justere og forbedre prompts for at maksimere præcision og relevans af en sprogmodels output.
- prompt patternEn prompt pattern er en genanvendelig skabelon eller struktur til at formulere en prompt for at opnå forudsigelige og ensartede svar fra en sprogmodel.
- Prompt TuningPrompt tuning er en parametereffektiv finjusteringsmetode, hvor et lille sæt af lærbare 'bløde prompts' (kontinuerte vektorer) sættes foran input-embeddings, mens den fortrænede models vægte forbliver frosne.
- prompt-optimeringsalgoritmeAlgoritme der automatisk forbedrer prompts for at optimere modeloutput.
- proximal policy optimizationEn policy-gradient-algoritme der stabiliserer træning ved at begrænse opdateringernes størrelse til et lille område omkring den nuværende policy.
- pruningPruning er en teknik til at reducere størrelsen af et neuralt netværk ved at fjerne overflødige vægte eller neuroner.
- pruning thresholdEn tærskelværdi der afgør, hvilke vægte eller neuroner der fjernes under beskæring af en neural netværksmodel.
- præ-træningPræ-træning er den indledende fase i træningen af en maskinlæringsmodel, hvor modellen lærer fra et stort, generelt datasæt før den finjusteres til specifikke opgaver.
- prætræningsmålEn objektivfunktion, der anvendes under ubegrænset eller selvovervåget før-træning af en sprogmodel, typisk med henblik på at lære generelle sprogrepræsentationer.
- PyTorchPyTorch er et open source deep learning-bibliotek til Python, udviklet af Meta AI, der anvender dynamiske beregningsgrafer til fleksibel og intuitiv modelkonstruktion.
- PyTorch LightningEt open-source Python-bibliotek, der giver en struktureret ramme til at organisere og automatisere træning af deep learning-modeller bygget med PyTorch.
- Q-learningEn model-fri forstærkningslæringsalgoritme, der lærer en optimal politik ved at estimere den forventede fremtidige belønning for hver handling i en given tilstand.
- Q-tableEn tabel, der i forstærkningslæring gemmer den forventede samlede belønning (Q-værdi) for hver kombination af tilstand og handling.
- QATEn træningsteknik, hvor modellen lærer at kompensere for kvantiseringsfejl, så den efterfølgende kvantisering medfører minimal præcisionstab.
- QLoRAQLoRA er en metode til effektiv finjustering af store sprogmodeller ved at kvantisere basismodellen og anvende lavrank-adaptere (LoRA), hvilket reducerer hukommelsesforbruget markant.
- QLoRA-adapterEn adapter til finjustering af store sprogmodeller, der kombinerer kvantisering af modelvægte med low-rank opdateringer for at reducere hukommelsesforbrug.
- QLoRA-adapterEn QLoRA-adapter er en lavrangs-adapter, der trænes med kvantisering af basis-modellens vægte for at reducere hukommelsesforbruget under finjustering.
- QLoRA-finetuningTeknik, der kombinerer modelkvantisering med LoRA for at finjustere store sprogmodeller med markant reduceret hukommelsesforbrug.
- QLoRA-finjusteringQLoRA-finjustering er en metode til at finjustere store sprogmodeller ved at kombinere kvantisering (4-bit) med lav-rank adaptation (LoRA) for at reducere hukommelsesforbrug og beregningsomkostninger.
- QLoRA-finteknikQLoRA-finteknik er en metode til effektiv finjustering af store sprogmodeller ved hjælp af kvantiseret LoRA, der reducerer hukommelsesforbruget markant.
- QLoRA-fintuningEffektiv fintuningsmetode der kombinerer 4-bit kvantisering med LoRA for at reducere hukommelsesforbruget ved fintuning af store sprogmodeller.
- QuantizationTeknik til at reducere præcisionen af tal i en model for at mindske hukommelses- og beregningsbehov.
- Quantization errorForskellen mellem den oprindelige værdi og den kvantiserede værdi, når et tal afrundes eller begrænses til et lavere præcisionsformat.
- quantization-aware fine-tuningEn finjusteringsproces, der simulerer kvantiseringseffekter under træningen, så den endelige kvantiserede model bevarer nøjagtigheden.
- Quantization-aware trainingQuantization-aware training (QAT) er en træningsteknik, hvor kvantiseringseffekter simuleres under træningen for at opnå høj nøjagtighed efter efterfølgende kvantisering.
- query key valueDe tre vektorer — forespørgsel (query), nøgle (key) og værdi (value) — der bruges i attention-mekanismen til at beregne opmærksomhedsvægte.
- Query-by-committeeQuery-by-committee er en aktiv læringsteknik, hvor et ensemble af modeller (et udvalg) stemmer om hvilke uetiketérbare datapunkter der er mest informative at få etiket for.
- RAGRAG (Retrieval-Augmented Generation) er en teknik, hvor en sprogmodel suppleres med ekstern viden hentet fra en database for at forbedre svar.
- RAG-evalueringRAG-evaluering er processen med at vurdere kvaliteten og effektiviteten af et RAG-system, typisk gennem metrikker som korrekthed, relevans og faithfulness.
- RAG-generatorDen generative del af et RAG-system, typisk en stor sprogmodel, der producerer svar baseret på kontekst fra en retriever.
- RAG-modelEn RAG-model er en sprogmodel, der kombinerer en generator med en ekstern vidensbase via hentning for at forbedre kvaliteten og relevansen af genererede svar.
- RAG-pipelineEn RAG-pipeline er en systemarkitektur, der kombinerer en retriever til at hente relevante dokumenter fra en ekstern videnbase og en generator til at producere svar baseret på disse dokumenter.
- RAG-retrieverKomponent i en RAG-pipeline, der henter relevante dokumenter eller passager fra en videnbase baseret på en forespørgsel.
- re-rankerEn metode til at forbedre søgeresultater ved at anvende en sekundær, mere præcis model til at genrangere et lille antal kandidater fra en første hurtig søgning.
- re-rankingTeknik, hvor en indledende liste af resultater fra en første søgning eller retrieval bliver sorteret eller filtreret igen ved hjælp af en mere avanceret model for at forbedre relevansen.
- ReActReAct er en prompting-teknik, hvor en sprogmodel veksler mellem at generere ræsonnementstrin og udføre handlinger (fx kald af værktøjer) for at løse en opgave.
- ReAct-agentEn ReAct-agent er en AI-agent, der skiftevis ræsonnerer (Reasoning) og handler (Acting) i en loop for at løse opgaver, ved at generere tanker, udføre handlinger og observere resultater.
- ReAct-loopEn iterativ proces hvor en sprogmodel skiftevis ræsonnerer (Reasoning) og handler (Acting) ved at generere tanker og udføre handlinger, ofte i interaktion med eksterne værktøjer.
- reaktiv arkitekturEn softwarearkitektur, der fokuserer på at opbygge systemer, der er responsive, robuste, elastiske og meddelelsesdrevne, især anvendt i AI-systemer til realtidsinferens.
- reasoningRæsonnement er evnen til at drage logiske slutninger fra given information, traditionelt forbundet med symbolsystemer og nu også med sprogmodeller.
- RecallRecall er en evalueringsmetrik, der måler andelen af korrekt identificerede positive instanser ud af alle faktiske positive instanser.
- Recall scoreRecall er andelen af sande positive blandt alle faktisk positive instanser, også kaldet sensitivitet eller True Positive Rate.
- Recall@kRecall@k måler andelen af relevante dokumenter blandt de k første resultater i en rangering.
- Recall@kRecall@k måler andelen af relevante elementer, der findes blandt de øverste k anbefalinger eller søgeresultater.
- Recurrent neural networkEn klasse af neurale netværk med hukommelse via tilbagekoblede forbindelser, designet til sekventielle data.
- red teamEn 'red team' er en gruppe, der systematisk forsøger at finde sårbarheder, bias eller utilsigtet adfærd i et AI-system ved at simulere ondsindede angreb eller ekstreme input.
- red teamerEn person, der udfører systematiske angreb på AI-systemer for at afdække sårbarheder, bias eller sikkerhedsproblemer, ofte som del af en rød-holdsøvelse.
- Red teamingEn systematisk metode til at teste AI-modellers sikkerhed og robusthed ved at simulere angreb eller adversariale inputs.
- red-team-øvelseEn red-team-øvelse er en struktureret proces, hvor et hold (red team) systematisk forsøger at afdække sårbarheder og utilsigtet adfærd i en AI-model eller et system ved at simulere angreb eller manipulere input.
- regulariseringRegularisering er en teknik, der tilføjer en straf til modellens tabfunktion for at forhindre overfitting.
- RegularizationRegularization er en teknik, der tilføjer en straf til modellens tabsfunktion for at forhindre overfitting ved at begrænse modellens kompleksitet.
- Reinforcement learningReinforcement learning er en maskinlæringsmetode, hvor en agent lærer at træffe beslutninger ved at interagere med et miljø og modtage belønninger eller straf for sine handlinger.
- reinforcement learning from human feedbackEn teknik til at finjustere sprogmodeller ved at bruge menneskelige præferencer som belønningssignal i forstærkningslæring.
- relativ positional encodingEn metode til at indkode positioner i en transformer ved at repræsentere den relative afstand mellem elementer i stedet for absolutte positioner.
- representation learningMaskinlæringsteknikker, der automatisk afdækker de optimale repræsentationer af rådata til brug for detektion, klassifikation eller andre opgaver.
- repræsentationslæringRepræsentationslæring er en maskinlæringsteknik, hvor modellen automatisk lærer at omdanne rådata til meningsfulde repræsentationer, der bevarer relevant information til en given opgave.
- rerankerEn reranker er en sekundær model, der tager en liste af kandidater fra en indledende søgning og omrangere dem efter relevans ved hjælp af en mere præcis, men langsommere, metode.
- Reranker-modelEn reranker-model er en sekundær model, der rangerer et mindre sæt af kandidatdokumenter efter relevans for en given forespørgsel, typisk brugt efter en grov første udvælgelse.
- RerankingReranking er en teknik, hvor en indledende liste af kandidater (ofte fra en retriever) omrangordnes af en mere avanceret model for at forbedre relevans og præcision.
- reranking-modelEn model der genrangerer en liste af kandidater for at forbedre rækkefølgen.
- reranking-træningTræning af en reranker-model, der forbedrer rækkefølgen af kandidater fra et indledende søge- eller genereringstrin.
- Residual connectionEn residual connection er en forbindelse i et neuralt netværk, der springer et eller flere lag over og adderer indgangssignalet til lagets output.
- ResidualblokEn Residualblok er en byggesten i et residualt neuralt netværk, der består af en eller flere vægtede lag kombineret med en springende forbindelse (skip connection), så outputtet er summen af inputtet og transformationen af inputtet.
- ResNetResNet er et konvolutionelt neuralt netværk, der anvender residualforbindelser (springforbindelser) til at muliggøre træning af meget dybe netværk med hundredvis eller tusindvis af lag.
- resume trainingGenoptagelse af modeltræning fra et gemt checkpoint i stedet for at starte forfra.
- resume training checkpointEt resume training checkpoint er en gemt tilstand af en models vægte, optimizerens tilstand og evt. batchgenerator, som gør det muligt at genoptage træningen fra et bestemt tidspunkt.
- resumé-genereringAutomatisk generering af et kortfattet referat fra en længere tekst ved hjælp af sprogmodeller.
- resumé-modelEn AI-model der genererer en kortfattet version af en længere tekst.
- Retrieval systemEt system der finder og henter relevante informationer fra en database eller et korpus.
- Retrieval-Augmented GenerationRetrieval-augmented generation (RAG) er en teknik, hvor en sprogmodel udvides med en ekstern vidensbase for at forbedre nøjagtigheden og reducere hallucinationer.
- retrieval-pipelineEn struktureret sekvens af trin til at finde og hente relevante dokumenter eller information fra en videnbase, typisk brugt i RAG-systemer.
- retrieverEn komponent i et RAG-system (Retrieval-Augmented Generation) der henter relevante dokumenter eller informationer fra en stor samling baseret på en forespørgsel.
- reverse-mode ADEn teknik til effektiv beregning af gradienter ved at anvende kædereglen baglæns gennem en beregningsgraf.
- reward hackingReward hacking er et fænomen i forstærkningslæring, hvor en agent finder en måde at maksimere en belønningsfunktion på, der ikke stemmer overens med den tilsigtede adfærd, ofte ved at manipulere miljøet eller udnytte ufuldkommenheder i belønningsspecifikationen.
- Reward modelEn model, der forudsiger en belønningsscore for inputsekvenser for at guide forstærkningslæring.
- reward model trainingTræning af en belønningsmodel, der forudsiger menneskelige præferencer og bruges til at styre forstærkningslæring i RLHF.
- reward shapingTeknik inden for forstærkningslæring, hvor den egentlige belønning modificeres med en ekstra hjælpebelønning for at guide læringsprocessen.
- reward-hacking adfærdAdfærd hos en forstærkningslæringsagent, der udnytter huller i belønningsfunktionen til at opnå høj belønning uden at udføre den tilsigtede opgave.
- reward-hacking angrebEt reward-hacking angreb er en type uønsket adfærd i forstærkningslæring, hvor agenten finder en måde at manipulere belønningsfunktionen på for at opnå høje belønninger uden at fuldføre den tiltænkte opgave.
- Ridge regressionRidge regression er en reguleringsteknik, der anvender L2-straf for at mindske overfitting i lineære regressionsmodeller.
- right-side truncationRight-side truncation er en metode til at begrænse en sekvens af tokens til en maksimal længde ved at fjerne tokens fra begyndelsen (venstre side), så de nyeste (højre) tokens bevares.
- RL-agentEn RL-agent er en selvstændig enhed, der interagerer med et miljø ved at vælge handlinger baseret på en politik for at maksimere kumulativ belønning.
- RLHFRLHF er en træningsteknik, hvor en model finjusteres ved at optimere en belønningsmodel, der er lært fra menneskelige præferencer, typisk ved hjælp af forstærkningslæring.
- RLHF-modelEn model, der er finjusteret ved hjælp af forstærkningslæring baseret på menneskelig feedback (RLHF) for at tilpasse sig menneskelige præferencer.
- RLHF-pipelineRLHF-pipeline er en træningsproces i tre trin, der bruger menneskelig feedback til at finjustere en sprogmodel via reinforcement learning.
- RLHF-træningTræningsmetode hvor en model optimeres via forstærkningslæring baseret på menneskelig feedback.
- RLHF-træningRLHF-træning er en metode til at finjustere sprogmodeller ved at kombinere reinforcement learning med menneskelig feedback.
- RNNEt RNN er et neuralt netværk med cykliske forbindelser, designet til at behandle sekventielle data.
- RNN-celleEn RNN-celle er den grundlæggende byggesten i et rekurrent neuralt netværk, der opdaterer en skjult tilstand baseret på et input og den foregående tilstand.
- RNN-lagEt RNN-lag er et neuralt netværkslag med en skjult tilstand, der bevares over tid og muliggør behandling af sekventielle data.
- RoBERTaRoBERTa er en forbedret version af BERT, der optimerer træningsproceduren for bedre ydeevne.
- robust optimizationRobust optimization er en træningsteknik, der forbedrer en models modstandsdygtighed over for worst-case forstyrrelser i inputdata, typisk ved at optimere over en usikkerhedsmængde.
- RobustnessEn models evne til at opretholde sin ydeevne under forstyrrelser, såsom støj, modifikationer af input eller ændringer i datafordelingen.
- ROC curveEn grafisk fremstilling af en binær klassifikationsmodels ydeevne ved at plotte sand positiv rate mod falsk positiv rate ved forskellige tærskelværdier.
- root mean squared errorKvadratroden af gennemsnittet af kvadrerede forskelle mellem forudsagte og observerede værdier.
- ROUGEROUGE er en metrik til automatisk evaluering af tekstopsummering og maskinoversættelse, der måler overlap af n-gram, ordsekvenser og ordpar mellem en genereret tekst og reference(r).
- ROUGE-1En metrik til evaluering af automatisk tekstopsummering, der måler overlap af enkeltord (unigrammer) mellem en reference- og en kandidatsammenfatning.
- ROUGE-2ROUGE-2 er en automatisk evalueringsmetrik, der måler overlap af bigrammer (2-grams) mellem en maskinskrevet tekst og en reference-tekst for at vurdere kvaliteten af tekstgenerering, især inden for automatisk opsummering.
- ROUGE-LROUGE-L er en evalueringsmetrik til automatisk vurdering af tekster, der måler længden af den længste fælles delsekvens (LCS) mellem en reference- og en kandidattekst.
- ROUGE-NROUGE-N er en recall-baseret metrik, der måler overlap af n-grammer mellem en kandidattekst og en referencetekst, primært brugt til evaluering af automatisk tekstopsummering og maskinoversættelse.
- ROUGE-SROUGE-S er en evalueringsmetrik, der måler overlap af skip-gram (sekvenser af ord med mellemrum) mellem en referencetekst og en genereret tekst, med fokus på recall.
- ROUGE-SUEn evalueringsmetrik til automatisk opsummering, der måler overlap af unigrammer og skip-bigrammer mellem en maskinelt genereret og en referenceopsummering.
- ROUGE-WROUGE-W er en automatisk evalueringsmetrik til tekstopsummering, der beregner vægtet længste fælles undersekvens (W-LCS) mellem en modelgenereret reference og en referenceopsummering.
- rød-holdsøvelseEn struktureret testmetode, hvor et hold (rød-hold) forsøger at finde sårbarheder, fejl eller utilsigtede adfærd i en AI-model.
- rødholdEt rødhold er en gruppe af mennesker eller AI-systemer, der bevidst forsøger at finde sårbarheder eller udnytte fejl i et AI-system for at teste dets robusthed.
- SACSAC (Soft Actor-Critic) er en forstærkningslæringsalgoritme, der kombinerer maksimal entropi med actor-critic-metoder for at opnå stabil og sample-effektiv træning.
- safety alignmentProcessen med at sikre, at en AI-handler på en måde, der er i overensstemmelse med menneskelige værdier og undgår utilsigtede skadelige konsekvenser.
- safety guardrailsSikkerhedshegn er regler, filtre eller begrænsninger indbygget i en AI's pipeline for at sikre ansvarlig og sikker brug.
- safety-alignedEn sprogmodel der er finjusteret til at følge sikkerhedsretningslinjer og undgå skadelige eller upassende outputs.
- safety-forskningSafety-forskning er det tværfaglige felt, der undersøger, hvordan man sikrer, at AI-systemer handler i overensstemmelse med menneskelige værdier og undgår utilsigtede skadelige konsekvenser.
- sandsynlighedsmassefunktionEn funktion der angiver sandsynligheden for hver mulig værdi af en diskret stokastisk variabel.
- sandsynlighedstæthedEn funktion der beskriver sandsynlighedsfordelingen af en kontinuert stokastisk variabel.
- sandsynlighedstæthedsfunktionEn funktion der beskriver sandsynlighedsfordelingen for en kontinuert stokastisk variabel ved at angive den relative tæthed af sandsynlighed i hvert punkt.
- sandsynlighedstæthedsfunktionEn funktion der beskriver den relative sandsynlighed for at en kontinuert stokastisk variabel antager en given værdi.
- scaled dot product attentionOp mærksomhedsmekanisme, der beregner opmærksomhedsvægte som softmax af skalerede prikprodukter mellem queries og keys.
- scaling hypothesisHypotesen om at modellers præstationer forbedres forudsigeligt efter en potenslov, når modelstørrelse, datamængde og beregningsressourcer øges samtidigt.
- Scaling LawEmpirisk lov der beskriver, hvordan en models performance (f.eks. test-loss) skalerer med modelstørrelse, datamængde og beregningsressourcer.
- Scaling lawsEmpiriske love, der beskriver, hvordan en models ydeevne (fx tab) skalerer med modelstørrelse, datamængde og beregningsressourcer.
- score functionEn funktion der tildeler en numerisk værdi (score) til et data punkt eller en modeloutput, ofte brugt til at kvantificere sandsynlighed, relevans eller kvalitet.
- score matchingScore matching er en metode til at estimere en sandsynlighedstæthed ved at minimere forskellen mellem modelens og dataens score (gradient af log-tætheden).
- score-based modelEn generativ model der lærer gradienten af datæns log-tæthed (score-funktionen) for at generere nye data via Langevin-dynamik.
- SegmentationOpdeling af et billede eller en tekst i meningsfulde dele.
- sekvensmodelEn sekvensmodel er en type maskinlæringsmodel, der behandler sekventielle data, hvor rækkefølgen af input har betydning, såsom tidsserier, tekst eller tale.
- selektiv scanningEn teknik i transformermodeller, hvor modellen kun behandler de mest relevante dele af inputtet for at øge effektiviteten.
- selektiv tilstandsmodelEn selektiv tilstandsmodel er en type state space model, hvor overgangsdynamikken afhænger af inputtet, så modellen selektivt kan fremhæve eller undertrykke information.
- Self-attentionEn mekanisme i neurale netværk, hvor hvert element i en sekvens vægtes i forhold til alle andre elementer.
- self-attention layerEt neuralt netværkslag der beregner vægtede repræsentationer af en sekvens ved at lade hvert element 'kigge på' alle andre elementer.
- Self-Attention MechanismSelvopmærksomhedsmekanisme er en operation i neurale netværk, der beregner vægtede repræsentationer af elementer i en sekvens baseret på deres indbyrdes relationer.
- self-attention-mekanismeEn neural netværksmekanisme, der beregner vægtede repræsentationer af en sekvens ved at lade hvert element 'kigge på' alle andre elementer i sekvensen.
- self-consistency decodingEn inferensteknik, der forbedrer pålideligheden af sprogmodellers output ved at generere flere svar og vælge det mest konsistente.
- Self-distillationSelf-distillation er en træningsteknik, hvor en model lærer af sine egne forudsigelser, ofte ved at bruge en tidligere version af sig selv som lærer.
- self-distillation lossEt træningstab, hvor en model lærer fra sine egne forudsigelser (ofte en tidligere version eller en glidet gennemsnitsmodel) for at forbedre generalisering.
- self-distillation pipelineEn træningspipeline hvor en model fungerer som sin egen lærer ved at bruge egne forudsigelser som soft labels til at forbedre sin egen præstation.
- Self-paced curriculum learningSelf-paced curriculum learning er en træningsstrategi, der dynamisk ordner træningseksempler efter sværhedsgrad og gradvist inkluderer sværere eksempler baseret på modellens nuværende præstation.
- self-paced learningSelf-paced learning er en træningsstrategi, hvor modellen dynamisk vælger sværhedsgraden af træningseksempler baseret på dens nuværende præstation.
- Self-supervised learningSelf-supervised learning er en maskinlæringsmetode, hvor modellen lærer repræsentationer fra umærkede data ved at udnytte strukturen i dataene selv til at generere et overvågningssignal.
- Selv-konsistens (self-consistency)En metode, hvor en sprogmodel genererer flere uafhængige tankekæder og vælger det mest konsistente svar.
- Selv-konsistens (self-consistency)En metode til at forbedre ræsonneringsresultater fra sprogmodeller ved at sample flere svar og vælge det mest konsistente.
- selv-konsistensafstemningTeknik til at justere en sprogmodels output ved at sikre konsistens på tværs af flere genererede svar for samme forespørgsel.
- selvovervåget fortræningEn træningsmetode hvor en model lærer repræsentationer fra ustrukturerede data ved at konstruere og løse en selvdefineret prædiktiv opgave.
- selvovervåget repræsentationslæringSelvovervåget repræsentationslæring er en træningsmetode, hvor en model lærer nyttige repræsentationer af data ved at forudsige dele af inputtet fra andre dele, uden manuelle labels.
- semantic embeddingEn tæt vektorrepræsentation af ord, sætninger eller dokumenter, hvor semantisk lighed afspejles i vektorafstand.
- Semantic searchSøgemetode, der bruger betydningen af ord og sætninger til at finde relevante resultater, i stedet for nøjagtig ordmatch.
- semantisk indekseringSemantisk indeksering er en teknik, der kortlægger dokumenter og forespørgsler til et semantisk vektorrum ved hjælp af maskinlæring, således at information kan genfindes baseret på betydning snarere end nøjagtige ordmatch.
- semantisk interpolationTeknik til at generere jævne overgange mellem to punkter i et latent repræsentationsrum, så de mellemliggende punkter opretholder semantisk mening.
- semantisk søgemaskineEn semantisk søgemaskine er en søgemaskine, der forstår betydningen og hensigten bag en brugers forespørgsel ved hjælp af naturlig sprogforståelse, videnrepræsentation og maskinlæring for at levere mere relevante resultater end traditionel nøgleordsbaseret søgning.
- semantisk søgemodelEn semantisk søgemodel bruger vektorrepræsentationer (embeddings) af tekst til at finde dokumenter baseret på meningsindhold frem for eksakte ordmatch.
- semantisk søgningSøgemetode der fortolker forespørgsler ud fra betydning snarere end nøjagtig ordmatch.
- semi-supervised clusteringHalvovervåget clustering er en metode, hvor en lille mængde mærkede data bruges til at forbedre clustering af en stor mængde umærkede data.
- semi-supervised learningEn maskinlæringsteknik, der kombinerer en lille mængde mærkede data med en stor mængde umærkede data for at træne en model.
- sen fusionSen fusion er en teknik i multimodal læring, hvor separate repræsentationer fra forskellige modaliteter kombineres på et sent tidspunkt i forarbejdningen, typisk efter individuelle enkodere.
- sensitivitySensitivitet er andelen af faktisk positive tilfælde, der korrekt identificeres af modellen.
- sentence-BLEUSentence-BLEU er en variant af BLEU-metrikken, der evaluerer kvaliteten af en enkelt oversat sætning ved at måle n-gram-overlap med en referencesætning.
- SentencePieceSentencePiece er en subord-tokeniseringsalgoritme, der behandler input som en ubrudt strøm og lærer et ordforråd af delord uden forudgående tokenisering.
- seq2seqEn modelarkitektur, der består af en encoder og en decoder, som begge typisk er rekursive neurale netværk (RNN'er), og som transformerer en inputsekvens til en outputsekvens af varierende længde.
- seq2seq med attentionEn encoder-decoder-model, hvor decoderens output på hvert tidstrin afhænger af en vægtet sum af encoderens skjulte tilstande, så modellen kan fokusere på relevante dele af inputsekvensen.
- seq2seq-modelEn modelarkitektur, der transformerer en inputsekvens til en outputsekvens via en encoder og en decoder, typisk baseret på RNN'er eller transformere.
- sequence modelingSequence modeling er opgaven med at forudsige eller generere sekvenser af data ved at lære de underliggende mønstre og afhængigheder mellem elementer i en tidsmæssig rækkefølge.
- sfærisk interpolationEn interpolationsmetode mellem to punkter på en kugleoverflade, hvor bevægelsen sker langs en storcirkel.
- SGDSGD er en optimeringsalgoritme, der opdaterer modelparametre ved at beregne gradienten af tabsfunktionen på en tilfældig stikprøve (mini-batch) i stedet for hele datasættet.
- SGD med momentumOptimeringsteknik der tilføjer en momentumterm til SGD for at accelerere konvergensen og dæmpe oscillationer.
- SGD med Nesterov-momentumStokastisk gradient descent med Nesterov-momentum er en optimeringsalgoritme, der anvender et forudsete opdateringstrin for at forbedre konvergenshastigheden.
- SGD with momentumEn optimeringsalgoritme der tilføjer en hastighedskomponent til SGD for at dæmpe oscillationer og accelerere konvergens.
- SHAPSHAP er en metode baseret på spilteori til at forklare output fra maskinlæringsmodeller ved at tildele hver feature en bidragsværdi.
- Silhouette scoreSilhouette score er et mål for, hvor godt et objekt passer ind i sin egen klynge sammenlignet med andre klynger, baseret på både kohesion og separation.
- simulationEn efterligning af en virkelig proces eller et system ved hjælp af en model, ofte en computermodel, inden for kunstig intelligens.
- simuleringsbaseret træningEn træningsmetode hvor en AI-model lærer i et simuleret miljø i stedet for i den virkelige verden.
- simuleringsmiljøEn digital simulering af en verden eller et system, som agenter (f.eks. AI-modeller) kan interagere med for at lære eller teste adfærd.
- skalarfeltEt skalarfelt er en funktion, der til hvert punkt i et rum knytter en enkelt skalarværdi.
- Skip-gramSkip-gram er en neural netværksarkitektur i word2vec, der forudsiger kontekstord ud fra et målord.
- Small Language ModelEn sprogmodel med et relativt lille antal parametre, typisk under 1 milliard, optimeret til effektivitet og implementering på enheder med begrænsede ressourcer.
- snapshot checkpointEn snapshot checkpoint er en gemt kopi af en models vægte, optimeringsstat og tilhørende metadata på et bestemt tidspunkt under træning, så træningen kan genoptages eller evalueres senere.
- soft gatingSoft gating er en teknik i neurale netværk, hvor en blød vægtning (typisk via softmax) anvendes til at kombinere output fra flere eksperter eller stier, så alle bidrager proportionelt.
- soft targetEn målværdi i form af en sandsynlighedsfordeling over klasser, typisk genereret af en lærermodel, i modsætning til en hård etiket.
- SoftmaxEn normaliseret eksponentialfunktion, der omdanner en vektor af vilkårlige reelle tal til en sandsynlighedsfordeling.
- softmax-aktiveringEn aktiveringsfunktion der normaliserer en vektor af vilkårlige reelle tal til en sandsynlighedsfordeling over klasser.
- softmax-cross-entropySoftmax-cross-entropy er en losses-funktion, der kombinerer softmax-aktivering med cross-entropy-tab for flerklasseklassifikation.
- softmax-funktionDen normaliserede eksponentialfunktion der omdanner en vektor af reelle tal til en sandsynlighedsfordeling.
- Softmax-regressionEn generalisering af logistisk regression til multiklasse-klassifikation, hvor softmax-funktionen bruges til at forudsige sandsynlighedsfordelingen over flere klasser.
- softmax-temperaturSoftmax-temperatur er en skalarparameter, der styrer 'blødheden' af softmax-funktionens outputfordeling.
- softmax-temperatureEn temperaturparameter, der skalerer logitterne inden softmax-aktiveringen for at kontrollere fordelingens 'skarphed'.
- softwareagentEn autonom softwareenhed, der opfatter sit miljø, træffer beslutninger og udfører handlinger for at nå specifikke mål.
- sort boks modelEn model, hvis interne beregninger og beslutningsproces ikke er direkte observerbare eller forståelige for mennesker.
- Sparse autoencoderEn sparse autoencoder er en type autoencoder, der pålægger en sparsitetsbegrænsning på de latente repræsentationer for at fremme læring af sjældne, men informative features.
- sparse mixture of expertsEn neural netværksarkitektur, hvor kun en lille del af 'eksperterne' aktiveres for hvert input, hvilket reducerer beregningsomkostningerne.
- sparse MoEEn neural netværksarkitektur, der anvender en gate-mekanisme til at dirigere hvert input til et lille, sparsomt aktiveret subset af ekspertnetværk.
- sparse retrievalSparse retrieval betegner metoder til informationsgenfinding, der bruger sparse vektorer (overvejende nul) til at repræsentere dokumenter og forespørgsler, typisk baseret på termfrekvenser som i TF-IDF eller BM25.
- sparse retrieval-modelEn model der bruger sparse vektorer (mange nuller) til at repræsentere dokumenter og forespørgsler, og matcher dem ved fælles tokens.
- sparse retrieverEn sparsom retriever er en informationssøgningsmetode, der bruger sparse vektorer (få ikke-nul elementer) til at repræsentere dokumenter og forespørgsler, typisk baseret på TF-IDF eller BM25.
- sparse rewardSparse reward (sparsom belønning) betegner i forstærkningslæring en situation, hvor agenten kun modtager et belønningssignal sjældent, typisk først efter at have fuldført en hel opgave.
- sparsomhedEgenskaben ved at have mange nullelementer eller ubenyttede parametre i en vektor, matrix eller model.
- Speculative decodingTeknik til at fremskynde generering fra sprogmodeller ved at lade en hurtig draftmodel foreslå tokens, som verificeres parallelt af en større model.
- speculative decoding-pipelineEn teknik der fremskynder generering af tekst i store sprogmodeller ved at lade en hjælper-model generere foreløbige tokens, som hovedmodellen verificerer parallelt.
- sprogmodelEn sprogmodel er en statistisk eller neural model, der beregner sandsynligheden for sekvenser af ord eller tokens.
- sprogmodelstræningProcessen med at optimere en sprogmodels parametre ved hjælp af store tekstmængder, så den kan forudsige eller generere tekst.
- SRCNNSRCNN er et konvolutionelt neuralt netværk, der lærer en direkte mapping fra lavopløselige til højopløselige billeder.
- SRGANSRGAN er en dyb lærings-model baseret på et generativt adversarial netværk (GAN), der anvendes til at generere højopløsningsbilleder fra lavopløsningsinput.
- Stable DiffusionStable Diffusion er en latent diffusionsmodel, der genererer billeder ud fra tekstbeskrivelser ved at anvende en diffusionsproces i et latent rum.
- Stable Diffusion Web UIEn brugergrænseflade til webbrowseren, der gør det muligt at interagere med Stable Diffusion-modeller til billedgenerering uden kommandolinje.
- Stable Diffusion XLEn avanceret latent diffusionsmodel til tekst-til-billede-generering, udviklet af Stability AI, der producerer billeder i høj opløsning med forbedret detaljegrad og komposition sammenlignet med forgængeren.
- stacked bidirectional LSTMEn neural netværksarkitektur, der stabler flere lag af bidirektionelle LSTM-enheder, så hvert lag behandler input i både fremad- og bagudrettet retning for at indfange hierarkiske tidsmæssige afhængigheder.
- stacked LSTMEn arkitektur, hvor flere LSTM-lag stables oven på hinanden, så outputtet fra et lag sendes som input til det næste.
- StandardnormalfordelingStandardnormalfordelingen er en normalfordeling med middelværdi 0 og varians (eller standardafvigelse) 1.
- stateEn intern repræsentation, som en model vedligeholder og opdaterer for at opsummere tidligere informationer i en sekvens eller beslutningsproces.
- State space modelEn modelklasse der beskriver et dynamisk system ved hjælp af en latent tilstand, der udvikler sig over tid, og som anvendes inden for sekvensmodellering i kunstig intelligens.
- Stochastic gradient descentStokastisk gradient descent (SGD) er en optimeringsalgoritme, der opdaterer modelparametre ved hjælp af gradienten beregnet på en enkelt eller et lille antal tilfældigt udvalgte træningseksempler.
- Stokastisk backpropagationEn træningsalgoritme til neurale netværk, hvor gradienterne estimeres via stokastisk udvalgte mini-batches og anvendes til at opdatere vægtene via backpropagation.
- stokastisk gradientnedstigningStokastisk gradientnedstigning (SGD) er en iterativ optimeringsalgoritme, der opdaterer modelparametre ved at følge den negative gradient af tabsfunktionen estimeret fra en enkelt eller et lille antal tilfældige datapunkter.
- stratified cross-validationStratificeret krydsvalidering er en variant af krydsvalidering, hvor data opdeles i folder, der bevarer den samme klassefordeling som det oprindelige datasæt.
- Structured outputEn teknik, hvor en AI-model tvinges til at generere output i et foruddefineret format, typisk JSON.
- structured pruningStruktureret beskæring er en modelkompressionsteknik, der fjerner hele strukturer (kanaler, filtre, lag) fra et neuralt netværk.
- struktureret beskæringTeknik til modelkomprimering hvor hele strukturer, såsom kanaler, filtre eller lag, fjernes fra en neuralnetværksmodel for at reducere størrelse og beregningsomkostninger, samtidig med at den overordnede arkitektur bevares.
- student modelEn mindre, komprimeret model der trænes til at efterligne en større og mere kompleks lærer-models adfærd og prædiktioner.
- Student-teacher frameworkEn træningsteknik, hvor en mindre 'elev'-model lærer af en større 'lærer'-models forudsigelser eller repræsentationer.
- Style transferStyle transfer er en deep learning-teknik, hvor en models stil overføres til et andet billedes indhold.
- StyleGANStyleGAN er en type GAN med en stilbaseret generator, der muliggør kontrol over forskellige aspekter af det genererede billede ved at manipulere latente variabler.
- StyleGAN-ADAStyleGAN-ADA er en variant af StyleGAN, der anvender adaptiv diskriminator-augmentering for at træne på begrænsede datasæt.
- StyleGAN2StyleGAN2 er en forbedret version af StyleGAN, et generativt adversarial netværk (GAN) til billedsyntese, der adresserer artefakter i StyleGAN og introducerer vægtmodulation.
- StyleGAN3StyleGAN3 er en generativ adversarial netværksarkitektur til billedgenerering, der forbedrer translation- og rotationsækvarians ved at eliminere aliasing i netværket.
- subword-tokenEn token der repræsenterer en underordnet enhed af et ord, typisk et hyppigt forekommende n-gram eller morfem, brugt i subword-tokenisering.
- subword-token-algoritmeEn algoritme der deler ord i underenheder (subwords) for at håndtere ukendte ord og begrænse ordforrådsstørrelse i sprogmodeller.
- Subword-tokeniseringSubword-tokenisering er en metode til at opdele ord i mindre meningsfulde enheder, så modellen kan håndtere ord, den ikke har set før.
- subword-tokenizationEn tokeniseringsteknik, hvor ord opdeles i mindre enheder (subwords) baseret på frekvens, så modellen kan håndtere ukendte ord og morfologisk variation.
- subword-tokenizerEn tokeniseringsmetode der opdeler ord i mindre enheder (subwords) baseret på frekvens, så modellen kan håndtere ukendte ord.
- Super-resolutionTeknik til at rekonstruere et højopløst billede fra et lavopløst input.
- supervised learning-algoritmeEn algoritme der trænes på et mærket datasæt, hvor input-output-par lærer modellen at forudsige output for nye input.
- symbol groundingSymbol grounding er problemet med at knytte abstrakte symboler til konkrete, meningsfulde referenter i den virkelige verden.
- symbol grounding problemProblemet med at knytte symbolske repræsentationer til den virkelighed, de skal referere til, så de får betydning.
- symboljordforbindelseProblemstillingen om, hvordan symboler i kunstig intelligens tillægges betydning ved at blive knyttet til virkelige objekter eller fænomener.
- symbolsk reasoningSymbolsk reasoning er en metode inden for kunstig intelligens, hvor viden repræsenteres ved hjælp af symboler og logiske regler, og hvor inferens udføres gennem symbolmanipulation.
- syntetisk datagenereringSyntetisk datagenerering er processen med at skabe kunstige data, der efterligner egenskaberne ved rigtige data, ofte brugt til træning af AI-modeller.
- syntetisk træningsdataKunstigt fremstillede data, der bruges til at træne maskinlæringsmodeller, ofte for at kompensere for mangel på rigtige data eller for at forbedre modelrobusthed.
- Synthetic dataKunstigt genererede data, der efterligner egenskaberne ved virkelige data, skabt via algoritmer eller simulationer.
- System prompt engineeringTeknikken at designe og optimere systemprompten for at styre adfærden af en sprogmodel.
- sætnings-embeddingEn vektorrepræsentation af en hel sætning, som indfanger dens semantiske betydning i et fast antal dimensioner.
- sætnings-embedding-modelEn model der transformerer en sætning til en tæt vektor (embedding), som fanger dens semantiske betydning, så sætninger med lignende betydning placeres tæt i vektorrummet.
- sætnings-embedding-vektorEn sætnings-embedding-vektor er en numerisk vektor, der repræsenterer betydningen af en hel sætning i et kontinuerligt vektorrum.
- sætnings-embeddingmodelEn sætnings-embeddingmodel er en neurale netværksmodel, der kortlægger sætninger til fikserede vektorer (embeddings), som fanger sætningens semantiske betydning.
- sætningsembeddingEn sætningsembedding er en numerisk vektorrepræsentation af en hel sætning, der fanger dens semantiske betydning i et kontinuerligt vektorrum.
- t-SNEt-SNE er en ikke-lineær dimensionalitetsreduktionsteknik, der bruges til at visualisere højdimensionelle data i et lavdimensionelt rum (typisk 2D eller 3D) ved at bevare lokale nabo-strukturer.
- tanhDen hyperbolske tangens (tanh) er en matematisk funktion, der som aktiveringsfunktion i neurale netværk mapper inputværdier til intervallet (-1,1).
- tanh activationTanh-aktivering er en matematisk funktion, der anvendes i neuroner for at kortlægge input til output mellem -1 og 1.
- tanh-aktiveringsfunktionTanh er en matematisk aktiveringsfunktion, der skalerer input til værdier mellem -1 og 1 og bruges i neurale netværk.
- target modelDen model der er genstand for optimering, træning eller tilpasning, i modsætning til en reference-, kilde- eller lærer-model.
- target networkEt separat neuralt netværk, der bruges som et stabilt mål under Q-læring for at reducere svingninger i træningen.
- target taskDen specifikke opgave, som en model er trænet eller finjusteret til at løse.
- task planningPlanlægning af en sekvens af handlinger for at opnå et specifikt mål.
- teacher ensembleEt teacher ensemble er en samling af flere forudtrænede modeller (teachers), der i fællesskab vejleder træningen af en enkelt student model, typisk ved at aggregerer deres forudsigelser eller logits.
- teacher modelEn stor, prætrænet model der bruges som vejleder i videnoverførsel (knowledge distillation) til at træne en mindre 'elevmodel'.
- teacher-student setupEn træningsteknik, hvor en stor, prætrænet model (læreren) vejleder en mindre model (eleven) ved at overføre viden via bløde labels eller logits.
- teacher-student trainingEn træningsteknik, hvor en stor, prætrænet model (læreren) overfører sin viden til en mindre model (eleven) ved at guide elevens læring via lærerens outputfordelinger eller logits.
- temperatur-scalingEn post-processing teknik, der justerer en neural netværks softmax-udgang ved at dividere logitterne med en temperaturparameter for at forbedre kalibreringen af sandsynligheder.
- TemperatureEn parameter, der skalerer logits før softmax for at styre tilfældigheden i tokensampling.
- temperaturparameterEn parameter, der styrer fordelingens 'skarphed' i softmax-funktionen, så en høj temperatur giver mere tilfældige outputs og en lav temperatur giver mere deterministiske outputs.
- temperatursamplingTemperatursampling er en afkodningsstrategi, hvor logitterne fra en sprogmodel skaleres med en temperaturparameter inden softmax, hvilket styrer fordelingens skarphed.
- temperaturskaleringEn metode til at skalere logits i en blød maksimeringsfunktion for at kontrollere 'skarpheden' af den resulterende sandsynlighedsfordeling.
- tensor coreEn specialiseret hardwareenhed i NVIDIA GPU'er designet til effektivt at udføre matrix-multiplikation og andre tensoroperationer, typisk med blandet præcision.
- tensor core-accelereretBetegnelse for beregninger, typisk matrixmultiplikationer, der udføres ved hjælp af specialiserede tensor cores i GPU'er for at opnå højere gennemstrømning og energieffektivitet.
- tensor processing unitEn specialbygget hardware-accelerator designet til at udføre tensoroperationer hurtigt og energieffektivt, primært brugt til træning og inferens af neurale netværk.
- TensorBoardTensorBoard er et visualiseringsværktøj til TensorFlow, der bruges til at logge, overvåge og visualisere træningsforløb, metrikker, grafer og data under maskinlæringsmodeller.
- TensorBoard-callbackEn Keras-callback der logge træningsdata til visualisering i TensorBoard.
- TensorBoard-loggerEt værktøj til at logge data fra maskinlæringseksperimenter til visualisering i TensorBoard.
- TensorFlow Extended (TFX)TensorFlow Extended (TFX) er en open source-platform til implementering og styring af produktionsklare machine learning-pipelines baseret på TensorFlow.
- TensorFlow LiteTensorFlow Lite er en letvægtsversion af TensorFlow til at køre maskinlæringsmodeller på mobile og indlejrede enheder.
- TensorFlow Lite MicroTensorFlow Lite Micro er en maskinlæringsbibliotek til at køre TensorFlow-modeller på mikrocontrollere og andre små embedded-enheder.
- TensorFlow ServingTensorFlow Serving er et fleksibelt, high-performance system til at serve machine learning-modeller i produktion, designet til at integrere med TensorFlow, men understøtter også andre frameworks.
- TensorFlow.jsTensorFlow.js er et open source JavaScript-bibliotek til maskinlæring, der muliggør træning og inferens af modeller direkte i browseren eller i Node.js.
- TensorFlow.js Node.jsTensorFlow.js Node.js er en biblioteksimplementering af TensorFlow.js til kørsel af machine learning-modeller i Node.js-miljøet.
- tensorproduktEn matematisk operation, der kombinerer to tensorer til en ny tensor med højere rang, defineret som ydre produkt generaliseret til flerdimensionale arrays.
- test-perplexityEt mål for, hvor godt en sprogmodel forudsiger en testdatasætsekvens, beregnet som den geometriske gennemsnitlige inverse sandsynlighed for ordene i testdata.
- test-sæt-fejlrateTest-sæt-fejlrate er andelen af forkerte forudsigelser på et test-datasæt.
- text augmentationTeknik til at generere syntetiske træningseksempler i naturlig sprogbehandling ved at anvende transformationer som synonymudskiftning, backtranslation eller tilføjelse af støj.
- text segmentationOpdeling af tekst i mindre, meningsfulde enheder som sætninger, afsnit eller chunks.
- text-to-image generationTeknik til at generere billeder ud fra en tekstbeskrivelse ved hjælp af en AI-model.
- tf.kerastf.keras er TensorFlows implementering af Keras API'et til at bygge og træne neurale netværk.
- tfjs-coretfjs-core er kernebiblioteket i TensorFlow.js, der implementerer den grundlæggende maskinlæringslogik i JavaScript.
- TFLiteTFLite er et lightweight framework fra Google til at køre maskinlæringsmodeller på enheder med begrænsede ressourcer som mobile, indlejrede og edge-enheder.
- TFLite ConverterVærktøj der konverterer TensorFlow-modeller til det optimerede TFLite-format til mobile og edge-enheder.
- TFX-komponentEn TFX-komponent er en enhed i en TFX-pipeline, der udfører en specifik opgave i maskinlærings-workflowet, såsom datavalidering, feature engineering eller modeltræning.
- TFX-pipelineEn TFX-pipeline er en platform fra TensorFlow til at bygge og styre produktions-ML-pipelines.
- tidlig fusionEn fusionsteknik hvor data fra flere modaliteter kombineres på inputniveau, før de behandles af en model.
- tilbagekoblet neuralt netværkEt tilbagekoblet neuralt netværk (RNN) er en type neuralt netværk designet til at behandle sekventielle data ved at bevare en intern tilstand over tid gennem feedback-forbindelser.
- tilstandsværdifunktionFunktion der angiver den forventede kumulative belønning fra en given tilstand under en given politik.
- token-grænseoverskridelseSituation hvor en tokenisation af en tekst resulterer i at en meningsfuld enhed deles på tværs af to segmenter, fx i forbindelse med vinduesbaseret behandling af lange dokumenter.
- token-idEn numerisk identifikator, der entydigt repræsenterer et token i en models ordforråd.
- Tool callingEn teknik hvor en sprogmodel kan anmode om at udføre en foruddefineret funktion (værktøj) og indlejre resultatet i en samtale.
- Tool useEvnen hos en sprogmodel til at interagere med eksterne værktøjer som API'er, databaser eller regnemaskiner for at udføre opgaver, der kræver ekstern beregning eller information.
- tool-augmented language modelEn sprogmodel, der er udvidet med eksterne værktøjer (f.eks. søgning, beregning) for at udføre opgaver uden for ren tekstgenerering.
- ToolformerToolformer er en metode til at finjustere en sprogmodel, så den kan lære at bruge eksterne værktøjer gennem få eksempler.
- Top-kSelektions- eller samplingmetode, hvor kun de k mest sandsynlige elementer (f.eks. tokens eller dokumenter) bevares.
- top-k filtreringEn dekodningsstrategi for sprogmodeller, hvor kun de k mest sandsynlige tokens overvejes ved hvert generationstrin.
- top-k gatingEn teknik i mixture-of-experts-modeller, hvor gaten vælger de k mest relevante eksperter baseret på en vægtet scoring.
- top-k retrievalEn retrieval-metode, hvor de k mest relevante dokumenter eller elementer fra en samling hentes frem baseret på en relevansscore.
- Top-k samplingTop-k sampling er en stokastisk tekstgenereringsteknik, hvor kun de k mest sandsynlige tokens overvejes ved næste forudsigelse.
- Top-p samplingEn stokastisk dekodningsstrategi, hvor næste token vælges fra et sæt af tokens med kumulativ sandsynlighed over en grænse p.
- torch.nntorch.nn er PyTorchs modul til at definere og arbejde med neurale netværk; det indeholder foruddefinerede lag, tabfunktioner og aktiveringsfunktioner.
- torchaudioTorchaudio er et bibliotek i PyTorch-økosystemet, der giver værktøjer til indlæsning, behandling og transformation af lyddata med fokus på maskinlæring.
- torchtextTorchtext er et PyTorch-bibliotek til forbehandling og indlæsning af tekstdata, herunder tokenisering, ordforrådsopbygning og batch-generering.
- torchvisiontorchvision er et PyTorch-bibliotek til computer vision, der tilbyder datasæt, fortrænede modeller og billedtransformationer.
- TPUEn specialbygget ASIC fra Google til at accelerere tensoroperationer i maskinlæringsmodeller, især neuralnetværk.
- TPU-chipEn TPU-chip er en specialbygget processor udviklet af Google til at accelerere maskinlæringsberegninger, især tensoroperationer.
- TPU-podEn TPU-pod er en samling af Tensor Processing Units (TPU'er), der er forbundet via et højhastighedsnetværk til stor-skala parallel databehandling og træning af maskinlæringsmodeller.
- TPU-v2Googles anden generation af specialbyggede ASIC'er til acceleration af maskinlæringsarbejdsbelastninger.
- training strategiEn planlagt tilgang til træning af en maskinlæringsmodel, der omfatter valg af optimeringsalgoritme, læringshastighedsplan, batchstørrelse, regularisering og andre hyperparametre for at opnå bedst mulig ydeevne.
- Transfer learningOverførsel af viden fra en allerede trænet model til en ny, relateret opgave for at forbedre indlæringseffektivitet og præstation.
- TransformerTransformer er en neural netværksarkitektur, der udelukkende er baseret på selvopmærksomhedsmekanismer og uden brug af rekurente eller konvolutionelle lag.
- Transformer-arkitekturTransformer-arkitekturen er en neural netværksarkitektur, der udelukkende baserer sig på opmærksomhedsmekanismer og har revolutionerende betydning for behandling af sekvensdata.
- Transformer-baseretTransformer-baseret beskriver en model eller et system, der bygger på Transformer-arkitekturen, karakteriseret ved attention-mekanismer og parallel behandling.
- Transformer-baseret sprogmodelEn transformer-baseret sprogmodel er en neural netværksmodel, der anvender Transformer-arkitekturen til at forudsige eller generere sprog ved at lære mønstre fra store tekstmængder.
- Transformer-blokEn Transformer-blok er den grundlæggende byggesten i Transformer-modellen, bestående af et multi-head attention-lag efterfulgt af et feed-forward neuralt netværk, hver omgivet af residualforbindelser og layer normalization.
- Transformer-decoderDen del af Transformer-arkitekturen, der ansvarlig for autoregressiv generering af outputsekvenser ved at anvende maskeret selvopmærksomhed og krydsopmærksomhed.
- Transformer-encoderEn Transformer-encoder er den del af Transformer-arkitekturen, der behandler input-sekvensen ved hjælp af selvopmærksomhed og feed-forward lag for at producere kontekstualiserede repræsentationer for hvert token.
- Transformer-modelTransformer-modellen er en neural netværksarkitektur baseret på self-attention-mekanismer, der erstatter rekursive og konvolutionelle lag.
- transparensrapportEn transparensrapport er et dokument, hvor en organisation offentliggør detaljerede oplysninger om sin brug af kunstig intelligens, herunder datasæt, modelarkitektur, biasvurderinger og etiske retningslinjer.
- transposed convolutional layerEt transponeret konvolutionslag er en type neuralt netværkslag, der anvender en transponeret konvolution for at opnå op-sampling af en input-featuremap, i modsætning til et almindeligt konvolutionslag, der udfører nedsampling.
- Tree of ThoughtEn prompting-teknik, hvor modellen udforsker flere tænkestier samtidigt for at finde den bedste løsning.
- true positive rateAndelen af korrekt identificerede positive tilfælde blandt alle faktisk positive tilfælde.
- træningsegenskaberTræningsegenskaber er de konfigurerbare parametre og indstillinger, der styrer en maskinlæringsmodel under træning, såsom learning rate, batch size og antal epoker.
- træningsloopDen iterative proces, hvor en model gentagne gange præsenteres for data, beregner tab, og opdaterer vægte via backpropagation.
- tæthedsfunktionEn tæthedsfunktion er en funktion, der beskriver sandsynlighedstætheden af en kontinuert stokastisk variabel i et givet punkt.
- udfoldet RNNEn teknik hvor en tilbagevendende neuralt netværk (RNN) rulles ud over tidstrin, så det cykliske graf bliver til et feedforward-netværk, hvilket muliggør backpropagation gennem tiden (BPTT).
- UMAPUMAP er en ikke-lineær dimensionalitetsreduktionsteknik, der bruges til visualisering og klustering af højdimensionelle data.
- underrumEt underrum er en delmængde af et vektorrum, der selv er et vektorrum under de samme operationer.
- Unigram-tokeniseringUnigram-tokenisering er en subword-tokeniseringsteknik, der træner et unigram-sprogmodel over et korpus og vælger det mest sandsynlige segmenteringsmønster for hvert ord.
- unstructured pruningEn metode til at komprimere neurale netværk ved at fjerne individuelle vægte eller forbindelser uden hensyn til struktur.
- Unsupervised learningEn maskinlæringstype, hvor modellen lærer mønstre udelukkende fra ustrukturerede data uden foruddefinerede etiketter eller målvariable.
- unsupervised learning algorithmEn type maskinlæringsalgoritme, der finder mønstre i data uden at bruge foruddefinerede etiketter.
- uovervåget læringEn maskinlæringsteknik, hvor en model trænes på data uden labels for at finde skjulte mønstre eller strukturer.
- upaaret billede-til-billede translationEn teknik inden for computervision, hvor en model oversætter billeder fra et domæne til et andet uden brug af parrede træningseksempler.
- usikkerhedsprøvetagningEn aktiv læringsteknik hvor modellen vælger de data at blive mærket, som den er mest usikker på.
- VAEEn generativ model der kombinerer en encoder-decoder-struktur med variationel inferens for at lære en latent repræsentation af data.
- value alignmentProblemstillingen med at designe kunstig intelligens, så dens mål og handlinger konsekvent stemmer overens med menneskelige værdier og intentioner.
- value functionEn funktion, der estimerer den forventede fremtidige belønning (afkast) for en given tilstand (eller tilstand-handling-par) under en bestemt politik.
- vanishing gradientFænomenet hvor gradienter (afledte) bliver eksponentielt mindre, når de backpropageres gennem mange lag i et dybt neuralt netværk, hvilket gør træning af tidlige lag ineffektiv.
- vanishing gradient problemProblem i træning af dybe neurale netværk, hvor gradienterne af tabsfunktionen bliver eksponentielt mindre, når de bakker tilbage gennem lagene, hvilket forhindrer vægtopdateringer i de tidlige lag.
- varianceVarians er et mål for, hvor meget en stokastisk variabel spreder sig omkring sin middelværdi; i machine learning refererer det til modellens følsomhed over for små ændringer i træningsdata.
- variansreduktionSæt af metoder til at mindske variansen af en estimator uden at øge bias.
- Variational AutoencoderEn generativ model der kombinerer en autoencoder med variational inference for at lære en latent repræsentation af data.
- variationel inferensEn metode til at tilnærme en kompleks posterior-fordeling i bayesiansk statistik og maskinlæring ved at optimere en enklere fordeling.
- Vector databaseEn specialiseret database optimeret til lagring og søgning af vektorembeddinger.
- vector retrievalVectoretrieval er processen med at finde de mest relevante elementer i en vektordatabase ved at sammenligne en forespørgselsvektor med en samling af indlejrede vektorer.
- vektorbaseret søgningVektorbaseret søgning er en metode, hvor data repræsenteres som vektorer i et højdimensionelt rum, og lighed måles ved afstandsberegninger som cosinus-lighed eller euklidisk distance.
- vektordatabasestyringssystemEt databasesystem designet til effektiv lagring, indeksering og lighedssøgning af højdimensionelle vektorer.
- vektorindeksEn datastruktur der organiserer vektorer i et højdimensionelt rum for at muliggøre hurtig lighedssøgning.
- vektorindekseringVektorindeksering er en metode til at gemme og effektivt søge i højdimensionelle vektorer, typisk repræsentationer af data som tekst eller billeder, ved at organisere dem i en datastruktur der muliggør hurtig nearest neighbor-søgning.
- vektorindeksstrukturEn datastruktur designet til at indeksere og effektivt søge i højdimensionelle vektorer, typisk anvendt til lighedssøgning.
- vektoriseringsmetodeEn metode til at omdanne ikke-numeriske data, såsom tekst eller billeder, til numeriske vektorer, som maskinlæringsmodeller kan behandle.
- vektorrepræsentationslæringLæring af en transformation, der kortlægger rådata til en kompakt, meningsfuld vektorrepræsentation, som bevarer relevante strukturer og relationer.
- vektorrepræsentationsrumEt matematisk rum, hvor hvert element (fx et ord eller en sætning) er repræsenteret som en vektor, således at semantiske relationer afspejles i geometriske afstande og retninger.
- vektorrumEt vektorrum er en matematisk struktur bestående af en mængde vektorer, der kan adderes og multipliceres med skalarer under bestemte aksiomer.
- Vision TransformerVision Transformer (ViT) er en neural netværksarkitektur, der anvender Transformer-modellen direkte på billeder ved at opdele dem i patches og behandle disse som en sekvens af tokens.
- ViTVision Transformer (ViT) er en neural netværksarkitektur, der anvender transformer-mekanismen direkte på billeder opdelt i patches.
- Voice cloningTeknik til at syntetisere en persons stemme ved hjælp af maskinlæring, typisk baseret på få lydoptagelser.
- voice cloning modelEn model der kan generere tale der lyder som en bestemt person, baseret på en lydprøve.
- voice cloning systemEt AI-system der syntetiserer naturligt klingende tale, der efterligner en specifik persons stemme baseret på en lydprøve.
- VQ-GANEn generativ adversarial netværksarkitektur, der kombinerer vektorkvantisering i latent rum med en GAN for at lære diskrete repræsentationer til billedgenerering.
- VQ-VAE-2VQ-VAE-2 er en hierarkisk udgave af VQ-VAE, der bruger flere niveauer af kvantiserede latente repræsentationer og autoregressive priors for at generere højkvalitetsbilleder.
- vægtbeskæringVægtbeskæring er en modelkomprimeringsteknik, hvor ubetydelige vægte i en neuralt netværk fjernes for at reducere modelstørrelse og beregningsbyrde uden væsentligt præcisionstab.
- vægtet F1Vægtet F1 er et gennemsnit af F1-scores for hver klasse, vægtet efter antallet af sande instanser i hver klasse.
- vægtinitialiseringTeknik til at fastsætte startværdierne for en neural netværks modelparametre før træning.
- vægtmatrixEn matrix af justerbare parametre i et neuralt netværk, der transformerer input til output ved lineær transformation.
- værdialignmentVærdialignment betegner problemstillingen med at sikre, at kunstig intelligens handler i overensstemmelse med menneskelige værdier og intentioner.
- Wasserstein GANEn Generative Adversarial Network (GAN), der anvender Wasserstein-afstanden (Earth Mover's Distance) som tabsfunktion for at stabilisere træningen og undgå mode collapse.
- Weight decayWeight decay er en regulariseringsteknik der tilføjer en straf proportional med vægtenes størrelse til tabsfunktionen, typisk implementeret som L2-regularisering.
- weight decay coefficientHyperparameter der bestemmer styrken af weight decay-regularisering under træning af neurale netværk.
- weight decay rateEn hyperparameter der angiver styrken af weight decay, en regulariseringsteknik der tilføjer en straf for store vægte under træning.
- Weight initializationTeknik til at fastsætte startværdier for en neural netværks vægte før træning.
- Weighted cross-entropyEn tabsfunktion der tilpasser krydsentropien ved at vægte hver klasses bidrag forskelligt, typisk for at håndtere ubalancerede datasæt.
- WGANEn type generativt adversart netværk, der bruger Wasserstein-afstanden til at stabilisere træning og undgå mode collapse.
- white-box adversarial attackEt white-box adversarial attack er et angreb mod en maskinlæringsmodel, hvor angriberen har fuld adgang til modellens arkitektur, vægte og parametre.
- Word2vecWord2vec er en familie af neurale netværksmodeller, der lærer vektorrepræsentationer af ord fra store tekstkorpus.
- WordPieceWordPiece er en tokniseringsteknik, der opdeler ord i hyppige underordsekvenser ved at lære et vokabular af subword-enheder.
- WordPiece-tokenizerEn subord-tokeniseringsalgoritme, der opdeler ord i kendte delordsenheder ved hjælp af en grådig længste-match-fremgangsmåde og en foruddefineret vokabular.
- World modelEn intern repræsentation af omgivelserne, som en AI-agent bruger til at forudsige fremtidige tilstande og planlægge handlinger.
- world model agentEn AI-agent der konstruerer og anvender en intern model af omverdenen til at forudsige fremtidige tilstande og planlægge handlinger.
- world model-læringLæring af en intern model af verden, der kan simulere fremtidige tilstande og belønninger.
- XAIXAI (Explainable Artificial Intelligence) betegner metoder og teknikker der gør AI-systemers beslutninger og output forståelige og fortolkbare for mennesker.
- XAIXAI betegner metoder og teknikker, der gør det muligt for mennesker at forstå og fortolke, hvordan AI-systemer træffer beslutninger.
- XAI-metodeEn XAI-metode er en teknik, der gør det muligt at forstå og fortolke output fra en AI-model.
- XAI-værktøjEt værktøj til at gøre kunstig intelligens' beslutninger forståelige for mennesker.
- Xavier initializationXavier-initiering er en metode til at initialisere vægtene i et neuralt netværk, så variansen af output fra hvert lag bevares, hvilket forhindrer gradienter i at forsvinde eller eksplodere.
- Zero-shot chain-of-thoughtEn prompting-teknik, hvor en sprogmodel opfordres til at generere ræsonnementstrin uden at få vist eksempler, typisk ved at tilføje 'Lad os tænke trin for trin' til prompten.
- Zero-shot classificationKlassifikation af datapunkter uden forudgående træning på specifikke klasser ved at udnytte semantiske repræsentationer.
- zero-shot classifierEn zero-shot classifier er en klassifikationsmodel, der kan forudsige klasser, som den ikke er blevet eksplicit trænet på, ved at udnytte semantisk information fra en separat repræsentation.
- Zero-shot detectionEn teknik inden for objektdetektion, hvor en model identificerer objekter fra kategorier, den ikke har set under træning.
- Zero-shot learningZero-shot learning er en maskinlæringsteknik, hvor en model klassificerer objekter fra klasser, den ikke har set under træning, ved hjælp af semantiske repræsentationer eller beskrivelser.
- zero-shot object detectionZero-shot object detection er en teknik inden for computer vision, hvor en model kan lokalisere og klassificere objekter fra klasser, den ikke har set under træning.
- åbent ordforrådEt åbent ordforråd betyder, at en model kan håndtere ord eller tokens, der ikke er set under træning, typisk ved hjælp af underordsenheder eller karakterbaserede repræsentationer.
- β-VAEβ-VAE er en variant af variational autoencoder (VAE), der introducerer en vægtningsparameter β for at kontrollere graden af disentanglement i den latente repræsentation.