begreb
420 termer- Activation functionEn aktiveringsfunktion er en matematisk funktion, der bestemmer outputtet af en neuron i et neuralt netværk baseret på dens input.
- adversarial attackEt adversarisk angreb er en bevidst, lille perturbation af et input til en AI-model, der får modellen til at lave en fejl.
- Adversarial exampleEt adversarial example er en input, der er blevet manipuleret med små, uopdagede ændringer for at få en model til at lave en forkert forudsigelse.
- adversarial robustnessAdversarial robustness betegner en maskinlæringsmodel's evne til at modstå bevidst fremstillede, små perturbationer i inputdata, der har til formål at narre modellen til at lave fejl.
- afstandsmetrikEn afstandsmetrik er en funktion, der kvantificerer afstanden mellem to punkter i et rum, ofte brugt til at måle lighed eller forskellighed i maskinlæring.
- AgentEn agent er en enhed, der sanser sit miljø og handler på baggrund af det for at nå specifikke mål.
- Agentic workflowEn agentic workflow er en arbejdsgang, hvor en AI-agent autonomt udfører en række trin, ofte ved brug af værktøjer og feedback, for at opnå et komplekst mål.
- AI alignmentForskning og praksis, der sigter mod at sikre, at kunstig intelligens-systemer handler i overensstemmelse med menneskelige værdier og intentioner.
- AI safetyAI safety er et forsknings- og praksisfelt, der beskæftiger sig med at sikre, at kunstig intelligens-systemer er pålidelige, robuste og ikke forårsager utilsigtede skader.
- AI-sikkerhedAI-sikkerhed er forskning og praksis, der sigter mod at sikre, at kunstig intelligens-systemer handler i overensstemmelse med menneskelige værdier og ikke forårsager utilsigtet skade.
- AI-sikkerhedsforskningForskning, der fokuserer på at sikre, at kunstig intelligens-systemer er pålidelige, sikre og i overensstemmelse med menneskelige værdier.
- AI-sikkerhedsingeniørEn ingeniør med speciale i at identificere, analysere og afbøde sikkerhedsrisici ved AI-systemer.
- aktiveringsfunktionEn aktiveringsfunktion er en matematisk funktion, der anvendes på outputtet af en neuron i et neuralt netværk for at introducere ikke-linearitet og bestemme, om neuronen skal aktiveres.
- algorithmic fairnessAlgorithmic fairness betegner fraværet af systematisk bias eller diskrimination i algoritmers resultater, så forskellige grupper behandles retfærdigt.
- alignmentAlignment betegner problemet med at sikre, at kunstig intelligens handler i overensstemmelse med menneskelige værdier, intentioner og mål.
- alignmentsforskningForskningsområde inden for kunstig intelligens der sigter mod at sikre, at AI-systemers adfærd og mål overensstemmer med menneskelige værdier og intentioner.
- alignmentsproblemProblemet med at sikre, at kunstig intelligens handler i overensstemmelse med menneskelige intentioner og værdier.
- APIAPI er et sæt af definerede regler og protokoller, der gør det muligt for softwareapplikationer at kommunikere og udveksle data.
- API-endepunktEn specifik URL eller adresse, som en API anvender til at modtage anmodninger og sende svar.
- API-nøgleEn API-nøgle er en unik streng, der autentificerer en bruger eller applikation ved kald til en API, ofte brugt til at kontrollere adgang til AI-tjenester.
- argmaxArgumentet (inputværdien) der maksimerer en given funktion.
- arrayEn ordnet samling af elementer, typisk af samme datatype, indekseret med heltal.
- array-indekseringTeknik til at vælge enkeltelementer eller udsnit af et array ved brug af indeksnumre, udsnit, boolske betingelser eller lister af indeks.
- attention scoreDen rå værdi, der beregnes som prikproduktet mellem en query- og en key-vektor i en attention-mekanisme, før softmax-normalisering.
- attributEn attribut er en egenskab eller et kendetegn ved en datapost, typisk repræsenteret som en kolonne i et datasæt.
- autonom agentEn autonom agent er et system, der uafhængigt kan handle og træffe beslutninger i et miljø for at opfylde sine mål.
- autonom kørselEvnen for et køretøj til at navigere og operere uden menneskelig indgriben ved hjælp af sensorer, kameraer, radar og AI.
- autonomiAutonomi er evnen for et AI-system til at træffe beslutninger og udføre handlinger uden ekstern styring inden for et givent domæne.
- autoregressiv modelEn autoregressiv model forudsiger fremtidige værdier i en sekvens baseret på en lineær eller ikke-lineær kombination af tidligere værdier.
- Bayes' theoremBayes' sætning er en matematisk formel, der beskriver den betingede sandsynlighed for en begivenhed givet en anden begivenhed.
- BenchmarkStandardiseret test eller datasæt brugt til at evaluere og sammenligne AI-modellers ydelse.
- benchmark-datasætEn standardiseret samling af data brugt til at evaluere og sammenligne ydeevnen af AI-modeller.
- benchmark-resultatResultatet af en standardiseret evaluering af en AI-models ydeevne på en specifik opgave.
- benchmark-suiteEn samling af standardiserede tests (benchmarks) designet til at evaluere og sammenligne ydeevnen af AI-modeller på tværs af forskellige opgaver.
- betinget forventningDen forventede værdi af en stokastisk variabel givet en anden stokastisk variabel eller begivenhed.
- betinget sandsynlighedsfordelingEn betinget sandsynlighedsfordeling beskriver sandsynligheden for en stokastisk variabel givet, at en anden variabel har en bestemt værdi.
- biasSystematisk afvigelse i en models forudsigelser eller i data, der fører til skæve eller uretfærdige resultater.
- bias test datasætEt datasæt konstrueret til at afsløre og kvantificere skævhed (bias) i en AI-models forudsigelser.
- bias-parameterEn bias-parameter er et justerbart tal i et neuralt netværk, der tilføjes til den vægtede sum af input for at forskyde aktiveringsfunktionen.
- bias-termEn bias-term er en ekstra tilføjelse til en neurons vægtede sum, som muliggør forskydning af aktiveringsfunktionen.
- bias-variance-afvejningKompromis mellem bias (systematisk fejl) og varians (følsomhed over for træningsdata) i en model, der påvirker dens generaliseringsevne.
- bias-varians-afvejningAfvejningen mellem bias (systematisk fejl) og varians (følsomhed over for datasvingninger) i en model, hvor reduktion af den ene typisk øger den anden.
- bias-værdiEn bias-værdi refererer enten til en systematisk afvigelse i en models forudsigelser eller til et konstant led i en lineær model/neuron, der tillader fleksibel tilpasning.
- billedklassifikationBilledklassifikation er opgaven med at tildele en foruddefineret kategori til et inputbillede ved hjælp af en model.
- binary classificationEn klassifikationsopgave, hvor output kun kan tilhøre én af to mulige klasser.
- bounding boxEn rektangulær afgrænsning omkring et objekt i et billede, typisk defineret ved koordinaterne for hjørnerne (x_min, y_min, x_max, y_max) eller (center, bredde, højde).
- chain ruleKædereglen er en matematisk formel til at beregne den afledte af en sammensat funktion, og den er central i backpropagation til at opdatere vægte i neurale netværk.
- Chinchilla scalingChinchilla scaling er et princip inden for scaling laws, der siger at antallet af modelparametre og træningstokens bør skaleres proportionelt (cirka 20 tokens per parameter) for at opnå optimal ydelse for en given computerressource.
- Chinchilla scaling lawEn empirisk lov fra DeepMinds Chinchilla-studie, der siger at modelstørrelse og mængden af træningsdata skal skaleres i samme takt for at opnå optimal ydeevne inden for et givet compute-budget.
- Chinchilla scaling lawsChinchilla scaling laws beskriver det optimale forhold mellem modelstørrelse og mængden af træningsdata for at opnå den bedste performance inden for en given beregningsressource.
- Chinchilla skaleringsloveChinchilla skaleringslove er en samling empiriske fund om det optimale forhold mellem modelstørrelse og træningsdatamængde for sprogmodeller under en fast beregningsbudget, som viste at model og data bør skaleres nogenlunde lige meget.
- Chinchilla-optimalEn træningsstrategi for store sprogmodeller, hvor modelstørrelse og mængde af træningsdata skaleres ligeligt for at opnå optimal udnyttelse af en given beregningsressource.
- chunk-overlap-tokensAntallet af tokens, der overlapper mellem på hinanden følgende tekstchunks i en chunking-strategi.
- chunk-størrelseStørrelsen af de tekststykker (chunks) som et dokument opdeles i før indeksering eller behandling.
- common sense reasoningEvnen til at ræsonnere ud fra almen viden om verden, som mennesker opfatter som indlysende.
- Compute-optimal scalingMetode til at bestemme den optimale fordeling af en given beregningsressource mellem modelstørrelse og træningsdata for at opnå den laveste tabsfunktion.
- computer visionComputer vision er et forskningsfelt inden for kunstig intelligens, der beskæftiger sig med at gøre computere i stand til at fortolke og forstå visuel information fra omverdenen.
- computer vision-systemEt computer vision-system er et integreret sæt af hardware og software, designet til at give computere evnen til at fortolke og forstå visuelle data fra den virkelige verden.
- Concept driftÆndring i den statistiske fordeling af måldata over tid, hvilket får en model til at blive mindre præcis.
- Context windowDet maksimale antal tokens som en sprogmodel samtidig kan tage som input.
- context window lengthDen maksimale mængde tokens en sprogmodel kan behandle i én sekvens.
- context window sizeMaksimalt antal tokens en sprogmodel kan behandle i én sekvens.
- Cost FunctionEn cost function, også kaldet tabsfunktion, kvantificerer forskellen mellem en models forudsigelser og de faktiske værdier.
- CPUCPU'en er computerens centrale processor, der udfører generelle beregninger, men er mindre effektiv end GPU'er til parallelle operationer i AI.
- cross-attention lagFenomen i transformer-modeller hvor kryds-opmærksomhedsmekanismen introducerer en forsinkelse i at tilpasse information mellem kilde- og målsekvens.
- cross-modalBetegnelse for processer, modeller og teknikker der arbejder på tværs af forskellige modaliteter (fx tekst, billede, lyd) for at lære fælles repræsentationer eller udføre opgaver der kræver forståelse af relationer mellem modaliteter.
- cross-modal representationEn repræsentation, der fanger information på tværs af forskellige modaliteter (fx tekst, billede, lyd) i et fælles latent rum.
- CUDA-kerneEn CUDA-kerne er en parallel processor-enhed i NVIDIA's GPU'er, designet til at udføre mange tråde samtidigt.
- dark knowledgeDark knowledge betegner den ekstra information, der ligger i en lærerende models bløde sandsynlighedsfordelinger, og som overføres til en elevmodel under viden destillation.
- Data driftData drift betegner ændringer i fordelingen af inputdata over tid, som kan forringe en models præstation.
- databiasDatabias er systematisk skævhed i et datasæt, der fører til uretfærdige eller ukorrekte resultater i en AI-model.
- datasetEn samling af strukturerede data, typisk bestående af eksempler med træk og eventuelle etiketter, der bruges til at træne, validere eller teste en maskinlæringsmodel.
- datasetsEn struktureret samling af data, typisk brugt til træning og evaluering af maskinlæringsmodeller.
- datasæt-biasSystematisk skævhed i et datasæt, der fører til partiske eller urimelige forudsigelser i en AI-model.
- demographic parityEn fairness-metrik, der kræver, at sandsynligheden for en positiv forudsigelse er den samme på tværs af beskyttede grupper.
- dense rewardEn tæt belønningsfunktion i forstærkningslæring, der giver feedback ved hvert tidskridt.
- direkte prompt injectionEn sårbarhed i LLM'er, hvor en angriber indlejrer ondsindede instruktioner i inputteksten for at tilsidesætte modellens tilsigtede adfærd.
- Discriminative modelEn type model, der lærer at skelne mellem klasser ved direkte at modellere betinget sandsynlighed P(y|x) eller beslutningsgrænsen.
- discriminator lossDiscriminator loss er tabet for diskriminatoren i et GAN, der måler hvor godt den adskiller rigtige fra genererede data.
- disentangled representationEn latent repræsentation, hvor hver dimension uafhængigt kontrollerer én faktor af variation i data.
- disentanglet repræsentationslæringDisentanglet repræsentationslæring er en metode inden for dyb delæring, hvor en models indre repræsentation opdeles i uafhængige, fortolkbare faktorer, så ændring af én faktor kun påvirker én bestemt egenskab i data.
- diskret stokastisk variabelEn stokastisk variabel, der kan antage et endeligt eller tælleligt uendeligt antal værdier.
- distillation temperatureParametret i viden-destillering, der styrer blødheden af sandsynlighedsfordelinger fra lærermodellen.
- distributional robustnessDistributional robustness refererer til en models evne til at opretholde præstation, når testfordelingen afviger fra træningsfordelingen.
- downstream taskEn opgave, der løses ved at finjustere en forudtrænet model på en specifik datamængde.
- dyb læringEn underdisciplin af maskinlæring, der anvender neurale netværk med mange lag til at lære hierarkiske repræsentationer af data.
- egenskabsrumEt flerdimensionelt rum, hvor hver dimension svarer til en egenskab eller et træk ved data.
- ELBOELBO er en nedre grænse for log-sandsynligheden af observerede data, der bruges i variational inference til at approksimere intractable posterior-fordelinger.
- ELBO-decompositionOpdeling af ELBO (Evidence Lower Bound) i komponenter, typisk rekonstruktionsterm og KL-divergens, for at forstå og optimere variational inference-modeller.
- ELBO-objectiveELBO (Evidence Lower Bound) er en nedre grænse for log-marginal likelihood, der bruges som optimeringsmål i variational inference.
- embedding spaceEt flerdimensionalt vektorrum, hvor hvert punkt repræsenterer en entitet (ord, sætning, billede) som en tæt vektor.
- embedding space dimensionDimensionen af det vektorrum, som en embedding-model projicerer data ind i.
- Embedding space-geometriStudiet af de geometriske egenskaber ved det vektorrum, hvor neurale netværks embedding-vektorer ligger, herunder afstande, retninger og struktur.
- embedding-rumEmbedding-rum er et abstrakt vektorrum, hvor diskrete objekter (fx ord, billeder) repræsenteres som kontinuerte vektorer, så semantiske relationer svarer til geometriske afstande og retninger.
- embedding-vektorEn embedding-vektor er en tæt, flerdimensional vektorrepræsentation af et diskret objekt (fx et ord) lært af en neural netværksmodel, så semantisk lignende objekter har ens vektorer.
- embeddingdimensionAntallet af dimensioner i en embedding-vektor, som bestemmer hvor mange egenskaber modellen kan indfange for hvert objekt.
- embeddingspaceEt embeddingspace er et vektorrum, hvor hvert diskret element (fx et ord, billede) repræsenteres af en kontinuert vektor.
- embodied cognitionTeorien om at kognitive processer er formet af kroppens interaktion med verden, ikke kun af hjernens abstrakte beregninger.
- Emergent abilityEvne der opstår i en stor sprogmodel, som ikke var til stede i mindre modeller og ikke var eksplicit trænet for.
- empirisk kumulativ fordelingsfunktionDen empiriske kumulative fordelingsfunktion (ECDF) er en ikke-parametrisk estimator af den sande kumulative fordelingsfunktion, baseret på observerede data.
- encoder-embeddingEn encoder-embedding er en kontekstualiseret vektorrepræsentation af et inputtoken genereret af encoderdelen af en transformerarkitektur.
- end-of-sequence tokenEt specielt token der markerer afslutningen på en sekvens i en sprogmodel.
- environmentI forstærkningslæring og AI-agent-systemer: den verden eller det system, som agenten interagerer med, herunder tilstande, overgange og belønninger.
- environment dynamicsDe regler, der bestemmer, hvordan et miljø ændrer sig som reaktion på en agents handlinger, typisk beskrevet ved en overgangsfunktion i en Markov-beslutningsproces.
- epoch numberAntallet af fulde gennemløb af hele træningsdatasættet under træning af en model.
- epoch-lossTabsfunktionens værdi målt ved slutningen af hver fuld gennemløb (epoke) af træningsdata.
- equal opportunityEqual opportunity (lighed i muligheder) er et fairness-kriterium, der kræver, at en models sande positive rate (TPR) er ens på tværs af værdier af en beskyttet attribut.
- equalized oddsEt fairness-kriterium i maskinlæring, der kræver, at sandsynligheden for en positiv forudsigelse er den samme på tværs af grupper for både positive og negative sande labels.
- ethical AIEtiske AI refererer til udvikling og brug af kunstig intelligens i overensstemmelse med etiske principper som retfærdighed, ansvarlighed, gennemsigtighed og respekt for menneskerettigheder.
- EvalProcessen med at vurdere en models ydeevne på et datasæt, typisk ved brug af metrikker som accuracy, precision, recall eller F1-score.
- eval-målingProces eller metode til at kvantificere en AI-models ydeevne ved hjælp af standardiserede metrikker.
- eval-målingsresultatEn værdi, der angiver en models præstation målt på en bestemt opgave eller benchmark.
- eval-resultatEt eval-resultat er den samlede vurdering af en models ydeevne baseret på et sæt metrikker, såsom nøjagtighed, præcision eller recall.
- EvalueringProces, hvor en kunstig intelligensmodels præstation måles og vurderes ved hjælp af relevante metrikker.
- evalueringsdatasætEt datasæt, der bruges til at måle en models præstation efter træning, typisk for at vurdere generaliseringsevne.
- evalueringsprotokolEn standardiseret fremgangsmåde og sæt af regler for at evaluere en AI-models ydeevne, herunder valg af data, metrikker og evalueringsmetode.
- evalueringssætEt evalueringssæt er en samling data, der bruges til at vurdere en models præstation efter træning.
- expectationForventningsværdi (forventning) er et mål for den gennemsnitlige værdi af en stokastisk variabel, vægtet med sandsynligheder.
- experiment metadataMetadata om et eksperiment, herunder parametre, data, kode, resultater og miljø.
- Experiment trackingSystematisk dokumentation og logning af parametre, data, metrikker og kode for maskinlæringseksperimenter.
- expert capacityEvne for en del af en model til at specialisere sig i og håndtere viden inden for et bestemt domæne.
- ExplainabilityExplainability betegner egenskaben ved et AI-system, at dets beslutninger og adfærd kan forklares på en forståelig måde for mennesker.
- FairnessFairness refererer til princippet om, at AI-systemer ikke må udvise systematisk bias eller diskrimination over for bestemte grupper.
- fairness auditEn fairness audit er en systematisk gennemgang af en AI-model for at identificere og adressere bias og diskrimination.
- fairness constraintEn fairness constraint er en betingelse, der pålægges en model for at sikre, at dens forudsigelser ikke diskriminerer på baggrund af beskyttede karakteristika som køn eller race.
- FeatureEn feature er en individuel, målelig egenskab eller karakteristik af et datapunkt, der bruges som input til en maskinlæringsmodel.
- feature mapEn feature map er en output-matrise fra et konvolutionelt lag i et neuralt netværk, der repræsenterer tilstedeværelsen af specifikke visuelle mønstre i inputdata.
- feature spaceFeature space er et multidimensionelt rum, hvor hver dimension svarer til en feature (træk) ved dataene, og hvert datapunkt er et punkt i dette rum.
- feature vectorEn numerisk repræsentation af et objekts karakteristika (features) som en vektor i et flerdimensionalt rum.
- fine-tuning-datasætEt datasæt, der bruges til at finjustere en fortrænet model til en specifik opgave.
- Forklarbar AIForklarbar AI (XAI) betegner metoder og teknikker, der gør det muligt for mennesker at forstå, fortolke og have tillid til resultater og beslutninger fra kunstig intelligens.
- forklarlig AIForklarlig AI (XAI) betegner metoder og teknikker, der gør kunstig intelligens' beslutninger og forudsigelser forståelige for mennesker.
- ForklarlighedEvnen til at forstå og fortolke, hvordan en AI-model når frem til sine beslutninger eller forudsigelser.
- forsvindende gradientProblem i træning af dybe neurale netværk, hvor gradienterne (hældningerne) bliver eksponentielt mindre, når de bakker gennem netværket, hvilket forhindrer vægtopdateringer i de tidligere lag.
- forsvindende gradient-problemFænomenet hvor gradienterne aftager eksponentielt gennem lagene i et dybt neurale netværk under backpropagation, hvilket gør tidlige lag næsten umulige at træne.
- fortolkelig AIFortolkelig AI refererer til AI-systemer, hvis beslutninger og output kan forstås og forklares af mennesker.
- fortræningsdataData brugt til at træne en AI-model fra bunden, inden eventuel finjustering.
- fortræningsdatasætEt fortræningsdatasæt er en stor samling af tekst-, billed- eller andre data, som en maskinlæringsmodel trænes på i en indledende fase (fortræning) for at lære generelle mønstre og repræsentationer.
- fortræningsfaseDen indledende træning af en maskinlæringsmodel på et stort, ofte ikke-annoteret datasæt for at lære generelle repræsentationer.
- fortræningsmålEt fortræningsmål er den specifikke opgave eller det mål, som en model optimeres mod under den indledende træning på store, umærkede datasæt, før den eventuelt finjusteres til specifikke opgaver.
- foundation-model-arkitekturDen underliggende arkitektur af en foundation model, typisk en transformer-baseret neurale netværksstruktur, der muliggør prætræning på store datasæt.
- foundation-model-træningsdataDe omfattende datasæt, der anvendes til at træne en foundation model, typisk bestående af store mængder ustruktureret tekst, billeder eller andet indhold fra internettet.
- foundation-model-træningsomkostningOmkostningerne ved at træne en foundation-model, typisk målt i GPU-timer, energi og finansielle ressourcer.
- fællessandsynlighedsfordelingEn fællessandsynlighedsfordeling beskriver sandsynligheden for samtidige hændelser af to eller flere stokastiske variable.
- generaliseringEn models evne til at præstere korrekt på nye, usete data efter træning på et begrænset datasæt.
- generaliseringsfejlGeneraliseringsfejl er den fejl, en model begår på nye, hidtil usete data, i modsætning til træningsfejlen.
- generaliseringsgabForskellen mellem en models præstation på træningsdata og på hidtil usete data.
- generalizationEvnen hos en model til at præstere korrekt på nye, usete data efter at være trænet på et begrænset datasæt.
- generalization errorGeneralization error er den forventede fejl på nye, usete data, målt på testfordelingen.
- generalization gapForskellen mellem en models præstation på træningsdata og på hidtil usete testdata.
- generationProcessen hvor en AI-model skaber nye data (f.eks. tekst, billeder, lyd) ud fra en given kontekst eller betingelse.
- generativ AIGenerativ AI er en type kunstig intelligens, der kan skabe nyt indhold som tekst, billeder, lyd eller kode baseret på træningsdata.
- generativ AI-teknologiGenerativ AI-teknologi refererer til systemer, der kan skabe nyt indhold, såsom tekst, billeder, lyd eller kode, ved at lære mønstre fra eksisterende data.
- generativ modelEn generativ model er en statistisk model, der lærer den fælles sandsynlighedsfordeling over data og kan generere nye syntetiske datapunkter.
- global kontekstvektorEn vektorrepræsentation, der opsummerer informationen fra hele inputsekvensen i en transformer- eller seq2seq-model.
- gradientVektor af partielle afledede, der angiver den stejleste stigningsretning for en funktion.
- grounded language learningEn tilgang til sprogindlæring, hvor betydning forankres i perception, handling eller anden ikke-sproglig erfaring.
- GroundingGrounding er processen hvorved en sprogmodel eller et AI-system forbinder symbolske repræsentationer med virkelige verdeners data, såsom billeder, lyd eller fysiske objekter.
- grounding dataData, der bruges til at forankre en AI-models output i faktiske, verificerbare oplysninger.
- grounding moduleEt grounding module er en komponent i en AI-model, der forbinder symbolske repræsentationer (fx sprog) med ikke-symbolske data (fx visuelle eller taktile input) for at give modellen en forståelse af den fysiske verden.
- guardrails-politikEn politik eller sæt af regler, der definerer acceptable grænser for en AI-systemets adfærd og output.
- HallucinationEn hallucination i AI er, når en sprogmodel genererer tekst, der er faktuel forkert, opdigtet eller meningsløs, men som præsenteres med selvsikkerhed.
- hallucinationstendensHallucinationstendens betegner en sprogmodels tilbøjelighed til at generere falsk, men plausibelt klingende information.
- hallucinereAt hallucinere er når en AI-model producerer falsk eller meningsløs information, der præsenteres som fakta.
- handlingsværdfunktionEn funktion der estimerer den forventede samlede fremtidige belønning ved at tage en given handling i en given tilstand og derefter følge en bestemt politik.
- harmlessness objectiveDet mål i RLHF-træning, hvor en AI-model lærer at undgå at generere svar, der kan forårsage skade eller krænke etiske retningslinjer.
- harmlessness training dataHarmlessness training data er træningsdata, der er omhyggeligt udvalgt eller genereret for at lære en AI-model at undgå at producere skadelige, stødende eller farlige outputs.
- hidden layerEt lag i et neuralt netværk, der befinder sig mellem inputlaget og outputlaget og udfører ikke-lineære transformationer af data.
- hyperparameterEn hyperparameter er en konfigurationsparameter, der sættes inden træning og styrer læringsprocessen, i modsætning til modelparametre, som læres fra data.
- ikke linearitetEn egenskab ved en funktion eller model, hvor outputtet ikke er proportionalt med inputtet, hvilket er afgørende for neurale netværks evne til at lære komplekse mønstre.
- implicit biasImplicit bias refererer til systematiske skævheder i en AI-models output, der ikke er bevidst indprogrammeret, men som opstår fra skævheder i træningsdata, modelarkitektur eller træningsproces.
- implicit bias-fældenDen ubevidste og utilsigtede introduktion af bias i AI-systemer, ofte gennem skæve træningsdata eller modelantagelser, som fører til systematisk uretfærdige resultater.
- incremental learning scenarioEn læringssituation hvor en model trænes på en strøm af data, der ankommer over tid, og modellen skal tilpasse sig ny information uden at glemme tidligere læring.
- indlejringEn indlejring er en kompakt, tæt vektorrepræsentation af et diskret element (fx et ord eller token) i et kontinuert vektorrum, typisk lært af en model.
- Inductive biasInductive bias betegner de antagelser, en maskinlæringsalgoritme anvender for at foretrække bestemte hypoteser frem for andre, når den generaliserer fra træningsdata.
- InferenceProcessen hvor en trænet model anvendes på nye data for at generere output såsom forudsigelser, klassifikationer eller tekst.
- inference-timeDen fase i en modellevetid, hvor en trænet model bruges til at generere forudsigelser på nye data.
- inferensProcessen hvor en trænet model anvendes til at lave forudsigelser eller beslutninger på nye data.
- inferenshastighedDen hastighed, hvormed en trænet model behandler inputdata og genererer forudsigelser, typisk målt i tokens per sekund eller samples per sekund.
- information retrievalInformation retrieval er processen med at finde relevante dokumenter eller information i en stor samling baseret på en forespørgsel.
- Intelligent agentEn intelligent agent er en autonom enhed, der opfatter sit miljø gennem sensorer, træffer beslutninger baseret på viden og mål, og handler i miljøet gennem aktuatorer for at opnå et specifikt formål.
- intern repræsentationDen kodning af inputdata, som en neural netværksmodel lærer i sine skjulte lag, og som fanger de relevante strukturer og mønstre.
- intern repræsentationDe indre (skjulte) repræsentationer af data, som en neural netværksmodel lærer i sine skjulte lag.
- internal covariate shiftInternal covariate shift beskriver fænomenet, hvor fordelingen af input til et lag i et neuralt netværk ændrer sig under træning, fordi parametrene i tidligere lag opdateres.
- InterpretabilityInterpretability er en models evne til at give menneskeligt forståelige forklaringer på sine forudsigelser og interne repræsentationer.
- InterpretabilityEvnen til at forstå og forklare, hvordan en AI-model træffer beslutninger.
- invers kumulativ fordelingsfunktionFunktion der givet en sandsynlighed p returnerer den værdi x, for hvilken den kumulative fordelingsfunktion (CDF) er lig p.
- IRLIRL (In Real Life) refererer til den virkelige verden i modsætning til simulerede miljøer, ofte brugt i AI-sammenhænge som reinforcement learning og robotik.
- iterationÉn gennemgang af en gentagen proces, fx et trin i træning af en model.
- jailbreakingJailbreaking betegner bevidst manipulation af prompts eller input for at omgå sikkerhedsmekanismerne i et AI-system, så det producerer skadelige, uetiske eller begrænsede output.
- jordforbindelseJordforbindelse er processen med at knytte sproglige symboler til virkelige verdensobjekter eller sansninger.
- jordforbindelse gennem interaktionEn metode hvorved en AI-model lærer at forbinde sproglige eller abstrakte symboler med fysiske oplevelser og handlinger gennem interaktion med omgivelserne.
- Kaplan scaling lawsKaplan scaling laws beskriver, hvordan modellens tab falder som en potensfunktion af modelstørrelse, datamængde og beregningsressourcer.
- Kaplan skaleringsloveEmpiriske power-law relationer mellem neural netværks test-loss og antallet af parametre, datamængde og træningscompute.
- KL-divergensMål for hvor meget en sandsynlighedsfordeling afviger fra en anden referencefordeling.
- knowledge baseEn struktureret samling af fakta, regler og relationer, der bruges af et AI-system til at understøtte ræsonnement og beslutningstagning.
- Knowledge graphEn knowledge graph er en struktureret repræsentation af enheder og deres relationer, ofte i form af en graf, hvor knuder er enheder og kanter er relationer.
- knowledge representationVidenrepræsentation er den måde, hvorpå viden struktureres og lagres, så et AI-system kan ræsonnere og træffe beslutninger.
- kontekstuelt embeddingEn tæt vektorrepræsentation af et ord eller token, hvor repræsentationen afhænger af den kontekst, ordet optræder i.
- kontekstvektorEn vektor, der repræsenterer en opsummeret kontekst af en inputsekvens, ofte genereret af en encoders sidste skjulte tilstand eller som output fra en attention-mekanisme.
- kontekstvektor-rumEt flerdimensionalt vektorrum, hvor hver dimension repræsenterer et semantisk træk, og ord eller sætninger repræsenteres som vektorer, så semantisk lighed afspejles i geometrisk nærhed.
- kontinuert stokastisk variabelEn stokastisk variabel, der kan antage et uendeligt antal værdier inden for et interval, typisk beskrevet ved en sandsynlighedstæthedsfunktion.
- kumulativ fordelingsfunktionEn funktion der angiver sandsynligheden for, at en stokastisk variabel er mindre end eller lig med en given værdi.
- labeled dataLabeled data er data, hvor hvert eksempel er mærket med den korrekte outputværdi til brug for træning af overvågede maskinlæringsmodeller.
- latent repræsentationEn intern, komprimeret og ofte uobserveret vektor af numeriske værdier, som en model lærer at danne for at repræsentere inputdata på en meningsfuld måde.
- Latent spaceDet abstrakte rum af komprimerede repræsentationer som en generativ model lærer fra data.
- latent space arithmeticLatent space arithmetic betegner teknikken at udføre vektoraritmetik (addition, subtraktion) på repræsentationer i et latent rum for at manipulere eller kombinere begreber.
- latent world modelEn latent world model er en indlejret repræsentation af miljøets dynamik, der læres i et latent rum og bruges til planlægning og kontrol i modelbaseret forstærkningslæring.
- leaderboardEn offentlig rangliste, der viser modellers præstationer på en given opgave eller benchmark.
- lighedsmaalEt mål for hvor ens to objekter eller datapunkter er, ofte brugt i maskinlæring og informationssøgning.
- LLM agentEn LLM-agent er et system, der kombinerer en stor sprogmodel med evnen til at foretage handlinger, bruge værktøjer og planlægge for at nå et mål.
- LLM-baseretBeskriver en løsning, model, system eller funktionalitet der bygger på en stor sprogmodel (LLM).
- Log Loss KurveEn grafisk fremstilling af log loss (cross-entropy) som funktion af træningsiterationer eller epoker, brugt til at vurdere modelkonvergens og overfitting.
- log softmaxEn funktion der kombinerer softmax og logaritme, ofte brugt i neurale netværksklassifikation for numerisk stabilitet.
- logitEn logit er den rå, uomsatte outputværdi fra en model før en aktiveringsfunktion (fx softmax) omdanner den til en sandsynlighed.
- logit-scoreDen rå, unormaliserede værdi som en model producerer før anvendelse af en aktiveringsfunktion som softmax, ofte brugt til at repræsentere sandsynlighedslog-odds.
- logit-softmaxLogit-softmax er kombinationen af de rå scores (logits) fra en models sidste lag og softmax-funktionen, som omdanner dem til en sandsynlighedsfordeling over klasser.
- logitsLogits er de rå, ubehandlede værdier (scorer), som en neural netværksmodel producerer før en aktiveringsfunktion som softmax, typisk i klassifikationsopgaver.
- Loss functionEn funktion der kvantificerer forskellen mellem en models forudsigelser og de sande værdier under træning.
- loss function gradientGradienten af tabsfunktionen angiver retningen og størrelsen af den stejleste stigning af tabet i parameterrummet, og bruges til at opdatere modelparametre under træning via gradientbaseret optimering.
- loss landscapeDet højdimensionelle landskab af tabsfunktionens værdier over modellens parameterrum.
- loss-overfladeDen geometriske overflade, der beskriver værdien af tabsfunktionen over modellens parameterrum.
- manifoldEn manifold er en topologisk mængde, der lokalt ligner euklidisk rum, og som i maskinlæring bruges til at beskrive den underliggende lavdimensionelle struktur i højdimensionelle data.
- manifold learningManifold learning betegner en klasse af ikke-lineære dimensionalitetsreduktionsmetoder, der antager at højdimensionelle data ligger på eller tæt på en lavdimensionel manifold.
- manifold-hypoteseAntagelsen om at højdimensionelle data i virkeligheden ligger på eller nær en laveredimensionel mangfoldighed (manifold) indlejret i det højdimensionelle rum.
- Markov Decision ProcessEn matematisk ramme til modellering af beslutningstagning i stokastiske miljøer, defineret ved tilstande, handlinger, overgangssandsynligheder, belønninger og en diskonteringsfaktor.
- mask tokenEt specialtoken brugt i masked language modeling, som erstatter ord i inputtet, så modellen skal forudsige dem.
- maskinlæringMaskinlæring er et delområde af kunstig intelligens, hvor algoritmer lærer mønstre og sammenhænge fra data uden at være eksplicit programmeret til hver enkelt opgave.
- maskinlæringEn gren af kunstig intelligens, der giver systemer evnen til at lære og forbedre sig fra erfaring uden at være eksplicit programmeret.
- matrixEn rektangulær tabel af tal, symboler eller udtryk arrangeret i rækker og søjler, brugt i lineær algebra og AI-beregninger.
- MemoryI kunstig intelligens betegner memory evnen hos en model eller et system til at lagre og genfinde information over tid.
- mode collapseEn fejltilstand i generative modeller, især GAN'er, hvor generatoren producerer et begrænset sæt af uddata, der kun dækker nogle få tilstande (modes) i datafordelingen i stedet for hele variationen.
- modelEn model er en matematisk eller beregningsmæssig repræsentation, der lærer fra data for at foretage forudsigelser eller beslutninger.
- model calibrationModelkalibrering er processen med at justere en models forudsagte sandsynligheder, så de afspejler den faktiske sandsynlighed for udfald.
- Model cardEt standardiseret dokument, der beskriver en maskinlæringsmodel, herunder dens formål, træningsdata, evalueringsresultater og kendte begrænsninger.
- model card templateEn standardiseret skabelon til at dokumentere en maskinlæringsmodel, herunder formål, ydeevne, begrænsninger og etiske overvejelser.
- Model driftFænomen hvor en maskinlæringsmodel gradvist mister præcision over tid, ofte på grund af ændringer i de underliggende data eller relationer.
- model fortolkningModel fortolkning er processen med at analysere og forklare, hvordan en maskinlæringsmodel træffer beslutninger, herunder hvilke faktorer der har størst betydning for modellens output.
- model registry stageEn tilstand i et model registry, der angiver modellens placering i livscyklussen, f.eks. 'Staging' eller 'Production'.
- model reliabilityEn models evne til at levere stabile, korrekte og forudsigelige resultater under varierende betingelser og over tid.
- model reliability metricsModel reliability metrics er kvantitative mål for en models evne til at levere pålidelige, robuste og kalibrerede forudsigelser under varierende forhold.
- model-interpretabilitetModel-interpretabilitet er egenskaben ved en AI-model, der gør det muligt for mennesker at forstå og forklare dens beslutninger og forudsigelser.
- modelkompleksitetModelkompleksitet betegner en models kapacitet til at indfange mønstre i data, ofte målt ved antal parametre eller modelarkitekturens dybde.
- modelprædiktionEn models output ved inferens baseret på et givent input.
- Multi-agent systemEt system bestående af flere autonome software- eller robotagenter, der interagerer i et fælles miljø for at opnå individuelle eller fælles mål.
- multi-class classificationEn klassifikationsopgave, hvor en model tildeler en instans til én af flere (tre eller flere) gensidigt udelukkende klasser.
- multiagent-systemEt system bestående af flere autonome AI-agenter, der interagerer og samarbejder om at løse opgaver.
- MultimodalMultimodal refererer til AI-systemer, der kan behandle og integrere information fra flere forskellige datatyper såsom tekst, billeder, lyd og video.
- multimodal AIAI-systemer der kan behandle og kombinere flere datatyper som tekst, billeder, lyd og video.
- multimodal dataData der består af eller integrerer information fra flere forskellige modaliteter som tekst, billede, lyd og video.
- multimodal embeddingEn vektorrepræsentation, der kortlægger data fra flere modaliteter (fx tekst og billeder) ind i et fælles latent rum, så lighed på tværs af modaliteter kan måles.
- målalignmentMålalignment er et begreb inden for AI-sikkerhed, der betegner bestræbelserne på at sikre, at kunstig intelligens’ mål og adfærd er i overensstemmelse med menneskelige værdier og intentioner.
- natural language generationNatural Language Generation (NLG) er den gren af naturlig sprogbehandling, der beskæftiger sig med at producere menneskelignende tekst eller tale ud fra data eller struktureret input.
- natural language processingNatural language processing er det tværfaglige felt, der beskæftiger sig med, at computere kan forstå, fortolke og generere menneskeligt sprog.
- natural language understandingNatural language understanding (NLU) er den del af naturlig sprogbehandling (NLP) der fokuserer på maskinel forståelse af betydningen i menneskelig sprog.
- neural scaling lawEn empirisk lov, der beskriver, hvordan en neural netværks testfejl falder som en potensfunktion af modelstørrelse, datasætstørrelse eller beregningsressourcer.
- neural scaling lawsEmpiriske love, der beskriver, hvordan en neurale models ydelse (fx test-loss) skalerer som en potenslov med modelstørrelse, datamængde og beregningsressourcer.
- neuronEn grundlæggende beregningsenhed i et kunstigt neuralt netværk, der modtager input, behandler dem via en vægtet sum og en aktiveringsfunktion og producerer et output.
- normal fordelingNormal fordeling er en kontinuert sandsynlighedsfordeling, der er symmetrisk omkring middelværdien og har en klokkeformet tæthedsfunktion.
- normalfordelingEn normalfordeling er en kontinuert sandsynlighedsfordeling, der beskrives ved en klokkeformet kurve og er defineret ved middelværdi μ og standardafvigelse σ.
- normalfordelingsantagelseAntagelsen om at en given stokastisk variabel eller datasæt følger en normalfordeling.
- numpy-arrayEt N-dimensionelt array-objekt implementeret i NumPy-biblioteket, der muliggør effektive vektor- og matrixoperationer.
- objective functionEn funktion der måler, hvor godt en model opfylder et bestemt mål.
- offline feature storeEt offline feature store er et centralt lager til lagring, styring og genfinding af features, der er optimeret til batch-processering, typisk brugt under modeltræning og evaluering.
- online feature storeEt online feature store er et system til at servere maskinlæringsfunktioner (features) med lav latenstid til brug i produktion.
- ontologiOntologi er en formel, eksplicit specifikation af en delt konceptualisering inden for et domæne.
- ordembeddingEn ordembedding er en tæt, lavdimensionel vektorrepræsentation af et ord, hvor semantisk og syntaktisk lighed afspejles i vektorens afstand.
- ordforrådSæt af unikke tokens (ord eller underord) som en sprogmodel kender og kan generere.
- ordforrådDet sæt af tokens (ord, underord eller tegn) som en sprogmodel eller NLP-system genkender og kan behandle.
- ordforrådsstørrelseAntallet af unikke tokens i en models ordforråd, typisk målt i antal tokens (ord eller underordselementer).
- overfittetOverfittet beskriver en situation hvor en model lærer træningsdataene for godt, inklusive støj og tilfældigheder, og derfor klarer sig dårligt på nye data.
- OverfittingOverfitting opstår når en model lærer støj og tilfældigheder i træningsdata, så den generaliserer dårligt til nye data.
- overgeneraliseringOvergeneralisering betegner en models tendens til at lære for brede eller forkerte mønstre, hvilket fører til dårlig præstation på nye data.
- overvåget læringEn type maskinlæring, hvor modellen trænes på et mærket datasæt med input-output-par for at lære at forudsige output for nye input.
- overvåget læringEn maskinlæringstilgang, hvor en model trænes på et mærket datasæt med input-output-par for at lære en mapping fra input til output.
- ParameterEn variabel i en maskinlæringsmodel, hvis værdi læres fra data under træning.
- parameterantalAntallet af trænbare vægte i en AI-model, der bestemmer modellens kapacitet og kompleksitet.
- parametereffektivitetEvnen hos en model til at opnå høj ydeevne med et begrænset antal parametre.
- parametertalParametertal er det samlede antal af justerbare vægte og biases i en maskinlæringsmodel, som trænes under læring.
- partially observable Markov decision processEn delvist observerbar Markov-beslutningsproces (POMDP) er en generel ramme for beslutningstagning, hvor agenten kun har delvis viden om miljøets tilstand.
- patch-sizePatch-størrelse er et hyperparameter, der angiver de rumlige dimensioner (højde og bredde) af de kvadratiske udsnit, et billede opdeles i, før behandling i en vision transformer eller konvolutionelt neuralt netværk.
- PDFEn sandsynlighedstæthedsfunktion (PDF) beskriver sandsynligheden for, at en kontinuert stokastisk variabel antager en bestemt værdi.
- perception action loopPerception action loop er en grundlæggende cyklus i AI og robotik, hvor en agent sanser sine omgivelser, behandler informationen og udfører en handling, hvilket ændrer omgivelserne og starter en ny cyklus.
- pipelineEn sekvens af databehandlingstrin, hvor output af ét trin er input til det næste, typisk brugt i maskinlæring og datavidenskab.
- PlanningPlanlægning i AI betegner processen med at finde en sekvens af handlinger, der fører fra en starttilstand til en måltilstand.
- policy gradient-teoremPoliy gradient-teoremet angiver en analytisk formel for gradienten af den forventede afkastsum med hensyn til politikparametre i forstærkningslæring.
- power lawEn funktionel sammenhæng hvor én størrelse varierer som en potens af en anden, typisk udtrykt som y = k·x^α; i AI bruges power laws til at beskrive skaleringsforhold som tabsfunktionens afhængighed af data eller parametre.
- power law distributionEn sandsynlighedsfordeling, hvor en lille ændring i én variabel medfører en proportional ændring i en anden variabel, karakteriseret ved en potensfunktion.
- power law scalingEmpirisk observation af, at modelpræstation (fx tab) forbedres som en potensfunktion af stigende mængde data, modelstørrelse eller beregningsressourcer.
- predictionEn models output, når den anvendes på nye inputdata for at estimere en værdi eller klasse.
- prediction errorForskellen mellem en models forudsigelse og den faktiske værdi.
- prediction intervalEt interval inden for hvilket en fremtidig observation forventes at falde med en given sandsynlighed, givet en model.
- Probability distributionEn funktion, der tildeler sandsynligheder til hvert muligt udfald af en stokastisk variabel.
- prompt hijackingEt angreb, hvor en ondsindet prompt overskriver eller manipulerer den oprindelige instruktion i en sprogmodel for at ændre dens opførsel.
- pruning thresholdEn tærskelværdi der afgør, hvilke vægte eller neuroner der fjernes under beskæring af en neural netværksmodel.
- præstationsmetrikMåleenhed for at vurdere en models præstation på en given opgave.
- Q-tableEn tabel, der i forstærkningslæring gemmer den forventede samlede belønning (Q-værdi) for hver kombination af tilstand og handling.
- Quantization errorForskellen mellem den oprindelige værdi og den kvantiserede værdi, når et tal afrundes eller begrænses til et lavere præcisionsformat.
- query key valueDe tre vektorer — forespørgsel (query), nøgle (key) og værdi (value) — der bruges i attention-mekanismen til at beregne opmærksomhedsvægte.
- random variableEn stokastisk variabel er en variabel, hvis værdi bestemmes af et tilfældigt fænomen, og som tildeles sandsynligheder til sine mulige værdier.
- reasoningRæsonnement er evnen til at drage logiske slutninger fra given information, traditionelt forbundet med symbolsystemer og nu også med sprogmodeller.
- red teamerEn person, der udfører systematiske angreb på AI-systemer for at afdække sårbarheder, bias eller sikkerhedsproblemer, ofte som del af en rød-holdsøvelse.
- regressionRegression er en statistisk metode til at modellere forholdet mellem en afhængig variabel og en eller flere uafhængige variable, typisk ved at forudsige et kontinuert tal.
- ReLU activationReLU (Rectified Linear Unit) er en aktiveringsfunktion, der returnerer inputværdien, hvis den er positiv, ellers 0.
- ReLU-aktiveringsfunktionReLU-aktiveringsfunktionen er en ikke-lineær aktiveringsfunktion defineret som f(x) = max(0, x), der anvendes i neurale netværk for at introducere ikke-linearitet.
- representation learningMaskinlæringsteknikker, der automatisk afdækker de optimale repræsentationer af rådata til brug for detektion, klassifikation eller andre opgaver.
- repræsentationslæringRepræsentationslæring er en maskinlæringsteknik, hvor modellen automatisk lærer at omdanne rådata til meningsfulde repræsentationer, der bevarer relevant information til en given opgave.
- reward functionEn reward function er en matematisk funktion i reinforcement learning, der tildeler en numerisk belønning til hver tilstand eller handling for at guide en agents læring.
- reward hackingReward hacking er et fænomen i forstærkningslæring, hvor en agent finder en måde at maksimere en belønningsfunktion på, der ikke stemmer overens med den tilsigtede adfærd, ofte ved at manipulere miljøet eller udnytte ufuldkommenheder i belønningsspecifikationen.
- reward-hacking adfærdAdfærd hos en forstærkningslæringsagent, der udnytter huller i belønningsfunktionen til at opnå høj belønning uden at udføre den tilsigtede opgave.
- reward-hacking angrebEt reward-hacking angreb er en type uønsket adfærd i forstærkningslæring, hvor agenten finder en måde at manipulere belønningsfunktionen på for at opnå høje belønninger uden at fuldføre den tiltænkte opgave.
- RL-agentEn RL-agent er en selvstændig enhed, der interagerer med et miljø ved at vælge handlinger baseret på en politik for at maksimere kumulativ belønning.
- RobustnessEn models evne til at opretholde sin ydeevne under forstyrrelser, såsom støj, modifikationer af input eller ændringer i datafordelingen.
- rule-based systemEt rule-based system er et computersystem, der træffer beslutninger eller udfører handlinger baseret på et sæt foruddefinerede logiske regler (hvis-så).
- SafetyAI safety er et tværfagligt forskningsfelt, der beskæftiger sig med at sikre, at kunstige intelligenssystemer opfører sig pålideligt og ikke forårsager utilsigtet skade.
- safety alignmentProcessen med at sikre, at en AI-handler på en måde, der er i overensstemmelse med menneskelige værdier og undgår utilsigtede skadelige konsekvenser.
- safety-alignedEn sprogmodel der er finjusteret til at følge sikkerhedsretningslinjer og undgå skadelige eller upassende outputs.
- safety-forskningSafety-forskning er det tværfaglige felt, der undersøger, hvordan man sikrer, at AI-systemer handler i overensstemmelse med menneskelige værdier og undgår utilsigtede skadelige konsekvenser.
- sampling biasSampling bias er en systematisk fejl i dataindsamlingen, hvor udvalget ikke repræsenterer den sande population, hvilket fører til skæve modeller.
- sandsynlighedsmassefunktionEn funktion der angiver sandsynligheden for hver mulig værdi af en diskret stokastisk variabel.
- sandsynlighedstæthedEn funktion der beskriver sandsynlighedsfordelingen af en kontinuert stokastisk variabel.
- sandsynlighedstæthedsfunktionEn funktion der beskriver den relative sandsynlighed for at en kontinuert stokastisk variabel antager en given værdi.
- sandsynlighedstæthedsfunktionEn funktion der beskriver sandsynlighedsfordelingen for en kontinuert stokastisk variabel ved at angive den relative tæthed af sandsynlighed i hvert punkt.
- scalarEn skalar er en enkelt numerisk værdi, i modsætning til en vektor, matrix eller tensor.
- scaling hypothesisHypotesen om at modellers præstationer forbedres forudsigeligt efter en potenslov, når modelstørrelse, datamængde og beregningsressourcer øges samtidigt.
- Scaling LawEmpirisk lov der beskriver, hvordan en models performance (f.eks. test-loss) skalerer med modelstørrelse, datamængde og beregningsressourcer.
- Scaling lawsEmpiriske love, der beskriver, hvordan en models ydeevne (fx tab) skalerer med modelstørrelse, datamængde og beregningsressourcer.
- score functionEn funktion der tildeler en numerisk værdi (score) til et data punkt eller en modeloutput, ofte brugt til at kvantificere sandsynlighed, relevans eller kvalitet.
- segmentation maskEn segmenteringsmaske er et binært eller flerklasses billede, der angiver, hvilke pixels der tilhører bestemte objekter eller regioner i et inputbillede.
- semantic embeddingEn tæt vektorrepræsentation af ord, sætninger eller dokumenter, hvor semantisk lighed afspejles i vektorafstand.
- semantisk interpolationTeknik til at generere jævne overgange mellem to punkter i et latent repræsentationsrum, så de mellemliggende punkter opretholder semantisk mening.
- sequence lengthAntallet af tokens (f.eks. ord eller underord) i en sekvens, der behandles af en sprogmodel.
- sequence modelingSequence modeling er opgaven med at forudsige eller generere sekvenser af data ved at lære de underliggende mønstre og afhængigheder mellem elementer i en tidsmæssig rækkefølge.
- sigmoid activationDen sigmoide aktiveringsfunktion er en matematisk funktion, der mapper et reelt tal til et interval mellem 0 og 1, ofte brugt i neurale netværk som en ikke-lineær aktivering.
- sigmoid-aktiveringsfunktionEn matematisk funktion, der mapper et hvilket som helst reelt tal til et tal mellem 0 og 1, ofte brugt som aktiveringsfunktion i neurale netværk.
- sigmoidefunktionEn matematisk funktion, der former input til en S-formet kurve, typisk anvendt til at klemme værdier mellem 0 og 1.
- simulationEn efterligning af en virkelig proces eller et system ved hjælp af en model, ofte en computermodel, inden for kunstig intelligens.
- skalarEn skalar er et enkelt reelt tal, der bruges som størrelse, værdi eller parameter i lineær algebra og maskinlæring.
- skalar multiplikationMultiplikation af en skalær (et enkelt tal) med en vektor eller matrix, hvor hvert element i vektoren/matricen ganges med skalarren.
- skalarfeltEt skalarfelt er en funktion, der til hvert punkt i et rum knytter en enkelt skalarværdi.
- skaleringslov-koefficienterEksponentielle parametre i skaleringslove, der beskriver, hvordan modelfejl (loss) aftager med stigende modelstørrelse, datamængde eller træningsberegning.
- soft targetEn målværdi i form af en sandsynlighedsfordeling over klasser, typisk genereret af en lærermodel, i modsætning til en hård etiket.
- softmax-funktionDen normaliserede eksponentialfunktion der omdanner en vektor af reelle tal til en sandsynlighedsfordeling.
- softmax-temperatureEn temperaturparameter, der skalerer logitterne inden softmax-aktiveringen for at kontrollere fordelingens 'skarphed'.
- softwareagentEn autonom softwareenhed, der opfatter sit miljø, træffer beslutninger og udfører handlinger for at nå specifikke mål.
- sort boksEn sort boks er et AI-system, hvis interne logik og beslutningsproces ikke er synlig eller forståelig for en udenforstående.
- sort boks modelEn model, hvis interne beregninger og beslutningsproces ikke er direkte observerbare eller forståelige for mennesker.
- SOTASOTA står for state-of-the-art og refererer til den bedste opnåede præstation inden for en given opgave.
- sparse rewardSparse reward (sparsom belønning) betegner i forstærkningslæring en situation, hvor agenten kun modtager et belønningssignal sjældent, typisk først efter at have fuldført en hel opgave.
- sparsomhedEgenskaben ved at have mange nullelementer eller ubenyttede parametre i en vektor, matrix eller model.
- special-tokenEt særligt token, som modellen bruger til at markere begyndelse, slutning eller særlige kontekster i en sekvens.
- StandardnormalfordelingStandardnormalfordelingen er en normalfordeling med middelværdi 0 og varians (eller standardafvigelse) 1.
- stateEn intern repræsentation, som en model vedligeholder og opdaterer for at opsummere tidligere informationer i en sekvens eller beslutningsproces.
- state of the artDet højeste præstationsniveau, der på et givet tidspunkt er opnået af et system på en specifik opgave eller benchmark.
- state-of-the-art modelEn state-of-the-art model er den bedst præsterende model inden for et givet domæne på et bestemt tidspunkt.
- stokastisk vektorEn stokastisk vektor er en vektor med ikke-negative elementer, der summerer til 1, og som repræsenterer en sandsynlighedsfordeling over et endeligt antal hændelser.
- SuperalignmentSuperalignment betegner problemet med at sikre, at kunstig intelligens, der overgår menneskelig intelligens, handler i overensstemmelse med menneskelige værdier og intentioner.
- symbol groundingSymbol grounding er problemet med at knytte abstrakte symboler til konkrete, meningsfulde referenter i den virkelige verden.
- symbol grounding problemProblemet med at knytte symbolske repræsentationer til den virkelighed, de skal referere til, så de får betydning.
- symboljordforbindelseProblemstillingen om, hvordan symboler i kunstig intelligens tillægges betydning ved at blive knyttet til virkelige objekter eller fænomener.
- syntetisk datasætSyntetisk datasæt er et datasæt, der er kunstigt genereret frem for indsamlet fra virkelige hændelser, ofte brugt til træning af AI-modeller når reelle data er knappe, følsomme eller dyre.
- syntetiske dataSyntetiske data er kunstigt genererede data, der efterligner virkelige data, og som anvendes til at træne AI-modeller, når reelle data er knappe, følsomme eller skæve.
- Synthetic dataKunstigt genererede data, der efterligner egenskaberne ved virkelige data, skabt via algoritmer eller simulationer.
- sætnings-embedding-vektorEn sætnings-embedding-vektor er en numerisk vektor, der repræsenterer betydningen af en hel sætning i et kontinuerligt vektorrum.
- sætningsembeddingEn sætningsembedding er en numerisk vektorrepræsentation af en hel sætning, der fanger dens semantiske betydning i et kontinuerligt vektorrum.
- tabsfunktionEn funktion i AI-systemer, der giver brugeren mulighed for at skifte mellem forskellige visningsområder eller samtaler.
- tanhDen hyperbolske tangens (tanh) er en matematisk funktion, der som aktiveringsfunktion i neurale netværk mapper inputværdier til intervallet (-1,1).
- target domainDet domæne, som en model skal anvendes på, typisk efter at være trænet på et kildedomæne.
- target taskDen specifikke opgave, som en model er trænet eller finjusteret til at løse.
- task planningPlanlægning af en sekvens af handlinger for at opnå et specifikt mål.
- teacher modelEn stor, prætrænet model der bruges som vejleder i videnoverførsel (knowledge distillation) til at træne en mindre 'elevmodel'.
- temperaturparameterEn parameter, der styrer fordelingens 'skarphed' i softmax-funktionen, så en høj temperatur giver mere tilfældige outputs og en lav temperatur giver mere deterministiske outputs.
- TensorEn tensor er en matematisk struktur, der generaliserer skalarer, vektorer og matricer til et vilkårligt antal dimensioner, og som er den grundlæggende datatype i maskinlæringsbiblioteker som TensorFlow og PyTorch.
- tensor core-accelereretBetegnelse for beregninger, typisk matrixmultiplikationer, der udføres ved hjælp af specialiserede tensor cores i GPU'er for at opnå højere gennemstrømning og energieffektivitet.
- tensorproduktEn matematisk operation, der kombinerer to tensorer til en ny tensor med højere rang, defineret som ydre produkt generaliseret til flerdimensionale arrays.
- test sætDel af et datasæt der holdes adskilt fra træning og validering, og kun bruges til at evaluere modellens endelige ydeevne efter al træning.
- test sætEt test sæt er en delmængde af data, der anvendes til at evaluere en maskinlæringsmodels ydeevne efter træning.
- testdatasætEt testdatasæt er en mængde data, der bruges til at evaluere en trænet models ydeevne på hidtil usete data.
- testdatasætEt testdatasæt er en samling data, der bruges til at evaluere en maskinlæringsmodel efter træning, for at vurdere dens generaliseringsevne på nye, usete data.
- tilstandsværdifunktionFunktion der angiver den forventede kumulative belønning fra en given tilstand under en given politik.
- TokenEn token er den mindste enhed af tekst, som en sprogmodel behandler, typisk et ord, en underdel af et ord eller et tegn.
- Token-grænseMaksimalt antal tokens en sprogmodel kan behandle i én forespørgsel eller session.
- token-grænseoverskridelseSituation hvor en tokenisation af en tekst resulterer i at en meningsfuld enhed deles på tværs af to segmenter, fx i forbindelse med vinduesbaseret behandling af lange dokumenter.
- token-idEn numerisk identifikator, der entydigt repræsenterer et token i en models ordforråd.
- TPU-podEn TPU-pod er en samling af Tensor Processing Units (TPU'er), der er forbundet via et højhastighedsnetværk til stor-skala parallel databehandling og træning af maskinlæringsmodeller.
- transparensTransparens i AI refererer til graden, hvor et AI-systems funktion, beslutningsprocesser og data er åbne, forståelige og forklarbare for interessenter.
- transparensrapportEn transparensrapport er et dokument, hvor en organisation offentliggør detaljerede oplysninger om sin brug af kunstig intelligens, herunder datasæt, modelarkitektur, biasvurderinger og etiske retningslinjer.
- træningProcessen hvor en maskinlæringsmodel optimerer sine parametre ved at lære fra data gennem gentagne iterationer.
- træningsdataData der bruges til at træne en maskinlæringsmodel, så den lærer mønstre og sammenhænge.
- træningsdatasætEt træningsdatasæt er en samling af data, der bruges til at træne en maskinlæringsmodel ved at justere dens parametre.
- træningsegenskaberTræningsegenskaber er de konfigurerbare parametre og indstillinger, der styrer en maskinlæringsmodel under træning, såsom learning rate, batch size og antal epoker.
- træningssætEt træningssæt er en samling af dataeksempler, der bruges til at træne en maskinlæringsmodel.
- tæthedsfunktionEn tæthedsfunktion er en funktion, der beskriver sandsynlighedstætheden af en kontinuert stokastisk variabel i et givet punkt.
- UnderfittingUnderfitting opstår, når en model er for enkel til at fange datasættets underliggende mønstre.
- underrumEt underrum er en delmængde af et vektorrum, der selv er et vektorrum under de samme operationer.
- unlabeled dataData uden tilhørende etiketter eller annotations.
- Unsupervised learningEn maskinlæringstype, hvor modellen lærer mønstre udelukkende fra ustrukturerede data uden foruddefinerede etiketter eller målvariable.
- valideringsdatasætValideringsdatasæt er et datasæt, der anvendes til at evaluere modelens præstation under træning uden at påvirke modelparametrene direkte.
- value alignmentProblemstillingen med at designe kunstig intelligens, så dens mål og handlinger konsekvent stemmer overens med menneskelige værdier og intentioner.
- value functionEn funktion, der estimerer den forventede fremtidige belønning (afkast) for en given tilstand (eller tilstand-handling-par) under en bestemt politik.
- vanishing gradientFænomenet hvor gradienter (afledte) bliver eksponentielt mindre, når de backpropageres gennem mange lag i et dybt neuralt netværk, hvilket gør træning af tidlige lag ineffektiv.
- vanishing gradient problemProblem i træning af dybe neurale netværk, hvor gradienterne af tabsfunktionen bliver eksponentielt mindre, når de bakker tilbage gennem lagene, hvilket forhindrer vægtopdateringer i de tidlige lag.
- varianceVarians er et mål for, hvor meget en stokastisk variabel spreder sig omkring sin middelværdi; i machine learning refererer det til modellens følsomhed over for små ændringer i træningsdata.
- VectorEn vektor er en ordnet liste af tal, der repræsenterer et punkt i et flerdimensionalt rum, og som bruges til at beskrive data, funktioner eller modellens interne tilstande i AI.
- vektorEn vektor er en ordnet liste af tal, der repræsenterer et punkt i et flerdimensionalt rum, ofte brugt til at repræsentere data som ord eller billeder i AI.
- vektorrepræsentationEn numerisk fremstilling af data som en vektor i et flerdimensionelt rum, hvor lighed afspejles i geometriske afstande.
- vektorrepræsentationslæringLæring af en transformation, der kortlægger rådata til en kompakt, meningsfuld vektorrepræsentation, som bevarer relevante strukturer og relationer.
- vektorrepræsentationsrumEt matematisk rum, hvor hvert element (fx et ord eller en sætning) er repræsenteret som en vektor, således at semantiske relationer afspejles i geometriske afstande og retninger.
- vektorrumEt vektorrum er en matematisk struktur bestående af en mængde vektorer, der kan adderes og multipliceres med skalarer under bestemte aksiomer.
- vægtEn vægt er en lærbar parameter i et neuralt netværk, der multipliceres med input for at beregne output, og som justeres under træning.
- vægtmatrixEn matrix af justerbare parametre i et neuralt netværk, der transformerer input til output ved lineær transformation.
- værdialignmentVærdialignment betegner problemstillingen med at sikre, at kunstig intelligens handler i overensstemmelse med menneskelige værdier og intentioner.
- WeightEn parameter i et neuralt netværk, der justeres under træning for at minimere tabsfunktionen og bestemmer styrken af forbindelsen mellem neuroner.
- working memoryWorking memory er en mekanisme i neurale netværk og sprogmodeller, der midlertidigt lagrer og manipulerer information under behandling af en opgave.
- World modelEn intern repræsentation af omgivelserne, som en AI-agent bruger til at forudsige fremtidige tilstande og planlægge handlinger.
- world model agentEn AI-agent der konstruerer og anvender en intern model af omverdenen til at forudsige fremtidige tilstande og planlægge handlinger.
- XAIXAI (Explainable Artificial Intelligence) betegner metoder og teknikker der gør AI-systemers beslutninger og output forståelige og fortolkbare for mennesker.
- XAIXAI betegner metoder og teknikker, der gør det muligt for mennesker at forstå og fortolke, hvordan AI-systemer træffer beslutninger.
- zero-shot classifierEn zero-shot classifier er en klassifikationsmodel, der kan forudsige klasser, som den ikke er blevet eksplicit trænet på, ved at udnytte semantisk information fra en separat repræsentation.
- åbent ordforrådEt åbent ordforråd betyder, at en model kan håndtere ord eller tokens, der ikke er set under træning, typisk ved hjælp af underordsenheder eller karakterbaserede repræsentationer.