begynder

287 termer

accuracyAccuracy er en metrik, der angiver andelen af korrekte forudsigelser ud af alle forudsigelser.
accuracy scoreAccuracy score er en metrik, der måler andelen af korrekte forudsigelser ud af alle forudsigelser i en klassifikationsmodel.
Activation functionEn aktiveringsfunktion er en matematisk funktion, der bestemmer outputtet af en neuron i et neuralt netværk baseret på dens input.
activation layerEt aktiveringslag er et lag i et neuralt netværk, der anvender en ikke-lineær funktion på inputtet for at introducere ikke-linearitet.
AgentEn agent er en enhed, der sanser sit miljø og handler på baggrund af det for at nå specifikke mål.
AI safetyAI safety er et forsknings- og praksisfelt, der beskæftiger sig med at sikre, at kunstig intelligens-systemer er pålidelige, robuste og ikke forårsager utilsigtede skader.
AI-assisteret kodningBrug af kunstig intelligens til at generere, foreslå eller fuldføre kildekode.
AI-kodningsassistentAI-baseret værktøj der hjælper udviklere med at skrive, forstå og debugge kode.
AI-moderationAnvendelse af kunstig intelligens til automatisk at overvåge og regulere indhold på digitale platforme.
AI-sikkerhedAI-sikkerhed er forskning og praksis, der sigter mod at sikre, at kunstig intelligens-systemer handler i overensstemmelse med menneskelige værdier og ikke forårsager utilsigtet skade.
aktiveringsfunktionEn aktiveringsfunktion er en matematisk funktion, der anvendes på outputtet af en neuron i et neuralt netværk for at introducere ikke-linearitet og bestemme, om neuronen skal aktiveres.
ANNEt ANN (kunstigt neuralt netværk) er et computersystem opbygget af sammenkoblede noder (neuroner) der kan indlære mønstre fra data.
APIAPI er et sæt af definerede regler og protokoller, der gør det muligt for softwareapplikationer at kommunikere og udveksle data.
API queryEn API query er en anmodning sendt til et API-endepunkt for at hente eller manipulere data, typisk brugt til at interagere med sprogmodeller.
API-endepunktEn specifik URL eller adresse, som en API anvender til at modtage anmodninger og sende svar.
API-nøgleEn API-nøgle er en unik streng, der autentificerer en bruger eller applikation ved kald til en API, ofte brugt til at kontrollere adgang til AI-tjenester.
argmaxArgumentet (inputværdien) der maksimerer en given funktion.
arrayEn ordnet samling af elementer, typisk af samme datatype, indekseret med heltal.
array-indekseringTeknik til at vælge enkeltelementer eller udsnit af et array ved brug af indeksnumre, udsnit, boolske betingelser eller lister af indeks.
attributEn attribut er en egenskab eller et kendetegn ved en datapost, typisk repræsenteret som en kolonne i et datasæt.
Batch inferenceBatch inference er processen med at udføre modelinferens på en gruppe af input samples på én gang for at udnytte hardwareparallelisme og øge gennemløb.
batch sizeAntallet af træningseksempler, der behandles i én iteration under træning af en model.
batch-størrelseBatch-størrelse er antallet af træningseksempler, der behandles samtidigt i en enkelt iteration under træning af en maskinlæringsmodel.
BenchmarkStandardiseret test eller datasæt brugt til at evaluere og sammenligne AI-modellers ydelse.
benchmark scoreEn benchmark-score er en numerisk værdi, der repræsenterer en models præstation på en standardiseret test.
benchmark-datasætEn standardiseret samling af data brugt til at evaluere og sammenligne ydeevnen af AI-modeller.
benchmark-resultatResultatet af en standardiseret evaluering af en AI-models ydeevne på en specifik opgave.
benchmark-suiteEn samling af standardiserede tests (benchmarks) designet til at evaluere og sammenligne ydeevnen af AI-modeller på tværs af forskellige opgaver.
benchmark-testEn standardiseret test eller evalueringsprocedure, der anvendes til at sammenligne ydeevnen af forskellige AI-modeller eller algoritmer.
betinget sandsynlighedsfordelingEn betinget sandsynlighedsfordeling beskriver sandsynligheden for en stokastisk variabel givet, at en anden variabel har en bestemt værdi.
biasSystematisk afvigelse i en models forudsigelser eller i data, der fører til skæve eller uretfærdige resultater.
bias-parameterEn bias-parameter er et justerbart tal i et neuralt netværk, der tilføjes til den vægtede sum af input for at forskyde aktiveringsfunktionen.
bias-termEn bias-term er en ekstra tilføjelse til en neurons vægtede sum, som muliggør forskydning af aktiveringsfunktionen.
billedgenerationBilledgeneration er processen med at skabe nye billeder fra en given beskrivelse eller betingelse ved hjælp af en AI-model.
billedklassifikationBilledklassifikation er opgaven med at tildele en foruddefineret kategori til et inputbillede ved hjælp af en model.
billedklassifikationsmodelEn model, der trænes til at tildele et inputbillede en etiket fra et foruddefineret sæt klasser.
binary classificationEn klassifikationsopgave, hvor output kun kan tilhøre én af to mulige klasser.
bounding boxEn rektangulær afgrænsning omkring et objekt i et billede, typisk defineret ved koordinaterne for hjørnerne (x_min, y_min, x_max, y_max) eller (center, bredde, højde).
chat completionChat completion er en metode, hvor en sprogmodel genererer et svar baseret på en sekvens af beskeder i en samtale.
chat completion endpointEn API-endpoint, der accepterer en liste af beskeder og returnerer et modelgenereret svar.
ChatGPTChatGPT er en chatbott baseret på OpenAI's GPT-sprogmodel, der er finjusteret til samtale.
CheckpointEn gemt kopi af en models vægte og træningstilstand på et bestemt tidspunkt under træning.
chunk-overlapChunk-overlap er den mængde af tegn eller tokens, der deles mellem to på hinanden følgende tekstbidder ved opdeling af et dokument.
ChunkingOpdeling af tekst i mindre enheder (chunks) for at optimere indeksering, søgning og indlejring i sprogmodeller.
classificationClassification er en overvåget læringsopgave, hvor modellen forudsiger en kategorisk etiket for en input baseret på trænede klasser.
classification modelEn model, der forudsiger en diskret klasse (kategori) for en given input.
computer visionComputer vision er et forskningsfelt inden for kunstig intelligens, der beskæftiger sig med at gøre computere i stand til at fortolke og forstå visuel information fra omverdenen.
confusion matrix heatmapEn confusion matrix heatmap er en grafisk repræsentation af en forvirringsmatrix, hvor celleværdier farvekodes for at visualisere klassifikationsydelse.
content moderationProcessen med at overvåge, filtrere og håndtere brugergenereret indhold for at sikre overholdelse af retningslinjer og love.
Context windowDet maksimale antal tokens som en sprogmodel samtidig kan tage som input.
context window truncationTeknik til at forkorte en inputsekvens til den maksimale kontekststørrelse, som en sprogmodel kan håndtere, ved at fjerne dele af teksten.
cosine lighedCosine lighed er et mål for, hvor ens to ikke-nul-vektorer er i retning, uafhængigt af deres længde, beregnet som cosinus til vinklen mellem dem.
CPUCPU'en er computerens centrale processor, der udfører generelle beregninger, men er mindre effektiv end GPU'er til parallelle operationer i AI.
Data augmentationTeknik til at øge mængden af træningsdata ved at anvende transformationer på eksisterende data.
Data labelingProcessen med at tilføje metadata (labels) til rådata for at gøre dem anvendelige til træning af overvågede maskinlæringsmodeller.
Data Labeling PipelineEn data-labeling-pipeline er en struktureret arbejdsgang til at tildele etiketter til rådata, så de kan bruges til træning af overvågede maskinlæringsmodeller.
Data pipelineEn datapipeline er en sekvens af databehandlingstrin, der transporterer og transformerer rådata fra kilde til destinationssystem, ofte til brug i maskinlæringsmodeller.
data-labeling-platformEn softwareplatform til at oprette, administrere og kvalitetssikre annoteringer af data til træning af maskinlæringsmodeller.
data-labeling-toolSoftwareværktøj til manuel eller semiautomatisk annotering af data (fx billeder, tekst, lyd) med etiketter til træning af maskinlæringsmodeller.
datasetEn samling af strukturerede data, typisk bestående af eksempler med træk og eventuelle etiketter, der bruges til at træne, validere eller teste en maskinlæringsmodel.
datasetsEn struktureret samling af data, typisk brugt til træning og evaluering af maskinlæringsmodeller.
Discriminative modelEn type model, der lærer at skelne mellem klasser ved direkte at modellere betinget sandsynlighed P(y|x) eller beslutningsgrænsen.
diskret stokastisk variabelEn stokastisk variabel, der kan antage et endeligt eller tælleligt uendeligt antal værdier.
dyb læringEn underdisciplin af maskinlæring, der anvender neurale netværk med mange lag til at lære hierarkiske repræsentationer af data.
dybt neuralt netværkEt neuralt netværk med flere skjulte lag mellem input- og outputlaget, hvilket muliggør indlæring af komplekse hierarkiske repræsentationer.
EmbeddingEn embedding er en kompakt, tæt vektorrepræsentation af et objekt (fx et ord, en sætning eller et billede) i et kontinuert vektorrum, hvor semantisk lighed svarer til geometrisk nærhed.
embedding-vektorEn embedding-vektor er en tæt, flerdimensional vektorrepræsentation af et diskret objekt (fx et ord) lært af en neural netværksmodel, så semantisk lignende objekter har ens vektorer.
end-of-sequence tokenEt specielt token der markerer afslutningen på en sekvens i en sprogmodel.
environmentI forstærkningslæring og AI-agent-systemer: den verden eller det system, som agenten interagerer med, herunder tilstande, overgange og belønninger.
EpochEn epoch er én gennemgang af hele træningsdatasættet under træning af en maskinlæringsmodel.
epoch numberAntallet af fulde gennemløb af hele træningsdatasættet under træning af en model.
epoch-lossTabsfunktionens værdi målt ved slutningen af hver fuld gennemløb (epoke) af træningsdata.
epoch-loss curveEn graf, der viser trænings- og valideringstab som funktion af antallet af epoker under træning af en model.
epoch-loss plotEn graf der viser tabet efter hver epoke under træning af en maskinlæringsmodel.
ethical AIEtiske AI refererer til udvikling og brug af kunstig intelligens i overensstemmelse med etiske principper som retfærdighed, ansvarlighed, gennemsigtighed og respekt for menneskerettigheder.
EvalProcessen med at vurdere en models ydeevne på et datasæt, typisk ved brug af metrikker som accuracy, precision, recall eller F1-score.
eval-målingEn eval-måling er en kvantitativ målestok, der bruges til at vurdere en AI-models præstation på en specifik opgave.
eval-målingsresultatEn værdi, der angiver en models præstation målt på en bestemt opgave eller benchmark.
eval-resultatEt eval-resultat er den samlede vurdering af en models ydeevne baseret på et sæt metrikker, såsom nøjagtighed, præcision eller recall.
evaluation metricEn evaluation metric er en kvantitativ måling, der bruges til at vurdere en models præstation på en given opgave.
EvalueringProces, hvor en kunstig intelligensmodels præstation måles og vurderes ved hjælp af relevante metrikker.
evalueringsmetrikEn evalueringsmetrik er en kvantitativ måling, der bruges til at vurdere en models præstation på en given opgave.
evalueringssætEt evalueringssæt er en samling data, der bruges til at vurdere en models præstation efter træning.
FeatureEn feature er en individuel, målelig egenskab eller karakteristik af et datapunkt, der bruges som input til en maskinlæringsmodel.
feature extractionFeature extraction er processen med at omdanne rådata til et sæt meningsfulde attributter (features), der kan bruges til maskinlæring eller mønstergenkendelse.
feature vectorEn numerisk repræsentation af et objekts karakteristika (features) som en vektor i et flerdimensionalt rum.
feedforward neural networkEt neuralt netværk, hvor informationen flyder i én retning fra input til output uden tilbageløb.
fine-tuning-datasætEt datasæt, der bruges til at finjustere en fortrænet model til en specifik opgave.
forklarlig AIForklarlig AI (XAI) betegner metoder og teknikker, der gør kunstig intelligens' beslutninger og forudsigelser forståelige for mennesker.
ForklarlighedsværktøjEt værktøj der genererer forklaringer på, hvordan en AI-model når frem til en given beslutning eller forudsigelse.
fortrænet modelEn fortrænet model er en maskinlæringsmodel, der er trænet på et stort datasæt og derefter tilpasses til en specifik opgave gennem finjustering.
forudtrænet billede-modelEn forudtrænet billede-model er en neural netværksmodel, der er trænet på et stort datasæt af billeder og efterfølgende anvendes som udgangspunkt for andre opgaver.
ForudtræningForudtræning er en teknik, hvor en model først trænes på en stor, generel datasæt for at lære bredrepræsentationer, før den finjusteres på en specifik opgave.
generationProcessen hvor en AI-model skaber nye data (f.eks. tekst, billeder, lyd) ud fra en given kontekst eller betingelse.
generativ AIGenerativ AI er en type kunstig intelligens, der kan skabe nyt indhold som tekst, billeder, lyd eller kode baseret på træningsdata.
generativ AI-modelEn type kunstig intelligens-model, der lærer at generere nye datapunkter lignende dets træningsdata.
generativ AI-teknologiGenerativ AI-teknologi refererer til systemer, der kan skabe nyt indhold, såsom tekst, billeder, lyd eller kode, ved at lære mønstre fra eksisterende data.
Generative modelEn generativ model er en type maskinlæringsmodel, der lærer den underliggende fordeling af træningsdata og kan generere nye, realistiske datapunkter.
GenkaldelsesrateGenkaldelsesrate måler andelen af relevante positive instanser, der identificeres korrekt af modellen.
GPTGPT er en type sprogmodel baseret på transformeren, der er fortrænet på store tekstmængder og finjusteret til forskellige opgaver.
GPT-3GPT-3 er en stor sprogmodel udviklet af OpenAI, der kan generere menneskelignende tekst baseret på inputprompts.
GPUEn specialiseret processor designet til parallel behandling, der anvendes i kunstig intelligens til at accelerere træning og inferens af neurale netværk.
GPU-accelerationGPU-acceleration er brug af en grafikprocessor (GPU) til at udføre parallelle beregninger hurtigere end en almindelig CPU.
GPU-accelereretGPU-accelereret betyder at udnytte en grafikprocessor (GPU) til at udføre beregninger hurtigere end en almindelig CPU, især til parallelle opgaver som træning af neurale netværk.
gradientVektor af partielle afledede, der angiver den stejleste stigningsretning for en funktion.
Gradient descent optimizerEn optimeringsalgoritme der iterativt minimerer en tabsfunktion ved at opdatere modellens parametre i retning af den negative gradient.
Gradio SpaceGradio Space er en cloud-baseret platform fra Hugging Face til at hoste og dele interaktive maskinlæringsdemoer bygget med Gradio.
greedy searchGreedy search er en dekodningsstrategi, der ved hvert trin vælger det mest sandsynlige næste token uden at overveje fremtidige konsekvenser.
Guardrail ValidatorEn komponent eller system, der kontrollerer AI-output mod foruddefinerede sikkerhedsregler (guardrails) for at forhindre skadeligt eller uhensigtsmæssigt indhold.
HallucinationEn hallucination i AI er, når en sprogmodel genererer tekst, der er faktuel forkert, opdigtet eller meningsløs, men som præsenteres med selvsikkerhed.
hallucinereAt hallucinere er når en AI-model producerer falsk eller meningsløs information, der præsenteres som fakta.
hidden layerEt lag i et neuralt netværk, der befinder sig mellem inputlaget og outputlaget og udfører ikke-lineære transformationer af data.
Hugging FaceHugging Face er en virksomhed og platform, der udvikler open-source-værktøjer til maskinlæring, især Transformers-biblioteket og Model Hub.
Hugging Face HubHugging Face Hub er en central platform til deling og versionering af maskinlæringsmodeller, datasæt og demoapplikationer.
Hugging Face SpacesHugging Face Spaces er en cloud-baseret platform til at hoste, dele og demonstrere machine learning-modeller gennem interaktive apps og demos.
Hugging Face Transformers pipelineEn højniveaufunktion fra Hugging Face Transformers-biblioteket, der gør det muligt at anvende fortrænede modeller til specifikke NLP-opgaver med få linjer kode.
ikke linearitetEn egenskab ved en funktion eller model, hvor outputtet ikke er proportionalt med inputtet, hvilket er afgørende for neurale netværks evne til at lære komplekse mønstre.
ikke-superviseret læringEn maskinlæringsmetode, hvor modellen lærer mønstre i data uden brug af forhåndsannoterede labels.
image augmentationTeknik til at øge mangfoldigheden af træningsdata ved at anvende tilfældige, men realistiske transformationer på eksisterende billeder.
Image classificationBilledklassifikation er opgaven at tildele et klassemærke til et inputbillede baseret på dets visuelle indhold.
indholdsmodereringssystemEt indholdsmodereringssystem er et automatiseret eller menneskeligt system, der vurderer og filtrerer brugeroprettet indhold for at forhindre spredning af skadelige, upassende eller ulovlige materialer.
indlejringEn indlejring er en kompakt, tæt vektorrepræsentation af et diskret element (fx et ord eller token) i et kontinuert vektorrum, typisk lært af en model.
InferenceProcessen hvor en trænet model anvendes på nye data for at generere output såsom forudsigelser, klassifikationer eller tekst.
inference-modeI inferens-tilstand kører en model uden træning, kun til at lave forudsigelser.
inferensProcessen hvor en trænet model anvendes til at lave forudsigelser eller beslutninger på nye data.
inferenshastighedDen hastighed, hvormed en trænet model behandler inputdata og genererer forudsigelser, typisk målt i tokens per sekund eller samples per sekund.
information retrievalInformation retrieval er processen med at finde relevante dokumenter eller information i en stor samling baseret på en forespørgsel.
IRLIRL (In Real Life) refererer til den virkelige verden i modsætning til simulerede miljøer, ofte brugt i AI-sammenhænge som reinforcement learning og robotik.
iterationÉn gennemgang af en gentagen proces, fx et trin i træning af en model.
k-meansEn clustering-algoritme, der deler et datasæt i k grupper ved at minimere den samlede afstand mellem punkterne og deres nærmeste gruppecentrum.
Keras-layerEn byggesten i Keras-modeller, der transformerer data gennem en eller flere operationer såsom fuldt forbundne lag, konvolutioner eller aktiveringsfunktioner.
Keras-modulEt Keras-modul er en byggesten i Keras-biblioteket, typisk et lag eller en modeldefinition, der bruges til at konstruere neurale netværk.
knowledge baseEn struktureret samling af fakta, regler og relationer, der bruges af et AI-system til at understøtte ræsonnement og beslutningstagning.
kontinuert stokastisk variabelEn stokastisk variabel, der kan antage et uendeligt antal værdier inden for et interval, typisk beskrevet ved en sandsynlighedstæthedsfunktion.
konvolutionelt neuralt netværkEt konvolutionelt neuralt netværk (CNN) er en type neurale netværk, der anvender konvolutionelle lag til at lære hierarkiske repræsentationer fra data med grid-lignende topologi, især billeder.
labeled dataLabeled data er data, hvor hvert eksempel er mærket med den korrekte outputværdi til brug for træning af overvågede maskinlæringsmodeller.
labelingProcessen med at tildele etiketter (labels) til data som grundlag for træning af en maskinlæringsmodel.
lagEt lag er en samling af neuroner eller enheder i et neuralt netværk, der behandler input og sender output til næste lag.
language modelEn sprogmodel er en statistisk eller neural model, der tillægger en sandsynlighed til en sekvens af ord eller tokens.
leaderboardEn offentlig rangliste, der viser modellers præstationer på en given opgave eller benchmark.
lighedsmaalEt mål for hvor ens to objekter eller datapunkter er, ofte brugt i maskinlæring og informationssøgning.
lineær interpolationEn metode til at estimere en værdi mellem to kendte punkter ved at antage en lineær sammenhæng.
lineær regressionEn statistisk metode der modellerer sammenhængen mellem en afhængig variabel og en eller flere uafhængige variable ved at tilpasse en lineær ligning til observerede data.
LLMEn LLM (Large Language Model) er en neural netværksbaseret model, typisk en transformer, trænet på enorme tekstmængder til at generere og forstå menneskeligt sprog.
LLM-baseretBeskriver en løsning, model, system eller funktionalitet der bygger på en stor sprogmodel (LLM).
log lossLog loss er en tabsfunktion, der måler, hvor godt en klassifikationsmodels forudsagte sandsynligheder passer til de faktiske klasser, med en lavere værdi, der indikerer bedre ydeevne.
logit-softmaxLogit-softmax er kombinationen af de rå scores (logits) fra en models sidste lag og softmax-funktionen, som omdanner dem til en sandsynlighedsfordeling over klasser.
mask tokenEt specialtoken brugt i masked language modeling, som erstatter ord i inputtet, så modellen skal forudsige dem.
maskinlæringMaskinlæring er et delområde af kunstig intelligens, hvor algoritmer lærer mønstre og sammenhænge fra data uden at være eksplicit programmeret til hver enkelt opgave.
maskinlæringEn gren af kunstig intelligens, der giver systemer evnen til at lære og forbedre sig fra erfaring uden at være eksplicit programmeret.
matrixEn rektangulær tabel af tal, symboler eller udtryk arrangeret i rækker og søjler, brugt i lineær algebra og AI-beregninger.
metrikEn metrik er en kvantitativ måling, der bruges til at evaluere eller sammenligne præstationen af en AI-model.
mini batchMini batch er en delmængde af træningsdata, der bruges til at beregne gradienten og opdatere modelvægtene i én iteration under træning af neurale netværk.
modelEn model er en matematisk eller beregningsmæssig repræsentation, der lærer fra data for at foretage forudsigelser eller beslutninger.
Model cardEt standardiseret dokument, der beskriver en maskinlæringsmodel, herunder dens formål, træningsdata, evalueringsresultater og kendte begrænsninger.
model-checkpointEn gemt tilstand af en models vægte og optimeringstilstand under træning, så processen kan genoptages eller evalueres senere.
modelarkitekturBetegnelse for en maskinlæringsmodel overordnede struktur, herunder antal lag, lagtyper og forbindelser mellem dem.
modelprædiktionEn models output ved inferens baseret på et givent input.
modeltræningProcessen med at justere en models parametre, så den minimerer en tabsfunktion på træningsdata.
multi-klasse billedklassifikationMulti-klasse billedklassifikation er opgaven at tildele et inputbillede én klasseetikette fra et foruddefineret sæt af flere (≥3) kategorier, typisk ved hjælp af en maskinlæringsmodel.
Naive BayesEn familie af probabilistiske klassifikationsalgoritmer baseret på Bayes' sætning med antagelse om betinget uafhængighed mellem features givet klassen.
natural language processingNatural language processing er det tværfaglige felt, der beskæftiger sig med, at computere kan forstå, fortolke og generere menneskeligt sprog.
Neural networkEt neuralt netværk er en beregningsmodel inspireret af hjernens struktur, bestående af lag af sammenkoblede noder (neuroner) der lærer mønstre fra data.
Neuralt netværkEt neuralt netværk er en beregningsmodel inspireret af hjernens neurale struktur, bestående af lag af sammenkoblede knuder (neuroner) der kan lære komplekse mønstre fra data.
neuronEn grundlæggende beregningsenhed i et kunstigt neuralt netværk, der modtager input, behandler dem via en vægtet sum og en aktiveringsfunktion og producerer et output.
normal fordelingNormal fordeling er en kontinuert sandsynlighedsfordeling, der er symmetrisk omkring middelværdien og har en klokkeformet tæthedsfunktion.
numpy-arrayEt N-dimensionelt array-objekt implementeret i NumPy-biblioteket, der muliggør effektive vektor- og matrixoperationer.
NvidiaNvidia er en virksomhed, der producerer grafikprocessorer (GPU'er), som er afgørende for træning og inferens af deep learning-modeller på grund af deres parallelle beregningskapacitet.
Nvidia GPUEn Nvidia GPU er en grafikprocessor fra Nvidia, som anvendes til massiv parallel databehandling, især inden for kunstig intelligens og deep learning.
OCR-scanningOCR-scanning er en teknologi, der omdanner billeder af tekst til maskinlæsbar tekst ved hjælp af mønstergenkendelse og kunstig intelligens.
OCR-softwareSoftware der automatisk genkender og udtrækker trykt eller håndskreven tekst fra scannede dokumenter, billeder eller PDF-filer.
OCR-teknologiOCR-teknologi er en teknik til at genkende og digitalisere tekst fra billeder eller scannede dokumenter.
Optical character recognitionOptical character recognition (OCR) er en teknologi til at omdanne billeder af trykt eller håndskrevet tekst til maskinlæsbar tekst.
ordforrådDet sæt af tokens (ord, underord eller tegn) som en sprogmodel eller NLP-system genkender og kan behandle.
ordforrådSæt af unikke tokens (ord eller underord) som en sprogmodel kender og kan generere.
ordforrådsstørrelseAntallet af unikke tokens i en models ordforråd, typisk målt i antal tokens (ord eller underordselementer).
overfittetOverfittet beskriver en situation hvor en model lærer træningsdataene for godt, inklusive støj og tilfældigheder, og derfor klarer sig dårligt på nye data.
overvåget læringEn type maskinlæring, hvor modellen trænes på et mærket datasæt med input-output-par for at lære at forudsige output for nye input.
overvåget læringEn maskinlæringstilgang, hvor en model trænes på et mærket datasæt med input-output-par for at lære en mapping fra input til output.
padding tokenEt padding token er et specialtoken, der tilføjes til korte sekvenser for at opnå ensartet længde i et batch.
ParameterEn variabel i en maskinlæringsmodel, hvis værdi læres fra data under træning.
parametertalParametertal er det samlede antal af justerbare vægte og biases i en maskinlæringsmodel, som trænes under læring.
perception action loopPerception action loop er en grundlæggende cyklus i AI og robotik, hvor en agent sanser sine omgivelser, behandler informationen og udfører en handling, hvilket ændrer omgivelserne og starter en ny cyklus.
PerceptronEn perceptron er den enkleste form for et neuralt netværk, en lineær binær klassifikator.
pipelineEn sekvens af databehandlingstrin, hvor output af ét trin er input til det næste, typisk brugt i maskinlæring og datavidenskab.
PlanningPlanlægning i AI betegner processen med at finde en sekvens af handlinger, der fører fra en starttilstand til en måltilstand.
PrecisionPræcision måler andelen af korrekte positive forudsigelser ud af alle positive forudsigelser.
precision-recallPræcision og recall er to metrikker til evaluering af klassifikationsmodeller, der måler henholdsvis nøjagtigheden af positive forudsigelser og modellens evne til at finde alle relevante tilfælde.
predictionEn models output, når den anvendes på nye inputdata for at estimere en værdi eller klasse.
prediction errorForskellen mellem en models forudsigelse og den faktiske værdi.
preprocessingForberedelse og transformation af rådata til et format, der er egnet til maskinlæringsalgoritmer.
preprocessing-pipelineEn sekvens af automatiserede datatransformationer, der anvendes på rådata før en maskinlæringsmodel trænes eller anvendes.
preprocessing-stepEt preprocessing-step er en operation i en databehandlingspipeline, hvor rådata renses, transformeres eller forberedes til videre analyse eller modeltræning.
Probability distributionEn funktion, der tildeler sandsynligheder til hvert muligt udfald af en stokastisk variabel.
Prompt templateEn skabelon til prompts, der bruges til at strukturere input til en sprogmodel ved at indsætte variabler i en foruddefineret tekst.
præstationsmetrikMåleenhed for at vurdere en models præstation på en given opgave.
prætrænet modelEn model, der er trænet på en stor, generel datasæt for at lære grundlæggende repræsentationer, som derefter kan finjusteres til specifikke opgaver.
PTMEn PTM er en model, der er blevet trænet på en stor, generel datasæt, som derefter kan finjusteres til specifikke opgaver.
Random initializationTeknik til at sætte en models parametre (vægte og bias) til tilfældige værdier inden træning.
random variableEn stokastisk variabel er en variabel, hvis værdi bestemmes af et tilfældigt fænomen, og som tildeles sandsynligheder til sine mulige værdier.
regressionRegression er en statistisk metode til at modellere forholdet mellem en afhængig variabel og en eller flere uafhængige variable, typisk ved at forudsige et kontinuert tal.
ReLUReLU er en aktiveringsfunktion, der returnerer inputværdien, hvis den er positiv, ellers nul.
ReLU activationReLU (Rectified Linear Unit) er en aktiveringsfunktion, der returnerer inputværdien, hvis den er positiv, ellers 0.
ReLU-aktiveringsfunktionReLU-aktiveringsfunktionen er en ikke-lineær aktiveringsfunktion defineret som f(x) = max(0, x), der anvendes i neurale netværk for at introducere ikke-linearitet.
RetrievalHentning af relevant information fra en ekstern kilde, typisk en vektordatabase eller et dokumentindeks.
reward functionEn reward function er en matematisk funktion i reinforcement learning, der tildeler en numerisk belønning til hver tilstand eller handling for at guide en agents læring.
rule-based systemEt rule-based system er et computersystem, der træffer beslutninger eller udfører handlinger baseret på et sæt foruddefinerede logiske regler (hvis-så).
SafetyAI safety er et tværfagligt forskningsfelt, der beskæftiger sig med at sikre, at kunstige intelligenssystemer opfører sig pålideligt og ikke forårsager utilsigtet skade.
sampling biasSampling bias er en systematisk fejl i dataindsamlingen, hvor udvalget ikke repræsenterer den sande population, hvilket fører til skæve modeller.
scalarEn skalar er en enkelt numerisk værdi, i modsætning til en vektor, matrix eller tensor.
scikit-learnScikit-learn er et open-source Python-bibliotek til maskinlæring, bygget på NumPy, SciPy og matplotlib.
segmentation maskEn segmenteringsmaske er et binært eller flerklasses billede, der angiver, hvilke pixels der tilhører bestemte objekter eller regioner i et inputbillede.
semantisk søgemaskineEn søgemaskine der bruger semantisk forståelse til at matche forespørgsler med dokumenter baseret på mening frem for nøgleord.
semantisk søgningSemantisk søgning er en søgeteknik, der forstår brugerens hensigt og ordbetydning i stedet for at matche nøjagtige søgeord.
semi-supervised classificationKlassifikationsmetode hvor modellen trænes på en kombination af få annoterede og mange uannoterede data for at forbedre præcisionen.
sequence lengthAntallet af tokens (f.eks. ord eller underord) i en sekvens, der behandles af en sprogmodel.
sigmoidSigmoidefunktionen er en matematisk funktion med en S-formet kurve, der afbilder enhver reel værdi til et interval mellem 0 og 1.
sigmoid activationDen sigmoide aktiveringsfunktion er en matematisk funktion, der mapper et reelt tal til et interval mellem 0 og 1, ofte brugt i neurale netværk som en ikke-lineær aktivering.
sigmoid-aktiveringsfunktionEn matematisk funktion, der mapper et hvilket som helst reelt tal til et tal mellem 0 og 1, ofte brugt som aktiveringsfunktion i neurale netværk.
sigmoidefunktionEn matematisk funktion, der former input til en S-formet kurve, typisk anvendt til at klemme værdier mellem 0 og 1.
simuleringSimulering er at efterligne en virkelig proces eller et system ved hjælp af en computermodel, ofte for at studere adfærd, træne AI eller forudsige udfald.
skalarEn skalar er et enkelt reelt tal, der bruges som størrelse, værdi eller parameter i lineær algebra og maskinlæring.
skalar multiplikationMultiplikation af en skalær (et enkelt tal) med en vektor eller matrix, hvor hvert element i vektoren/matricen ganges med skalarren.
sklearnsklearn er et populært Python-bibliotek til maskinlæring, der bygger på NumPy, SciPy og matplotlib.
Softmax-lagEt softmax-lag er et outputlag i et neuralt netværk, der anvender softmax-funktionen til at konvertere en vektor af logits til en sandsynlighedsfordeling over klasser.
softmax-layerSoftmax-laget er et outputlag i neurale netværk, der konverterer logits til en sandsynlighedsfordeling, hvor alle sandsynligheder summer til 1.
sort boksEn sort boks er et AI-system, hvis interne logik og beslutningsproces ikke er synlig eller forståelig for en udenforstående.
SOTASOTA står for state-of-the-art og refererer til den bedste opnåede præstation inden for en given opgave.
special-tokenEt særligt token, som modellen bruger til at markere begyndelse, slutning eller særlige kontekster i en sekvens.
Speech recognitionTalegenkendelse er en teknologi, der konverterer talt sprog til tekst.
Speech-to-textTeknologi der konverterer talt sprog til skriftlig tekst.
speech-to-text-systemEt system der konverterer talt sprog til maskinlæsbar tekst.
state of the artDet højeste præstationsniveau, der på et givet tidspunkt er opnået af et system på en specifik opgave eller benchmark.
state-of-the-art modelEn state-of-the-art model er den bedst præsterende model inden for et givet domæne på et bestemt tidspunkt.
stokastisk vektorEn stokastisk vektor er en vektor med ikke-negative elementer, der summerer til 1, og som repræsenterer en sandsynlighedsfordeling over et endeligt antal hændelser.
stor sprogmodelEn stor sprogmodel er en type neural netværksmodel med et meget stort antal parametre, trænet på store mængder tekstdata, som kan generere og forstå menneskeligt sprog.
Supervised learningSupervised learning er en maskinlæringsteknik, hvor en model trænes på et mærket datasæt med input-output-par for at lære at forudsige output for nye input.
supervised learning-modelEn supervised learning-model er en maskinlæringsmodel, der trænes på et mærket datasæt, hvor hvert input har en kendt output-værdi.
supervised learning-teknikEn teknik inden for maskinlæring, hvor en model trænes ved hjælp af et mærket datasæt, hvor hvert eksempel har en korrekt outputværdi.
superviseret læringSuperviseret læring er en maskinlæringsmetode, hvor en model trænes på et mærket datasæt, så den kan forudsige output for nye, usete data.
syntetisk datasætSyntetisk datasæt er et datasæt, der er kunstigt genereret frem for indsamlet fra virkelige hændelser, ofte brugt til træning af AI-modeller når reelle data er knappe, følsomme eller dyre.
syntetiske dataSyntetiske data er kunstigt genererede data, der efterligner virkelige data, og som anvendes til at træne AI-modeller, når reelle data er knappe, følsomme eller skæve.
System promptEn system prompt er en indledende besked til en sprogmodel, der angiver kontekst, rolle eller adfærdsregler, som modellen skal følge gennem hele samtalen.
tabsfunktionEn funktion i AI-systemer, der giver brugeren mulighed for at skifte mellem forskellige visningsområder eller samtaler.
target domainDet domæne, som en model skal anvendes på, typisk efter at være trænet på et kildedomæne.
TensorEn tensor er en matematisk struktur, der generaliserer skalarer, vektorer og matricer til et vilkårligt antal dimensioner, og som er den grundlæggende datatype i maskinlæringsbiblioteker som TensorFlow og PyTorch.
TensorFlowTensorFlow er et open-source maskinlæringsbibliotek udviklet af Google, der anvender datastrømsgrafer til numerisk beregning.
test sætDel af et datasæt der holdes adskilt fra træning og validering, og kun bruges til at evaluere modellens endelige ydeevne efter al træning.
test sætEt test sæt er en delmængde af data, der anvendes til at evaluere en maskinlæringsmodels ydeevne efter træning.
test-sæt-nøjagtighedMåling af andelen af korrekte forudsigelser på et separat testsæt, som modellen ikke har set under træning.
testdatasætEt testdatasæt er en mængde data, der bruges til at evaluere en trænet models ydeevne på hidtil usete data.
testdatasætEt testdatasæt er en samling data, der bruges til at evaluere en maskinlæringsmodel efter træning, for at vurdere dens generaliseringsevne på nye, usete data.
testdatasætsplitOpdeling af et datasæt i separate delmængder (træning, validering, test) for at evaluere en models generaliseringsevne.
testningEvaluering af en maskinlæringsmodel på et separat testdatasæt for at måle dens præstation på ikke sete data.
Text-to-speechTeknologi der konverterer skrevet tekst til syntetisk tale.
TF HubTF Hub er en platform til deling og genbrug af fortrænede maskinlæringsmoduler, primært til TensorFlow.
TokenEn token er den mindste enhed af tekst, som en sprogmodel behandler, typisk et ord, en underdel af et ord eller et tegn.
Token-grænseMaksimalt antal tokens en sprogmodel kan behandle i én forespørgsel eller session.
tokeniseringTokenisering er processen med at opdele en tekst i mindre enheder (tokens), typisk ord, underord eller tegn, som modellen kan behandle.
TokenizationTokenization er processen med at opdele en tekst i mindre enheder kaldet tokens, som kan være ord, underord eller tegn.
TokenizerEn tokenizer er et værktøj der opdeler tekst i mindre enheder (tokens) til brug i sprogmodeller.
transparensTransparens i AI refererer til graden, hvor et AI-systems funktion, beslutningsprocesser og data er åbne, forståelige og forklarbare for interessenter.
træningTræning er processen, hvor en maskinlæringsmodel lærer fra data ved at justere sine parametre for at minimere en tabsfunktion.
træningProcessen hvor en maskinlæringsmodel optimerer sine parametre ved at lære fra data gennem gentagne iterationer.
træningsbatchEn underopdeling af træningsdata, som anvendes i én frem- og tilbagepassage under træning af en neural netværksmodel.
træningsdataData der bruges til at træne en maskinlæringsmodel, så den lærer mønstre og sammenhænge.
træningsdatasætEt træningsdatasæt er en samling af data, der bruges til at træne en maskinlæringsmodel ved at justere dens parametre.
træningslossTræningsloss er gennemsnittet af tabsfunktionsværdierne beregnet over træningsdataene under modeltræning.
træningssætEt træningssæt er en samling af dataeksempler, der bruges til at træne en maskinlæringsmodel.
TTSTeknologi der konverterer skrevet tekst til talt tale.
UnderfittingUnderfitting opstår, når en model er for enkel til at fange datasættets underliggende mønstre.
unlabeled dataData uden tilhørende etiketter eller annotations.
Uovervåget indlæringEn type maskinlæring, hvor modellen trænes på data uden mærkater og selv skal finde mønstre eller strukturer.
uovervåget læringUovervåget læring er en maskinlæringsmetode, hvor modellen trænes på umærkede data uden angivelse af korrekte svar.
valideringsdatasætValideringsdatasæt er et datasæt, der anvendes til at evaluere modelens præstation under træning uden at påvirke modelparametrene direkte.
valideringsdatasætEt datasæt der bruges til at evaluere en models præstation under træning uden at påvirke vægtene.
VectorEn vektor er en ordnet liste af tal, der repræsenterer et punkt i et flerdimensionalt rum, og som bruges til at beskrive data, funktioner eller modellens interne tilstande i AI.
vektorEn vektor er en ordnet liste af tal, der repræsenterer et punkt i et flerdimensionalt rum, ofte brugt til at repræsentere data som ord eller billeder i AI.
vektoriseringVektorisering er processen med at omdanne data eller operationer til en vektorrepræsentation, ofte for at udnytte parallelle beregninger eller maskinlæringsmodeller.
vektorrepræsentationEn numerisk fremstilling af data som en vektor i et flerdimensionelt rum, hvor lighed afspejles i geometriske afstande.
Vibe codingEn uformel tilgang til programmering, hvor udvikleren bruger naturlige sprogprompter til at interagere med en AI-model for at generere eller modificere kode.
vægtEn vægt er en lærbar parameter i et neuralt netværk, der multipliceres med input for at beregne output, og som justeres under træning.
vægtjusteringVægtjustering er opdateringen af en models parametre baseret på gradienten af tabsfunktionen for at minimere fejl.
WeightEn parameter i et neuralt netværk, der justeres under træning for at minimere tabsfunktionen og bestemmer styrken af forbindelsen mellem neuroner.
working memoryWorking memory er en mekanisme i neurale netværk og sprogmodeller, der midlertidigt lagrer og manipulerer information under behandling af en opgave.
Zero initializationInitialisering af alle vægte i et neuralt netværk til nul.
Zero-shot promptingEn prompt-teknik, hvor en sprogmodel udfører en opgave uden at have set nogen eksempler på opgaven i prompterne.