begynder
287 termer- accuracyAccuracy er en metrik, der angiver andelen af korrekte forudsigelser ud af alle forudsigelser.
- accuracy scoreAccuracy score er en metrik, der måler andelen af korrekte forudsigelser ud af alle forudsigelser i en klassifikationsmodel.
- Activation functionEn aktiveringsfunktion er en matematisk funktion, der bestemmer outputtet af en neuron i et neuralt netværk baseret på dens input.
- activation layerEt aktiveringslag er et lag i et neuralt netværk, der anvender en ikke-lineær funktion på inputtet for at introducere ikke-linearitet.
- AgentEn agent er en enhed, der sanser sit miljø og handler på baggrund af det for at nå specifikke mål.
- AI safetyAI safety er et forsknings- og praksisfelt, der beskæftiger sig med at sikre, at kunstig intelligens-systemer er pålidelige, robuste og ikke forårsager utilsigtede skader.
- AI-assisteret kodningBrug af kunstig intelligens til at generere, foreslå eller fuldføre kildekode.
- AI-kodningsassistentAI-baseret værktøj der hjælper udviklere med at skrive, forstå og debugge kode.
- AI-moderationAnvendelse af kunstig intelligens til automatisk at overvåge og regulere indhold på digitale platforme.
- AI-sikkerhedAI-sikkerhed er forskning og praksis, der sigter mod at sikre, at kunstig intelligens-systemer handler i overensstemmelse med menneskelige værdier og ikke forårsager utilsigtet skade.
- aktiveringsfunktionEn aktiveringsfunktion er en matematisk funktion, der anvendes på outputtet af en neuron i et neuralt netværk for at introducere ikke-linearitet og bestemme, om neuronen skal aktiveres.
- ANNEt ANN (kunstigt neuralt netværk) er et computersystem opbygget af sammenkoblede noder (neuroner) der kan indlære mønstre fra data.
- APIAPI er et sæt af definerede regler og protokoller, der gør det muligt for softwareapplikationer at kommunikere og udveksle data.
- API queryEn API query er en anmodning sendt til et API-endepunkt for at hente eller manipulere data, typisk brugt til at interagere med sprogmodeller.
- API-endepunktEn specifik URL eller adresse, som en API anvender til at modtage anmodninger og sende svar.
- API-nøgleEn API-nøgle er en unik streng, der autentificerer en bruger eller applikation ved kald til en API, ofte brugt til at kontrollere adgang til AI-tjenester.
- argmaxArgumentet (inputværdien) der maksimerer en given funktion.
- arrayEn ordnet samling af elementer, typisk af samme datatype, indekseret med heltal.
- array-indekseringTeknik til at vælge enkeltelementer eller udsnit af et array ved brug af indeksnumre, udsnit, boolske betingelser eller lister af indeks.
- attributEn attribut er en egenskab eller et kendetegn ved en datapost, typisk repræsenteret som en kolonne i et datasæt.
- Batch inferenceBatch inference er processen med at udføre modelinferens på en gruppe af input samples på én gang for at udnytte hardwareparallelisme og øge gennemløb.
- batch sizeAntallet af træningseksempler, der behandles i én iteration under træning af en model.
- batch-størrelseBatch-størrelse er antallet af træningseksempler, der behandles samtidigt i en enkelt iteration under træning af en maskinlæringsmodel.
- BenchmarkStandardiseret test eller datasæt brugt til at evaluere og sammenligne AI-modellers ydelse.
- benchmark scoreEn benchmark-score er en numerisk værdi, der repræsenterer en models præstation på en standardiseret test.
- benchmark-datasætEn standardiseret samling af data brugt til at evaluere og sammenligne ydeevnen af AI-modeller.
- benchmark-resultatResultatet af en standardiseret evaluering af en AI-models ydeevne på en specifik opgave.
- benchmark-suiteEn samling af standardiserede tests (benchmarks) designet til at evaluere og sammenligne ydeevnen af AI-modeller på tværs af forskellige opgaver.
- benchmark-testEn standardiseret test eller evalueringsprocedure, der anvendes til at sammenligne ydeevnen af forskellige AI-modeller eller algoritmer.
- betinget sandsynlighedsfordelingEn betinget sandsynlighedsfordeling beskriver sandsynligheden for en stokastisk variabel givet, at en anden variabel har en bestemt værdi.
- biasSystematisk afvigelse i en models forudsigelser eller i data, der fører til skæve eller uretfærdige resultater.
- bias-parameterEn bias-parameter er et justerbart tal i et neuralt netværk, der tilføjes til den vægtede sum af input for at forskyde aktiveringsfunktionen.
- bias-termEn bias-term er en ekstra tilføjelse til en neurons vægtede sum, som muliggør forskydning af aktiveringsfunktionen.
- billedgenerationBilledgeneration er processen med at skabe nye billeder fra en given beskrivelse eller betingelse ved hjælp af en AI-model.
- billedklassifikationBilledklassifikation er opgaven med at tildele en foruddefineret kategori til et inputbillede ved hjælp af en model.
- billedklassifikationsmodelEn model, der trænes til at tildele et inputbillede en etiket fra et foruddefineret sæt klasser.
- binary classificationEn klassifikationsopgave, hvor output kun kan tilhøre én af to mulige klasser.
- bounding boxEn rektangulær afgrænsning omkring et objekt i et billede, typisk defineret ved koordinaterne for hjørnerne (x_min, y_min, x_max, y_max) eller (center, bredde, højde).
- chat completionChat completion er en metode, hvor en sprogmodel genererer et svar baseret på en sekvens af beskeder i en samtale.
- chat completion endpointEn API-endpoint, der accepterer en liste af beskeder og returnerer et modelgenereret svar.
- ChatGPTChatGPT er en chatbott baseret på OpenAI's GPT-sprogmodel, der er finjusteret til samtale.
- CheckpointEn gemt kopi af en models vægte og træningstilstand på et bestemt tidspunkt under træning.
- chunk-overlapChunk-overlap er den mængde af tegn eller tokens, der deles mellem to på hinanden følgende tekstbidder ved opdeling af et dokument.
- ChunkingOpdeling af tekst i mindre enheder (chunks) for at optimere indeksering, søgning og indlejring i sprogmodeller.
- classificationClassification er en overvåget læringsopgave, hvor modellen forudsiger en kategorisk etiket for en input baseret på trænede klasser.
- classification modelEn model, der forudsiger en diskret klasse (kategori) for en given input.
- computer visionComputer vision er et forskningsfelt inden for kunstig intelligens, der beskæftiger sig med at gøre computere i stand til at fortolke og forstå visuel information fra omverdenen.
- confusion matrix heatmapEn confusion matrix heatmap er en grafisk repræsentation af en forvirringsmatrix, hvor celleværdier farvekodes for at visualisere klassifikationsydelse.
- content moderationProcessen med at overvåge, filtrere og håndtere brugergenereret indhold for at sikre overholdelse af retningslinjer og love.
- Context windowDet maksimale antal tokens som en sprogmodel samtidig kan tage som input.
- context window truncationTeknik til at forkorte en inputsekvens til den maksimale kontekststørrelse, som en sprogmodel kan håndtere, ved at fjerne dele af teksten.
- cosine lighedCosine lighed er et mål for, hvor ens to ikke-nul-vektorer er i retning, uafhængigt af deres længde, beregnet som cosinus til vinklen mellem dem.
- CPUCPU'en er computerens centrale processor, der udfører generelle beregninger, men er mindre effektiv end GPU'er til parallelle operationer i AI.
- Data augmentationTeknik til at øge mængden af træningsdata ved at anvende transformationer på eksisterende data.
- Data labelingProcessen med at tilføje metadata (labels) til rådata for at gøre dem anvendelige til træning af overvågede maskinlæringsmodeller.
- Data Labeling PipelineEn data-labeling-pipeline er en struktureret arbejdsgang til at tildele etiketter til rådata, så de kan bruges til træning af overvågede maskinlæringsmodeller.
- Data pipelineEn datapipeline er en sekvens af databehandlingstrin, der transporterer og transformerer rådata fra kilde til destinationssystem, ofte til brug i maskinlæringsmodeller.
- data-labeling-platformEn softwareplatform til at oprette, administrere og kvalitetssikre annoteringer af data til træning af maskinlæringsmodeller.
- data-labeling-toolSoftwareværktøj til manuel eller semiautomatisk annotering af data (fx billeder, tekst, lyd) med etiketter til træning af maskinlæringsmodeller.
- datasetEn samling af strukturerede data, typisk bestående af eksempler med træk og eventuelle etiketter, der bruges til at træne, validere eller teste en maskinlæringsmodel.
- datasetsEn struktureret samling af data, typisk brugt til træning og evaluering af maskinlæringsmodeller.
- Discriminative modelEn type model, der lærer at skelne mellem klasser ved direkte at modellere betinget sandsynlighed P(y|x) eller beslutningsgrænsen.
- diskret stokastisk variabelEn stokastisk variabel, der kan antage et endeligt eller tælleligt uendeligt antal værdier.
- dyb læringEn underdisciplin af maskinlæring, der anvender neurale netværk med mange lag til at lære hierarkiske repræsentationer af data.
- dybt neuralt netværkEt neuralt netværk med flere skjulte lag mellem input- og outputlaget, hvilket muliggør indlæring af komplekse hierarkiske repræsentationer.
- EmbeddingEn embedding er en kompakt, tæt vektorrepræsentation af et objekt (fx et ord, en sætning eller et billede) i et kontinuert vektorrum, hvor semantisk lighed svarer til geometrisk nærhed.
- embedding-vektorEn embedding-vektor er en tæt, flerdimensional vektorrepræsentation af et diskret objekt (fx et ord) lært af en neural netværksmodel, så semantisk lignende objekter har ens vektorer.
- end-of-sequence tokenEt specielt token der markerer afslutningen på en sekvens i en sprogmodel.
- environmentI forstærkningslæring og AI-agent-systemer: den verden eller det system, som agenten interagerer med, herunder tilstande, overgange og belønninger.
- EpochEn epoch er én gennemgang af hele træningsdatasættet under træning af en maskinlæringsmodel.
- epoch numberAntallet af fulde gennemløb af hele træningsdatasættet under træning af en model.
- epoch-lossTabsfunktionens værdi målt ved slutningen af hver fuld gennemløb (epoke) af træningsdata.
- epoch-loss curveEn graf, der viser trænings- og valideringstab som funktion af antallet af epoker under træning af en model.
- epoch-loss plotEn graf der viser tabet efter hver epoke under træning af en maskinlæringsmodel.
- ethical AIEtiske AI refererer til udvikling og brug af kunstig intelligens i overensstemmelse med etiske principper som retfærdighed, ansvarlighed, gennemsigtighed og respekt for menneskerettigheder.
- EvalProcessen med at vurdere en models ydeevne på et datasæt, typisk ved brug af metrikker som accuracy, precision, recall eller F1-score.
- eval-målingEn eval-måling er en kvantitativ målestok, der bruges til at vurdere en AI-models præstation på en specifik opgave.
- eval-målingsresultatEn værdi, der angiver en models præstation målt på en bestemt opgave eller benchmark.
- eval-resultatEt eval-resultat er den samlede vurdering af en models ydeevne baseret på et sæt metrikker, såsom nøjagtighed, præcision eller recall.
- evaluation metricEn evaluation metric er en kvantitativ måling, der bruges til at vurdere en models præstation på en given opgave.
- EvalueringProces, hvor en kunstig intelligensmodels præstation måles og vurderes ved hjælp af relevante metrikker.
- evalueringsmetrikEn evalueringsmetrik er en kvantitativ måling, der bruges til at vurdere en models præstation på en given opgave.
- evalueringssætEt evalueringssæt er en samling data, der bruges til at vurdere en models præstation efter træning.
- FeatureEn feature er en individuel, målelig egenskab eller karakteristik af et datapunkt, der bruges som input til en maskinlæringsmodel.
- feature extractionFeature extraction er processen med at omdanne rådata til et sæt meningsfulde attributter (features), der kan bruges til maskinlæring eller mønstergenkendelse.
- feature vectorEn numerisk repræsentation af et objekts karakteristika (features) som en vektor i et flerdimensionalt rum.
- feedforward neural networkEt neuralt netværk, hvor informationen flyder i én retning fra input til output uden tilbageløb.
- fine-tuning-datasætEt datasæt, der bruges til at finjustere en fortrænet model til en specifik opgave.
- forklarlig AIForklarlig AI (XAI) betegner metoder og teknikker, der gør kunstig intelligens' beslutninger og forudsigelser forståelige for mennesker.
- ForklarlighedsværktøjEt værktøj der genererer forklaringer på, hvordan en AI-model når frem til en given beslutning eller forudsigelse.
- fortrænet modelEn fortrænet model er en maskinlæringsmodel, der er trænet på et stort datasæt og derefter tilpasses til en specifik opgave gennem finjustering.
- forudtrænet billede-modelEn forudtrænet billede-model er en neural netværksmodel, der er trænet på et stort datasæt af billeder og efterfølgende anvendes som udgangspunkt for andre opgaver.
- ForudtræningForudtræning er en teknik, hvor en model først trænes på en stor, generel datasæt for at lære bredrepræsentationer, før den finjusteres på en specifik opgave.
- generationProcessen hvor en AI-model skaber nye data (f.eks. tekst, billeder, lyd) ud fra en given kontekst eller betingelse.
- generativ AIGenerativ AI er en type kunstig intelligens, der kan skabe nyt indhold som tekst, billeder, lyd eller kode baseret på træningsdata.
- generativ AI-modelEn type kunstig intelligens-model, der lærer at generere nye datapunkter lignende dets træningsdata.
- generativ AI-teknologiGenerativ AI-teknologi refererer til systemer, der kan skabe nyt indhold, såsom tekst, billeder, lyd eller kode, ved at lære mønstre fra eksisterende data.
- Generative modelEn generativ model er en type maskinlæringsmodel, der lærer den underliggende fordeling af træningsdata og kan generere nye, realistiske datapunkter.
- GenkaldelsesrateGenkaldelsesrate måler andelen af relevante positive instanser, der identificeres korrekt af modellen.
- GPTGPT er en type sprogmodel baseret på transformeren, der er fortrænet på store tekstmængder og finjusteret til forskellige opgaver.
- GPT-3GPT-3 er en stor sprogmodel udviklet af OpenAI, der kan generere menneskelignende tekst baseret på inputprompts.
- GPUEn specialiseret processor designet til parallel behandling, der anvendes i kunstig intelligens til at accelerere træning og inferens af neurale netværk.
- GPU-accelerationGPU-acceleration er brug af en grafikprocessor (GPU) til at udføre parallelle beregninger hurtigere end en almindelig CPU.
- GPU-accelereretGPU-accelereret betyder at udnytte en grafikprocessor (GPU) til at udføre beregninger hurtigere end en almindelig CPU, især til parallelle opgaver som træning af neurale netværk.
- gradientVektor af partielle afledede, der angiver den stejleste stigningsretning for en funktion.
- Gradient descent optimizerEn optimeringsalgoritme der iterativt minimerer en tabsfunktion ved at opdatere modellens parametre i retning af den negative gradient.
- Gradio SpaceGradio Space er en cloud-baseret platform fra Hugging Face til at hoste og dele interaktive maskinlæringsdemoer bygget med Gradio.
- greedy searchGreedy search er en dekodningsstrategi, der ved hvert trin vælger det mest sandsynlige næste token uden at overveje fremtidige konsekvenser.
- Guardrail ValidatorEn komponent eller system, der kontrollerer AI-output mod foruddefinerede sikkerhedsregler (guardrails) for at forhindre skadeligt eller uhensigtsmæssigt indhold.
- HallucinationEn hallucination i AI er, når en sprogmodel genererer tekst, der er faktuel forkert, opdigtet eller meningsløs, men som præsenteres med selvsikkerhed.
- hallucinereAt hallucinere er når en AI-model producerer falsk eller meningsløs information, der præsenteres som fakta.
- hidden layerEt lag i et neuralt netværk, der befinder sig mellem inputlaget og outputlaget og udfører ikke-lineære transformationer af data.
- Hugging FaceHugging Face er en virksomhed og platform, der udvikler open-source-værktøjer til maskinlæring, især Transformers-biblioteket og Model Hub.
- Hugging Face HubHugging Face Hub er en central platform til deling og versionering af maskinlæringsmodeller, datasæt og demoapplikationer.
- Hugging Face SpacesHugging Face Spaces er en cloud-baseret platform til at hoste, dele og demonstrere machine learning-modeller gennem interaktive apps og demos.
- Hugging Face Transformers pipelineEn højniveaufunktion fra Hugging Face Transformers-biblioteket, der gør det muligt at anvende fortrænede modeller til specifikke NLP-opgaver med få linjer kode.
- ikke linearitetEn egenskab ved en funktion eller model, hvor outputtet ikke er proportionalt med inputtet, hvilket er afgørende for neurale netværks evne til at lære komplekse mønstre.
- ikke-superviseret læringEn maskinlæringsmetode, hvor modellen lærer mønstre i data uden brug af forhåndsannoterede labels.
- image augmentationTeknik til at øge mangfoldigheden af træningsdata ved at anvende tilfældige, men realistiske transformationer på eksisterende billeder.
- Image classificationBilledklassifikation er opgaven at tildele et klassemærke til et inputbillede baseret på dets visuelle indhold.
- indholdsmodereringssystemEt indholdsmodereringssystem er et automatiseret eller menneskeligt system, der vurderer og filtrerer brugeroprettet indhold for at forhindre spredning af skadelige, upassende eller ulovlige materialer.
- indlejringEn indlejring er en kompakt, tæt vektorrepræsentation af et diskret element (fx et ord eller token) i et kontinuert vektorrum, typisk lært af en model.
- InferenceProcessen hvor en trænet model anvendes på nye data for at generere output såsom forudsigelser, klassifikationer eller tekst.
- inference-modeI inferens-tilstand kører en model uden træning, kun til at lave forudsigelser.
- inferensProcessen hvor en trænet model anvendes til at lave forudsigelser eller beslutninger på nye data.
- inferenshastighedDen hastighed, hvormed en trænet model behandler inputdata og genererer forudsigelser, typisk målt i tokens per sekund eller samples per sekund.
- information retrievalInformation retrieval er processen med at finde relevante dokumenter eller information i en stor samling baseret på en forespørgsel.
- IRLIRL (In Real Life) refererer til den virkelige verden i modsætning til simulerede miljøer, ofte brugt i AI-sammenhænge som reinforcement learning og robotik.
- iterationÉn gennemgang af en gentagen proces, fx et trin i træning af en model.
- k-meansEn clustering-algoritme, der deler et datasæt i k grupper ved at minimere den samlede afstand mellem punkterne og deres nærmeste gruppecentrum.
- Keras-layerEn byggesten i Keras-modeller, der transformerer data gennem en eller flere operationer såsom fuldt forbundne lag, konvolutioner eller aktiveringsfunktioner.
- Keras-modulEt Keras-modul er en byggesten i Keras-biblioteket, typisk et lag eller en modeldefinition, der bruges til at konstruere neurale netværk.
- knowledge baseEn struktureret samling af fakta, regler og relationer, der bruges af et AI-system til at understøtte ræsonnement og beslutningstagning.
- kontinuert stokastisk variabelEn stokastisk variabel, der kan antage et uendeligt antal værdier inden for et interval, typisk beskrevet ved en sandsynlighedstæthedsfunktion.
- konvolutionelt neuralt netværkEt konvolutionelt neuralt netværk (CNN) er en type neurale netværk, der anvender konvolutionelle lag til at lære hierarkiske repræsentationer fra data med grid-lignende topologi, især billeder.
- labeled dataLabeled data er data, hvor hvert eksempel er mærket med den korrekte outputværdi til brug for træning af overvågede maskinlæringsmodeller.
- labelingProcessen med at tildele etiketter (labels) til data som grundlag for træning af en maskinlæringsmodel.
- lagEt lag er en samling af neuroner eller enheder i et neuralt netværk, der behandler input og sender output til næste lag.
- language modelEn sprogmodel er en statistisk eller neural model, der tillægger en sandsynlighed til en sekvens af ord eller tokens.
- leaderboardEn offentlig rangliste, der viser modellers præstationer på en given opgave eller benchmark.
- lighedsmaalEt mål for hvor ens to objekter eller datapunkter er, ofte brugt i maskinlæring og informationssøgning.
- lineær interpolationEn metode til at estimere en værdi mellem to kendte punkter ved at antage en lineær sammenhæng.
- lineær regressionEn statistisk metode der modellerer sammenhængen mellem en afhængig variabel og en eller flere uafhængige variable ved at tilpasse en lineær ligning til observerede data.
- LLMEn LLM (Large Language Model) er en neural netværksbaseret model, typisk en transformer, trænet på enorme tekstmængder til at generere og forstå menneskeligt sprog.
- LLM-baseretBeskriver en løsning, model, system eller funktionalitet der bygger på en stor sprogmodel (LLM).
- log lossLog loss er en tabsfunktion, der måler, hvor godt en klassifikationsmodels forudsagte sandsynligheder passer til de faktiske klasser, med en lavere værdi, der indikerer bedre ydeevne.
- logit-softmaxLogit-softmax er kombinationen af de rå scores (logits) fra en models sidste lag og softmax-funktionen, som omdanner dem til en sandsynlighedsfordeling over klasser.
- mask tokenEt specialtoken brugt i masked language modeling, som erstatter ord i inputtet, så modellen skal forudsige dem.
- maskinlæringMaskinlæring er et delområde af kunstig intelligens, hvor algoritmer lærer mønstre og sammenhænge fra data uden at være eksplicit programmeret til hver enkelt opgave.
- maskinlæringEn gren af kunstig intelligens, der giver systemer evnen til at lære og forbedre sig fra erfaring uden at være eksplicit programmeret.
- matrixEn rektangulær tabel af tal, symboler eller udtryk arrangeret i rækker og søjler, brugt i lineær algebra og AI-beregninger.
- metrikEn metrik er en kvantitativ måling, der bruges til at evaluere eller sammenligne præstationen af en AI-model.
- mini batchMini batch er en delmængde af træningsdata, der bruges til at beregne gradienten og opdatere modelvægtene i én iteration under træning af neurale netværk.
- modelEn model er en matematisk eller beregningsmæssig repræsentation, der lærer fra data for at foretage forudsigelser eller beslutninger.
- Model cardEt standardiseret dokument, der beskriver en maskinlæringsmodel, herunder dens formål, træningsdata, evalueringsresultater og kendte begrænsninger.
- model-checkpointEn gemt tilstand af en models vægte og optimeringstilstand under træning, så processen kan genoptages eller evalueres senere.
- modelarkitekturBetegnelse for en maskinlæringsmodel overordnede struktur, herunder antal lag, lagtyper og forbindelser mellem dem.
- modelprædiktionEn models output ved inferens baseret på et givent input.
- modeltræningProcessen med at justere en models parametre, så den minimerer en tabsfunktion på træningsdata.
- multi-klasse billedklassifikationMulti-klasse billedklassifikation er opgaven at tildele et inputbillede én klasseetikette fra et foruddefineret sæt af flere (≥3) kategorier, typisk ved hjælp af en maskinlæringsmodel.
- Naive BayesEn familie af probabilistiske klassifikationsalgoritmer baseret på Bayes' sætning med antagelse om betinget uafhængighed mellem features givet klassen.
- natural language processingNatural language processing er det tværfaglige felt, der beskæftiger sig med, at computere kan forstå, fortolke og generere menneskeligt sprog.
- Neural networkEt neuralt netværk er en beregningsmodel inspireret af hjernens struktur, bestående af lag af sammenkoblede noder (neuroner) der lærer mønstre fra data.
- Neuralt netværkEt neuralt netværk er en beregningsmodel inspireret af hjernens neurale struktur, bestående af lag af sammenkoblede knuder (neuroner) der kan lære komplekse mønstre fra data.
- neuronEn grundlæggende beregningsenhed i et kunstigt neuralt netværk, der modtager input, behandler dem via en vægtet sum og en aktiveringsfunktion og producerer et output.
- normal fordelingNormal fordeling er en kontinuert sandsynlighedsfordeling, der er symmetrisk omkring middelværdien og har en klokkeformet tæthedsfunktion.
- numpy-arrayEt N-dimensionelt array-objekt implementeret i NumPy-biblioteket, der muliggør effektive vektor- og matrixoperationer.
- NvidiaNvidia er en virksomhed, der producerer grafikprocessorer (GPU'er), som er afgørende for træning og inferens af deep learning-modeller på grund af deres parallelle beregningskapacitet.
- Nvidia GPUEn Nvidia GPU er en grafikprocessor fra Nvidia, som anvendes til massiv parallel databehandling, især inden for kunstig intelligens og deep learning.
- OCR-scanningOCR-scanning er en teknologi, der omdanner billeder af tekst til maskinlæsbar tekst ved hjælp af mønstergenkendelse og kunstig intelligens.
- OCR-softwareSoftware der automatisk genkender og udtrækker trykt eller håndskreven tekst fra scannede dokumenter, billeder eller PDF-filer.
- OCR-teknologiOCR-teknologi er en teknik til at genkende og digitalisere tekst fra billeder eller scannede dokumenter.
- Optical character recognitionOptical character recognition (OCR) er en teknologi til at omdanne billeder af trykt eller håndskrevet tekst til maskinlæsbar tekst.
- ordforrådDet sæt af tokens (ord, underord eller tegn) som en sprogmodel eller NLP-system genkender og kan behandle.
- ordforrådSæt af unikke tokens (ord eller underord) som en sprogmodel kender og kan generere.
- ordforrådsstørrelseAntallet af unikke tokens i en models ordforråd, typisk målt i antal tokens (ord eller underordselementer).
- overfittetOverfittet beskriver en situation hvor en model lærer træningsdataene for godt, inklusive støj og tilfældigheder, og derfor klarer sig dårligt på nye data.
- overvåget læringEn type maskinlæring, hvor modellen trænes på et mærket datasæt med input-output-par for at lære at forudsige output for nye input.
- overvåget læringEn maskinlæringstilgang, hvor en model trænes på et mærket datasæt med input-output-par for at lære en mapping fra input til output.
- padding tokenEt padding token er et specialtoken, der tilføjes til korte sekvenser for at opnå ensartet længde i et batch.
- ParameterEn variabel i en maskinlæringsmodel, hvis værdi læres fra data under træning.
- parametertalParametertal er det samlede antal af justerbare vægte og biases i en maskinlæringsmodel, som trænes under læring.
- perception action loopPerception action loop er en grundlæggende cyklus i AI og robotik, hvor en agent sanser sine omgivelser, behandler informationen og udfører en handling, hvilket ændrer omgivelserne og starter en ny cyklus.
- PerceptronEn perceptron er den enkleste form for et neuralt netværk, en lineær binær klassifikator.
- pipelineEn sekvens af databehandlingstrin, hvor output af ét trin er input til det næste, typisk brugt i maskinlæring og datavidenskab.
- PlanningPlanlægning i AI betegner processen med at finde en sekvens af handlinger, der fører fra en starttilstand til en måltilstand.
- PrecisionPræcision måler andelen af korrekte positive forudsigelser ud af alle positive forudsigelser.
- precision-recallPræcision og recall er to metrikker til evaluering af klassifikationsmodeller, der måler henholdsvis nøjagtigheden af positive forudsigelser og modellens evne til at finde alle relevante tilfælde.
- predictionEn models output, når den anvendes på nye inputdata for at estimere en værdi eller klasse.
- prediction errorForskellen mellem en models forudsigelse og den faktiske værdi.
- preprocessingForberedelse og transformation af rådata til et format, der er egnet til maskinlæringsalgoritmer.
- preprocessing-pipelineEn sekvens af automatiserede datatransformationer, der anvendes på rådata før en maskinlæringsmodel trænes eller anvendes.
- preprocessing-stepEt preprocessing-step er en operation i en databehandlingspipeline, hvor rådata renses, transformeres eller forberedes til videre analyse eller modeltræning.
- Probability distributionEn funktion, der tildeler sandsynligheder til hvert muligt udfald af en stokastisk variabel.
- Prompt templateEn skabelon til prompts, der bruges til at strukturere input til en sprogmodel ved at indsætte variabler i en foruddefineret tekst.
- præstationsmetrikMåleenhed for at vurdere en models præstation på en given opgave.
- prætrænet modelEn model, der er trænet på en stor, generel datasæt for at lære grundlæggende repræsentationer, som derefter kan finjusteres til specifikke opgaver.
- PTMEn PTM er en model, der er blevet trænet på en stor, generel datasæt, som derefter kan finjusteres til specifikke opgaver.
- Random initializationTeknik til at sætte en models parametre (vægte og bias) til tilfældige værdier inden træning.
- random variableEn stokastisk variabel er en variabel, hvis værdi bestemmes af et tilfældigt fænomen, og som tildeles sandsynligheder til sine mulige værdier.
- regressionRegression er en statistisk metode til at modellere forholdet mellem en afhængig variabel og en eller flere uafhængige variable, typisk ved at forudsige et kontinuert tal.
- ReLUReLU er en aktiveringsfunktion, der returnerer inputværdien, hvis den er positiv, ellers nul.
- ReLU activationReLU (Rectified Linear Unit) er en aktiveringsfunktion, der returnerer inputværdien, hvis den er positiv, ellers 0.
- ReLU-aktiveringsfunktionReLU-aktiveringsfunktionen er en ikke-lineær aktiveringsfunktion defineret som f(x) = max(0, x), der anvendes i neurale netværk for at introducere ikke-linearitet.
- RetrievalHentning af relevant information fra en ekstern kilde, typisk en vektordatabase eller et dokumentindeks.
- reward functionEn reward function er en matematisk funktion i reinforcement learning, der tildeler en numerisk belønning til hver tilstand eller handling for at guide en agents læring.
- rule-based systemEt rule-based system er et computersystem, der træffer beslutninger eller udfører handlinger baseret på et sæt foruddefinerede logiske regler (hvis-så).
- SafetyAI safety er et tværfagligt forskningsfelt, der beskæftiger sig med at sikre, at kunstige intelligenssystemer opfører sig pålideligt og ikke forårsager utilsigtet skade.
- sampling biasSampling bias er en systematisk fejl i dataindsamlingen, hvor udvalget ikke repræsenterer den sande population, hvilket fører til skæve modeller.
- scalarEn skalar er en enkelt numerisk værdi, i modsætning til en vektor, matrix eller tensor.
- scikit-learnScikit-learn er et open-source Python-bibliotek til maskinlæring, bygget på NumPy, SciPy og matplotlib.
- segmentation maskEn segmenteringsmaske er et binært eller flerklasses billede, der angiver, hvilke pixels der tilhører bestemte objekter eller regioner i et inputbillede.
- semantisk søgemaskineEn søgemaskine der bruger semantisk forståelse til at matche forespørgsler med dokumenter baseret på mening frem for nøgleord.
- semantisk søgningSemantisk søgning er en søgeteknik, der forstår brugerens hensigt og ordbetydning i stedet for at matche nøjagtige søgeord.
- semi-supervised classificationKlassifikationsmetode hvor modellen trænes på en kombination af få annoterede og mange uannoterede data for at forbedre præcisionen.
- sequence lengthAntallet af tokens (f.eks. ord eller underord) i en sekvens, der behandles af en sprogmodel.
- sigmoidSigmoidefunktionen er en matematisk funktion med en S-formet kurve, der afbilder enhver reel værdi til et interval mellem 0 og 1.
- sigmoid activationDen sigmoide aktiveringsfunktion er en matematisk funktion, der mapper et reelt tal til et interval mellem 0 og 1, ofte brugt i neurale netværk som en ikke-lineær aktivering.
- sigmoid-aktiveringsfunktionEn matematisk funktion, der mapper et hvilket som helst reelt tal til et tal mellem 0 og 1, ofte brugt som aktiveringsfunktion i neurale netværk.
- sigmoidefunktionEn matematisk funktion, der former input til en S-formet kurve, typisk anvendt til at klemme værdier mellem 0 og 1.
- simuleringSimulering er at efterligne en virkelig proces eller et system ved hjælp af en computermodel, ofte for at studere adfærd, træne AI eller forudsige udfald.
- skalarEn skalar er et enkelt reelt tal, der bruges som størrelse, værdi eller parameter i lineær algebra og maskinlæring.
- skalar multiplikationMultiplikation af en skalær (et enkelt tal) med en vektor eller matrix, hvor hvert element i vektoren/matricen ganges med skalarren.
- sklearnsklearn er et populært Python-bibliotek til maskinlæring, der bygger på NumPy, SciPy og matplotlib.
- Softmax-lagEt softmax-lag er et outputlag i et neuralt netværk, der anvender softmax-funktionen til at konvertere en vektor af logits til en sandsynlighedsfordeling over klasser.
- softmax-layerSoftmax-laget er et outputlag i neurale netværk, der konverterer logits til en sandsynlighedsfordeling, hvor alle sandsynligheder summer til 1.
- sort boksEn sort boks er et AI-system, hvis interne logik og beslutningsproces ikke er synlig eller forståelig for en udenforstående.
- SOTASOTA står for state-of-the-art og refererer til den bedste opnåede præstation inden for en given opgave.
- special-tokenEt særligt token, som modellen bruger til at markere begyndelse, slutning eller særlige kontekster i en sekvens.
- Speech recognitionTalegenkendelse er en teknologi, der konverterer talt sprog til tekst.
- Speech-to-textTeknologi der konverterer talt sprog til skriftlig tekst.
- speech-to-text-systemEt system der konverterer talt sprog til maskinlæsbar tekst.
- state of the artDet højeste præstationsniveau, der på et givet tidspunkt er opnået af et system på en specifik opgave eller benchmark.
- state-of-the-art modelEn state-of-the-art model er den bedst præsterende model inden for et givet domæne på et bestemt tidspunkt.
- stokastisk vektorEn stokastisk vektor er en vektor med ikke-negative elementer, der summerer til 1, og som repræsenterer en sandsynlighedsfordeling over et endeligt antal hændelser.
- stor sprogmodelEn stor sprogmodel er en type neural netværksmodel med et meget stort antal parametre, trænet på store mængder tekstdata, som kan generere og forstå menneskeligt sprog.
- Supervised learningSupervised learning er en maskinlæringsteknik, hvor en model trænes på et mærket datasæt med input-output-par for at lære at forudsige output for nye input.
- supervised learning-modelEn supervised learning-model er en maskinlæringsmodel, der trænes på et mærket datasæt, hvor hvert input har en kendt output-værdi.
- supervised learning-teknikEn teknik inden for maskinlæring, hvor en model trænes ved hjælp af et mærket datasæt, hvor hvert eksempel har en korrekt outputværdi.
- superviseret læringSuperviseret læring er en maskinlæringsmetode, hvor en model trænes på et mærket datasæt, så den kan forudsige output for nye, usete data.
- syntetisk datasætSyntetisk datasæt er et datasæt, der er kunstigt genereret frem for indsamlet fra virkelige hændelser, ofte brugt til træning af AI-modeller når reelle data er knappe, følsomme eller dyre.
- syntetiske dataSyntetiske data er kunstigt genererede data, der efterligner virkelige data, og som anvendes til at træne AI-modeller, når reelle data er knappe, følsomme eller skæve.
- System promptEn system prompt er en indledende besked til en sprogmodel, der angiver kontekst, rolle eller adfærdsregler, som modellen skal følge gennem hele samtalen.
- tabsfunktionEn funktion i AI-systemer, der giver brugeren mulighed for at skifte mellem forskellige visningsområder eller samtaler.
- target domainDet domæne, som en model skal anvendes på, typisk efter at være trænet på et kildedomæne.
- TensorEn tensor er en matematisk struktur, der generaliserer skalarer, vektorer og matricer til et vilkårligt antal dimensioner, og som er den grundlæggende datatype i maskinlæringsbiblioteker som TensorFlow og PyTorch.
- TensorFlowTensorFlow er et open-source maskinlæringsbibliotek udviklet af Google, der anvender datastrømsgrafer til numerisk beregning.
- test sætDel af et datasæt der holdes adskilt fra træning og validering, og kun bruges til at evaluere modellens endelige ydeevne efter al træning.
- test sætEt test sæt er en delmængde af data, der anvendes til at evaluere en maskinlæringsmodels ydeevne efter træning.
- test-sæt-nøjagtighedMåling af andelen af korrekte forudsigelser på et separat testsæt, som modellen ikke har set under træning.
- testdatasætEt testdatasæt er en mængde data, der bruges til at evaluere en trænet models ydeevne på hidtil usete data.
- testdatasætEt testdatasæt er en samling data, der bruges til at evaluere en maskinlæringsmodel efter træning, for at vurdere dens generaliseringsevne på nye, usete data.
- testdatasætsplitOpdeling af et datasæt i separate delmængder (træning, validering, test) for at evaluere en models generaliseringsevne.
- testningEvaluering af en maskinlæringsmodel på et separat testdatasæt for at måle dens præstation på ikke sete data.
- Text-to-speechTeknologi der konverterer skrevet tekst til syntetisk tale.
- TF HubTF Hub er en platform til deling og genbrug af fortrænede maskinlæringsmoduler, primært til TensorFlow.
- TokenEn token er den mindste enhed af tekst, som en sprogmodel behandler, typisk et ord, en underdel af et ord eller et tegn.
- Token-grænseMaksimalt antal tokens en sprogmodel kan behandle i én forespørgsel eller session.
- tokeniseringTokenisering er processen med at opdele en tekst i mindre enheder (tokens), typisk ord, underord eller tegn, som modellen kan behandle.
- TokenizationTokenization er processen med at opdele en tekst i mindre enheder kaldet tokens, som kan være ord, underord eller tegn.
- TokenizerEn tokenizer er et værktøj der opdeler tekst i mindre enheder (tokens) til brug i sprogmodeller.
- transparensTransparens i AI refererer til graden, hvor et AI-systems funktion, beslutningsprocesser og data er åbne, forståelige og forklarbare for interessenter.
- træningTræning er processen, hvor en maskinlæringsmodel lærer fra data ved at justere sine parametre for at minimere en tabsfunktion.
- træningProcessen hvor en maskinlæringsmodel optimerer sine parametre ved at lære fra data gennem gentagne iterationer.
- træningsbatchEn underopdeling af træningsdata, som anvendes i én frem- og tilbagepassage under træning af en neural netværksmodel.
- træningsdataData der bruges til at træne en maskinlæringsmodel, så den lærer mønstre og sammenhænge.
- træningsdatasætEt træningsdatasæt er en samling af data, der bruges til at træne en maskinlæringsmodel ved at justere dens parametre.
- træningslossTræningsloss er gennemsnittet af tabsfunktionsværdierne beregnet over træningsdataene under modeltræning.
- træningssætEt træningssæt er en samling af dataeksempler, der bruges til at træne en maskinlæringsmodel.
- TTSTeknologi der konverterer skrevet tekst til talt tale.
- UnderfittingUnderfitting opstår, når en model er for enkel til at fange datasættets underliggende mønstre.
- unlabeled dataData uden tilhørende etiketter eller annotations.
- Uovervåget indlæringEn type maskinlæring, hvor modellen trænes på data uden mærkater og selv skal finde mønstre eller strukturer.
- uovervåget læringUovervåget læring er en maskinlæringsmetode, hvor modellen trænes på umærkede data uden angivelse af korrekte svar.
- valideringsdatasætValideringsdatasæt er et datasæt, der anvendes til at evaluere modelens præstation under træning uden at påvirke modelparametrene direkte.
- valideringsdatasætEt datasæt der bruges til at evaluere en models præstation under træning uden at påvirke vægtene.
- VectorEn vektor er en ordnet liste af tal, der repræsenterer et punkt i et flerdimensionalt rum, og som bruges til at beskrive data, funktioner eller modellens interne tilstande i AI.
- vektorEn vektor er en ordnet liste af tal, der repræsenterer et punkt i et flerdimensionalt rum, ofte brugt til at repræsentere data som ord eller billeder i AI.
- vektoriseringVektorisering er processen med at omdanne data eller operationer til en vektorrepræsentation, ofte for at udnytte parallelle beregninger eller maskinlæringsmodeller.
- vektorrepræsentationEn numerisk fremstilling af data som en vektor i et flerdimensionelt rum, hvor lighed afspejles i geometriske afstande.
- Vibe codingEn uformel tilgang til programmering, hvor udvikleren bruger naturlige sprogprompter til at interagere med en AI-model for at generere eller modificere kode.
- vægtEn vægt er en lærbar parameter i et neuralt netværk, der multipliceres med input for at beregne output, og som justeres under træning.
- vægtjusteringVægtjustering er opdateringen af en models parametre baseret på gradienten af tabsfunktionen for at minimere fejl.
- WeightEn parameter i et neuralt netværk, der justeres under træning for at minimere tabsfunktionen og bestemmer styrken af forbindelsen mellem neuroner.
- working memoryWorking memory er en mekanisme i neurale netværk og sprogmodeller, der midlertidigt lagrer og manipulerer information under behandling af en opgave.
- Zero initializationInitialisering af alle vægte i et neuralt netværk til nul.
- Zero-shot promptingEn prompt-teknik, hvor en sprogmodel udfører en opgave uden at have set nogen eksempler på opgaven i prompterne.