arkitektur

153 termer

activation layerEt aktiveringslag er et lag i et neuralt netværk, der anvender en ikke-lineær funktion på inputtet for at introducere ikke-linearitet.
agent-baseret arkitekturEn softwarearkitektur, hvor et system består af autonome enheder (agenter), der interagerer indbyrdes og med omgivelserne for at nå individuelle eller fælles mål.
AgentarkitekturEn agentarkitektur definerer strukturen af en AI-agent, herunder hvordan den opfatter miljøet, træffer beslutninger og udfører handlinger.
ANNEt ANN (kunstigt neuralt netværk) er et computersystem opbygget af sammenkoblede noder (neuroner) der kan indlære mønstre fra data.
attention-mekanismeEn komponent i neurale netværk der vægter input-sekvensens elementer efter relevans, så modellen kan fokusere på de vigtigste dele af data.
AutoencoderEt autoencoder er et neuralt netværk, der trænes uovervåget til at lære en komprimeret repræsentation af inputdata ved at rekonstruere output, der ligner input så meget som muligt.
BDI-arkitekturBDI-arkitektur er en softwarearkitektur for intelligente agenter baseret på eksplicitte repræsentationer af overbevisninger (beliefs), ønsker (desires) og intentioner (intentions).
Bi-EncoderEn Bi-Encoder er en neural netværksarkitektur, der bruger to separate enkodere til at kortlægge to inputstrenge (f.eks. en forespørgsel og et dokument) hver for sig til vektorer, hvorefter ligheden måles.
bi-GRUbi-GRU er en arkitektur, hvor to GRU'er (Gated Recurrent Units) behandler en sekvens i hver sin retning for at opfange kontekst fra både fortid og fremtid.
Bidirectional GRUEn variant af GRU der behandler sekvenser i både fremad- og bagudrettet retning.
Bidirectional RNNEn type recurrent neural network (RNN), der behandler en sekvens i både fremad- og bagudrettet retning, så hvert tidstrin har adgang til kontekst fra både fortid og fremtid.
bidirektional GRUEn variant af GRU (Gated Recurrent Unit) der behandler sekvenser i både fremad- og bagudrettet retning for at fange kontekst fra begge sider.
BiGRUEn BiGRU er et neuralt netværk bestående af to GRU'er, der læser en inputsekvens henholdsvis forfra og bagfra og sammenkæder deres skjulte tilstande for at fange kontekst fra begge retninger.
biLSTMEn type rekurrent neurale netværk, der behandler sekvenser i både fremad- og bagudgående retning for at fange kontekst fra begge sider.
biLSTM-CRFbiLSTM-CRF er en arkitektur, der anvender en bidirectional LSTM til at fange kontekst fra begge sider af et ord og en CRF til at lære sekvensafhængigheder mellem etiketterne.
bottleneck layerEt lag i et neuralt netværk med færre neuroner end de omkringliggende lag, som tvinger netværket til at lære en komprimeret repræsentation af inputdata.
CNNEn CNN (Convolutional Neural Network) er et neuralt netværk designet til at bearbejde data med grid-lignende topologi, såsom billeder, ved hjælp af konvolutionelle lag til at lære hierarkiske mønstre.
CNN-arkitekturArkitekturen for et konvolutionelt neuralt netværk består af en stak af konvolutionslag, aktiveringsfunktioner, poolinglag og til sidst fuldt forbundne lag, designet til at udtrække hierarkiske træk fra inputdata som billeder.
Conditional GANConditional GAN (cGAN) er en variant af Generative Adversarial Network (GAN), hvor generator og diskriminator modtager en betingelsesvariabel (fx en klasse-etiket) udover støj, så genereringen kan styres.
ConvNetConvNet er en type neuralt netværk, der primært bruger konvolutionslag til at udtrække hierarkiske mønstre fra inputdata som billeder.
ConvNet-lagEt lag i et convolutional neural network, der udfører foldning for at ekstrahere lokale mønstre.
convolutional layerEt convolutional layer er et neuralt netværkslag, der anvender foldningsoperationer (konvolution) på inputdata for at ekstrahere hierarkiske træk, typisk i form af feature maps.
Convolutional neural networkEt neuralt netværk der anvender konvolutionelle lag til at ekstrahere hierarkiske træk fra input som billeder.
cross encoderCross encoder er en neural netværksarkitektur, der behandler et par af sekvenser (fx forespørgsel og dokument) samtidigt og direkte beregner en relevansscore eller relation mellem dem.
cross-attentionCross-attention er en mekanisme i Transformer-modeller, hvor attention beregnes mellem to forskellige sekvenser, typisk en encoder og en decoder.
cross-attention modulEt modul i transformer-arkitekturer der beregner opmærksomhedsfordelingen mellem to forskellige sekvenser (f.eks. en encoder- og en decoder-sekvens) i stedet for inden for én sekvens.
CycleGANEn type generativt modstridende netværk der muliggør uparret billed-til-billede-oversættelse ved hjælp af cykluskonsistens.
DCGANEn DCGAN er en generativ adversarial netværksarkitektur, der anvender dybe konvolutionelle neurale netværk til både generator og diskriminator.
DCGAN-diskriminatorDCGAN-diskriminator er det neurale netværk i en DCGAN, der klassificerer inputbilleder som ægte eller falske ved hjælp af konvolutionelle lag, batch-normalisering og Leaky ReLU-aktivering.
DCGAN-generatorDCGAN-generatoren er den del af et Deep Convolutional GAN, der genererer syntetiske billeder ved hjælp af transponerede convolutionelle lag.
DecoderEn neural netværkskomponent, der transformerer en latent repræsentation til en output-sekvens, ofte ved autoregressiv generering.
decoder stackStakken af identisk opbyggede decoderlag i en transformerarkitektur, der transformerer en målsekvens til en outputsekvens ved hjælp af selvopmærksomhed, krydsopmærksomhed og feedforward-netværk.
decoder-onlyEn transformer-model, som kun består af decoder-lag med kausal maskering og bruges til autoregressiv tekstgenerering.
decoder-only modelEn transformer-model udelukkende bestående af dekoderblokke, typisk brugt til autoregressiv tekstgenerering.
Decoder-only TransformerEn decoder-only transformer er en transformerarkitektur, der kun består af decoderblokke og anvendes til autoregressiv generering af sekvenser uden en separat encoder.
decoderblokEn decoderblok er en komponent i transformer-arkitekturen, der består af et maskeret multi-head attention-lag, et kryds-opmærksomhedslag og et feed-forward neuralt netværk, arrangeret med residualforbindelser og lag-normalisering.
decoderlagEt enkelt lag i en transformer-dekoder, typisk bestående af selvopmærksomhed (maskeret), krydsopmærksomhed (hvis encoder findes) og et feed-forward-netværk.
deep feedforward networkEt dybt feedforward-netværk er et neuralt netværk med flere lag, hvor information flyder fra input til output uden cykler.
deep GRUEn deep GRU er et neuralt netværk med flere stablede GRU-lag, der muliggør læring af hierarkiske tidsmæssige repræsentationer.
deep LSTMEt neuralt netværk med flere LSTM-lag stablet oven på hinanden for at lære hierarkiske tidsmæssige repræsentationer.
deep neural networkEt dybt neuralt netværk er et neuralt netværk med flere skjulte lag mellem input og output.
DekoderblokDekoderblok er en central komponent i transformer-arkitekturen, der bruger selvopmærksomhed og krydsopmærksomhed til at generere outputsekvenser.
deliberativ arkitekturEn arkitektur til sprogmodeller, der eksplicit genererer og evaluerer mellemliggende ræsonnementstrin før et endeligt svar.
Denoising autoencoderEn denoising autoencoder er en autoencoder, der trænes til at rekonstruere et rent input fra en støjfyldt version.
discriminator networkEt neuralt netværk der klassificerer om et input er ægte eller genereret.
distribueret GPU-klyngeEn samling af flere GPU'er forbundet via et højhastighedsnetværk, der arbejder som én enhed for at udføre parallelle beregninger.
DNNEn dyb neurale netværk er et neuralt netværk med mange skjulte lag, der kan lære komplekse mønstre.
dybt neuralt netværkEt neuralt netværk med flere skjulte lag mellem input- og outputlaget, hvilket muliggør indlæring af komplekse hierarkiske repræsentationer.
Embedding-matrixEn embedding-matrix er en vægtmatrix i et neuralt netværk, der kortlægger diskrete tokens til kontinuerte vektorer med lav dimensionalitet.
embeddinglagEt lag i et neuralt netværk, der kortlægger diskrete kategoriske input, såsom ord eller tokens, til tætte vektorer af faste dimensioner.
EncoderEn neural netværkskomponent, der transformerer inputdata til en latent repræsentation.
encoder-decoderEn arkitektur med to neurale netværk: en encoder, der komprimerer input til en latent repræsentation, og en decoder, der genererer output fra denne repræsentation.
encoder-decoder-transformerEn encoder-decoder-transformer er en variant af transformer-arkitekturen, der består af en encoder, der behandler inputsekvensen, og en decoder, der genererer outputsekvensen ved hjælp af krydsopmærksomhed over encoderens repræsentationer.
encoder-onlyEn transformerarkitektur der kun består af encoder-delen, typisk brugt til repræsentationslæring og forståelsesopgaver.
encoder-only modelEn transformer-baseret model bestående udelukkende af encoder-stakken, som genererer en kontekstafhængig repræsentation af inputsekvensen.
encoder-only transformerEn transformerarkitektur der udelukkende består af encoderblokke, anvendt til at generere kontekstuelle repræsentationer af inputsekvenser, typisk til klassifikation eller forståelse.
encoderblokEn encoderblok er en byggesten i en transformer-arkitektur, der består af et multi-head self-attention-lag og et feed-forward neuralt netværk, omgivet af residualforbindelser og lag-normalisering.
expert networkEt ensemble af specialiserede delmodeller (eksperter) styret af en portmekanisme, der vælger eller vægter eksperternes output baseret på inputtet.
feedforward neural networkEt neuralt netværk, hvor informationen flyder i én retning fra input til output uden tilbageløb.
GANEt generativt neuralt netværk bestående af to konkurrerende netværk: en generator og en diskriminator.
gating networkEt gating network er en komponent i en blanding af eksperter (MoE), der bestemmer, hvilke eksperter der skal aktiveres for et givet input.
generativ adversarial networkEt generativt adversarial network (GAN) er en maskinlæringsarkitektur, hvor to neurale netværk – en generator og en diskriminator – konkurrerer mod hinanden for at generere realistiske syntetiske data.
Generative Adversarial NetworkEt neuralt netværk bestående af to modeller, en generator og en diskriminator, der trænes samtidigt i et konkurrencepræget spil, hvor generatoren forsøger at producere data, der kan narre diskriminatoren.
generator-netværkDel af et generativt adversarielt netværk (GAN), der genererer syntetiske data, typisk for at narre diskriminator-netværket.
GRUEn GRU er en variant af en rekurrent neural netværksenhed, der bruger gate-mekanismer til at kontrollere informationsflow og afhjælpe forsvindende gradient-problemet.
GRU-celleGRU-celle er en type tilbagevendende neural netværkscelle med to porte (reset og update), der regulerer informationsflowet og mindsker problemet med forsvindende gradienter.
GRU-lagEt GRU-lag er et neuralt netværkslag baseret på en portstyret recurrent enhed, der løser problemet med forsvindende gradienter i traditionelle RNN’er ved hjælp af opdaterings- og nulstillingsporte.
GRU-netværkGRU-netværk er en variant af et tilbagevendende neuralt netværk (RNN), der bruger opdaterings- og nulstille-porte til at kontrollere informationsstrømmen og afhjælpe forsvindende gradienter.
hybrid arkitekturEn hybrid arkitektur i kunstig intelligens kombinerer to eller flere forskellige arkitekturtyper eller tilgange for at udnytte styrkerne fra hver.
Keras-layerEn byggesten i Keras-modeller, der transformerer data gennem en eller flere operationer såsom fuldt forbundne lag, konvolutioner eller aktiveringsfunktioner.
konvolutionel autoencoderEn konvolutionel autoencoder er en type neuralt netværk, der består af et encoder-netværk med konvolutionelle lag og et decoder-netværk med transponerede konvolutionelle lag, trænet til at rekonstruere inputdata.
konvolutionelt neuralt netværkEt konvolutionelt neuralt netværk (CNN) er en type neurale netværk, der anvender konvolutionelle lag til at lære hierarkiske repræsentationer fra data med grid-lignende topologi, især billeder.
lagEt lag er en samling af neuroner eller enheder i et neuralt netværk, der behandler input og sender output til næste lag.
LeakyReLU-lagEt aktiveringslag i neurale netværk, der anvender LeakyReLU-funktionen, som tillader en lille, ikke-nul gradient for negative inputværdier.
LightningModuleLightningModule er en basisklasse i PyTorch Lightning, der definerer en grænseflade til organisering af deep learning-modeller, herunder forward-pass, træningstrin og konfiguration.
LSTMLSTM er en type recurrent neural network (RNN)-arkitektur, der kan lære langvarige afhængigheder ved hjælp af en hukommelsescelle og porte, der styrer informationsflowet.
LSTM-celleEn LSTM-celle er en byggesten i LSTM-netværk, der kan lære at gemme og glemme information over tid.
LSTM-lagLSTM-lag er et type recurrent neural network lag der anvender gating-mekanismer til at styre informationsflowet og håndtere langtidsafhængigheder.
LSTM-netværkEn type recurrent neuralt netværk, der er designet til at lære langtidsafhængigheder i sekventielle data ved hjælp af hukommelsesceller og gating-mekanismer.
MambaMamba er en state space model-arkitektur designet til effektiv sekvensmodellering med lineær kompleksitet i sekvenslængden, der anvender en selektiv mekanisme til at fokusere på relevant information.
MambaMamba er en modelarkitektur til sekvensmodellering baseret på selective state space models, der opnår lineær kompleksitet og overgår Transformers på langtrækkende opgaver.
Mamba-2Mamba-2 er en state space model (SSM) med en selektiv mekanisme, der forbedrer effektiviteten for lange sekvenser ved at eliminere softmax-opmærksomhed.
Mamba-2-arkitekturMamba-2 er en state space model (SSM) arkitektur, der forbedrer Mamba ved at introducere state space duality (SSD) for effektiv sekventiel behandling uden opmærksomhedsmekanismer.
Mamba-blokMamba-blok er den grundlæggende byggesten i Mamba-modellen, en state space model (SSM) der bruger en selektiv scanning-mekanisme til at opnå lineær tid og hukommelse i forhold til sekvenslængden.
maskeret decoderlagEt lag i en Transformer-decoder der anvender maskering for at forhindre modellen i at se fremtidige tokens under autoregressiv generering.
maskeret multi-head self-attentionEn mekanisme i neurale netværk, hvor opmærksomhedsberegningen begrænses til en specifik del af inputsekvensen ved hjælp af en maske, samtidig med at opmærksomheden opdeles i flere uafhængige hoveder.
memory cellEn komponent i et neuralt netværk, typisk i LSTM, der kan lagre og opdatere information over lange sekvenser.
memory-augmented neural networkEn neural netværksarkitektur, der inkorporerer en ekstern hukommelsesstruktur, som modellen dynamisk kan læse og skrive til under behandling.
Mixture of ExpertsEn arkitektur hvor flere specialiserede netværk (eksperter) kombineres med en gate-mekanisme, så kun et subset aktiveres per input.
modelarkitekturBetegnelse for en maskinlæringsmodel overordnede struktur, herunder antal lag, lagtyper og forbindelser mellem dem.
MoEMoE er en neural netværksarkitektur, der opdeler opgaven i flere specialiserede eksperter og en gate-mekanisme, der dynamisk vælger en sparsom kombination af eksperter for hvert input.
MoE layerEt MoE-lag er et neurale netværkslag der består af flere ekspertnetværk og en gate-mekanisme, som dynamisk vælger en sparsom aktivering af eksperter for hvert input.
Multi-head attentionMulti-head attention er en mekanisme i Transformer-modeller, hvor inputtet opdeles i flere parallelle attention-hoveder, der hver især lærer forskellige repræsentationer af relationer mellem elementer i en sekvens.
multi-head cross-attentionEn mekanisme i transformer-modeller hvor hvert hoved udfører kryds-opmærksomhed mellem to forskellige sekvenser, ofte mellem encoder og decoder.
multi-head opmærksomhedMulti-head opmærksomhed er en mekanisme i Transformer-arkitekturen, der udfører skalær dot-produkt opmærksomhed flere gange parallelt med forskellige lineære projektioner og sammenkæder resultaterne.
multi-head self-attentionMulti-head self-attention er en mekanisme i transformer-arkitekturer, hvor opmærksomheden beregnes parallelt over flere repræsentationsunderrum (heads) for hvert element i en sekvens.
multilayer feedforward networkEt neuralt netværk med mindst ét skjult lag mellem input og output, hvor signaler flyder i én retning (fremad) og ikke danner cykler.
multilayer perceptronEt multilayer perceptron er et kunstigt neuralt netværk bestående af mindst tre lag af neuroner: et inputlag, et eller flere skjulte lag og et outputlag, hvor neuronerne i hvert lag er fuldt forbundet til neuronerne i det næste lag.
multimodal fusionslagEt neuralt netværkslag der kombinerer repræsentationer fra flere datatyper (modaliteter) som tekst, billede og lyd til en fælles repræsentation.
MuZero-netværkMuZero er en forstærkende læringsalgoritme, der kombinerer Monte Carlo-træsøgning med et lært dynamikmodel i latent rum uden adgang til miljøets regler.
Neural networkEt neuralt netværk er en beregningsmodel inspireret af hjernens struktur, bestående af lag af sammenkoblede noder (neuroner) der lærer mønstre fra data.
Neuralt netværkEt neuralt netværk er en beregningsmodel inspireret af hjernens neurale struktur, bestående af lag af sammenkoblede knuder (neuroner) der kan lære komplekse mønstre fra data.
Parametric ReLUParametric ReLU (PReLU) er en aktiveringsfunktion, der tillader en lærebar hældning for negative input, hvilket giver modellen fleksibilitet til at tilpasse ikke-lineariteten.
PReLU-lagEt neuralt netværkslag, der anvender den parametrisk rettede lineære enhed (PReLU) som aktiveringsfunktion, hvilket giver mulighed for at lære hældningen for negative inputværdier under træning.
RAG-generatorDen generative del af et RAG-system, typisk en stor sprogmodel, der producerer svar baseret på kontekst fra en retriever.
reaktiv arkitekturEn softwarearkitektur, der fokuserer på at opbygge systemer, der er responsive, robuste, elastiske og meddelelsesdrevne, især anvendt i AI-systemer til realtidsinferens.
recurrent state space modelEn modelklasse der kombinerer et tilbagevendende neuralt netværk med en tilstandsrummodel for at lære latente repræsentationer af sekventielle data og forudsige fremtidige tilstande.
ResidualblokEn Residualblok er en byggesten i et residualt neuralt netværk, der består af en eller flere vægtede lag kombineret med en springende forbindelse (skip connection), så outputtet er summen af inputtet og transformationen af inputtet.
ResNetResNet er et konvolutionelt neuralt netværk, der anvender residualforbindelser (springforbindelser) til at muliggøre træning af meget dybe netværk med hundredvis eller tusindvis af lag.
retrieverEn komponent i et RAG-system (Retrieval-Augmented Generation) der henter relevante dokumenter eller informationer fra en stor samling baseret på en forespørgsel.
RNNEt RNN er et neuralt netværk med cykliske forbindelser, designet til at behandle sekventielle data.
RNN-celleEn RNN-celle er den grundlæggende byggesten i et rekurrent neuralt netværk, der opdaterer en skjult tilstand baseret på et input og den foregående tilstand.
RNN-lagEt RNN-lag er et neuralt netværkslag med en skjult tilstand, der bevares over tid og muliggør behandling af sekventielle data.
S4S4 er en modelarkitektur baseret på strukturerede tilstandsrum, designet til effektiv behandling af lange sekvenser med lineær eller nær-lineær kompleksitet.
scaled dot product attentionOp mærksomhedsmekanisme, der beregner opmærksomhedsvægte som softmax af skalerede prikprodukter mellem queries og keys.
selektiv tilstandsmodelEn selektiv tilstandsmodel er en type state space model, hvor overgangsdynamikken afhænger af inputtet, så modellen selektivt kan fremhæve eller undertrykke information.
selektiv tilstandsmodel-arkitekturEn neurale netværksarkitektur, der anvender en selektionsmekanisme i tilstandsrummet til at filtrere irrelevante input og opnå effektiv sekvensbehandling.
Self-attentionEn mekanisme i neurale netværk, hvor hvert element i en sekvens vægtes i forhold til alle andre elementer.
self-attention layerEt neuralt netværkslag der beregner vægtede repræsentationer af en sekvens ved at lade hvert element 'kigge på' alle andre elementer.
Self-Attention MechanismSelvopmærksomhedsmekanisme er en operation i neurale netværk, der beregner vægtede repræsentationer af elementer i en sekvens baseret på deres indbyrdes relationer.
seq2seqEn modelarkitektur, der består af en encoder og en decoder, som begge typisk er rekursive neurale netværk (RNN'er), og som transformerer en inputsekvens til en outputsekvens af varierende længde.
seq2seq med attentionEn encoder-decoder-model, hvor decoderens output på hvert tidstrin afhænger af en vægtet sum af encoderens skjulte tilstande, så modellen kan fokusere på relevante dele af inputsekvensen.
seq2seq-modelEn modelarkitektur, der transformerer en inputsekvens til en outputsekvens via en encoder og en decoder, typisk baseret på RNN'er eller transformere.
Softmax-lagEt softmax-lag er et outputlag i et neuralt netværk, der anvender softmax-funktionen til at konvertere en vektor af logits til en sandsynlighedsfordeling over klasser.
softmax-layerSoftmax-laget er et outputlag i neurale netværk, der konverterer logits til en sandsynlighedsfordeling, hvor alle sandsynligheder summer til 1.
Sparse autoencoderEn sparse autoencoder er en type autoencoder, der pålægger en sparsitetsbegrænsning på de latente repræsentationer for at fremme læring af sjældne, men informative features.
sparse mixture of expertsEn neural netværksarkitektur, hvor kun en lille del af 'eksperterne' aktiveres for hvert input, hvilket reducerer beregningsomkostningerne.
sparse MoEEn neural netværksarkitektur, der anvender en gate-mekanisme til at dirigere hvert input til et lille, sparsomt aktiveret subset af ekspertnetværk.
stacked bidirectional LSTMEn neural netværksarkitektur, der stabler flere lag af bidirektionelle LSTM-enheder, så hvert lag behandler input i både fremad- og bagudrettet retning for at indfange hierarkiske tidsmæssige afhængigheder.
stacked LSTMEn arkitektur, hvor flere LSTM-lag stables oven på hinanden, så outputtet fra et lag sendes som input til det næste.
State space modelEn modelklasse der beskriver et dynamisk system ved hjælp af en latent tilstand, der udvikler sig over tid, og som anvendes inden for sekvensmodellering i kunstig intelligens.
Structured State Space ModelEn sekvensmodel der bruger lineære dynamiske systemer til effektiv langtidsafhængighedsmodellering.
struktureret tilstandsmodelEn arkitektur for sekvensmodellering der repræsenterer skjulte tilstande via et struktureret lineært system og opnår lineær kompleksitet i sekvenslængden.
StyleGANStyleGAN er en type GAN med en stilbaseret generator, der muliggør kontrol over forskellige aspekter af det genererede billede ved at manipulere latente variabler.
StyleGAN2StyleGAN2 er en forbedret version af StyleGAN, et generativt adversarial netværk (GAN) til billedsyntese, der adresserer artefakter i StyleGAN og introducerer vægtmodulation.
Switch TransformerSwitch Transformer er en transformerarkitektur, der anvender en blanding af eksperter (MoE) med en 'switch'-routing, hvor hver token kun sendes til én ekspert, hvilket muliggør effektiv skalering til trillioner af parametre.
tensor coreEn specialiseret hardwareenhed i NVIDIA GPU'er designet til effektivt at udføre matrix-multiplikation og andre tensoroperationer, typisk med blandet præcision.
tensor processing unitEn specialbygget hardware-accelerator designet til at udføre tensoroperationer hurtigt og energieffektivt, primært brugt til træning og inferens af neurale netværk.
tilbagekoblet neuralt netværkEt tilbagekoblet neuralt netværk (RNN) er en type neuralt netværk designet til at behandle sekventielle data ved at bevare en intern tilstand over tid gennem feedback-forbindelser.
TransformerTransformer er en neural netværksarkitektur, der udelukkende er baseret på selvopmærksomhedsmekanismer og uden brug af rekurente eller konvolutionelle lag.
Transformer-arkitekturTransformer-arkitekturen er en neural netværksarkitektur, der udelukkende baserer sig på opmærksomhedsmekanismer og har revolutionerende betydning for behandling af sekvensdata.
Transformer-baseretTransformer-baseret beskriver en model eller et system, der bygger på Transformer-arkitekturen, karakteriseret ved attention-mekanismer og parallel behandling.
Transformer-blokEn Transformer-blok er den grundlæggende byggesten i Transformer-modellen, bestående af et multi-head attention-lag efterfulgt af et feed-forward neuralt netværk, hver omgivet af residualforbindelser og layer normalization.
Transformer-decoderDen del af Transformer-arkitekturen, der ansvarlig for autoregressiv generering af outputsekvenser ved at anvende maskeret selvopmærksomhed og krydsopmærksomhed.
Transformer-encoderEn Transformer-encoder er den del af Transformer-arkitekturen, der behandler input-sekvensen ved hjælp af selvopmærksomhed og feed-forward lag for at producere kontekstualiserede repræsentationer for hvert token.
Transformer-modelTransformer-modellen er en neural netværksarkitektur baseret på self-attention-mekanismer, der erstatter rekursive og konvolutionelle lag.
transposed convolutional layerEt transponeret konvolutionslag er en type neuralt netværkslag, der anvender en transponeret konvolution for at opnå op-sampling af en input-featuremap, i modsætning til et almindeligt konvolutionslag, der udfører nedsampling.
VAEEn generativ model der kombinerer en encoder-decoder-struktur med variationel inferens for at lære en latent repræsentation af data.
Vision TransformerVision Transformer (ViT) er en neural netværksarkitektur, der anvender Transformer-modellen direkte på billeder ved at opdele dem i patches og behandle disse som en sekvens af tokens.
ViTVision Transformer (ViT) er en neural netværksarkitektur, der anvender transformer-mekanismen direkte på billeder opdelt i patches.
VQ-VAEVQ-VAE er en type variational autoencoder der anvender vektorkvantisering til at lære diskrete latente repræsentationer.
VQ-VAE-2VQ-VAE-2 er en hierarkisk udgave af VQ-VAE, der bruger flere niveauer af kvantiserede latente repræsentationer og autoregressive priors for at generere højkvalitetsbilleder.
Wasserstein GANEn Generative Adversarial Network (GAN), der anvender Wasserstein-afstanden (Earth Mover's Distance) som tabsfunktion for at stabilisere træningen og undgå mode collapse.