arkitektur
153 termer- activation layerEt aktiveringslag er et lag i et neuralt netværk, der anvender en ikke-lineær funktion på inputtet for at introducere ikke-linearitet.
- agent-baseret arkitekturEn softwarearkitektur, hvor et system består af autonome enheder (agenter), der interagerer indbyrdes og med omgivelserne for at nå individuelle eller fælles mål.
- AgentarkitekturEn agentarkitektur definerer strukturen af en AI-agent, herunder hvordan den opfatter miljøet, træffer beslutninger og udfører handlinger.
- ANNEt ANN (kunstigt neuralt netværk) er et computersystem opbygget af sammenkoblede noder (neuroner) der kan indlære mønstre fra data.
- attention-mekanismeEn komponent i neurale netværk der vægter input-sekvensens elementer efter relevans, så modellen kan fokusere på de vigtigste dele af data.
- AutoencoderEt autoencoder er et neuralt netværk, der trænes uovervåget til at lære en komprimeret repræsentation af inputdata ved at rekonstruere output, der ligner input så meget som muligt.
- BDI-arkitekturBDI-arkitektur er en softwarearkitektur for intelligente agenter baseret på eksplicitte repræsentationer af overbevisninger (beliefs), ønsker (desires) og intentioner (intentions).
- Bi-EncoderEn Bi-Encoder er en neural netværksarkitektur, der bruger to separate enkodere til at kortlægge to inputstrenge (f.eks. en forespørgsel og et dokument) hver for sig til vektorer, hvorefter ligheden måles.
- bi-GRUbi-GRU er en arkitektur, hvor to GRU'er (Gated Recurrent Units) behandler en sekvens i hver sin retning for at opfange kontekst fra både fortid og fremtid.
- Bidirectional GRUEn variant af GRU der behandler sekvenser i både fremad- og bagudrettet retning.
- Bidirectional RNNEn type recurrent neural network (RNN), der behandler en sekvens i både fremad- og bagudrettet retning, så hvert tidstrin har adgang til kontekst fra både fortid og fremtid.
- bidirektional GRUEn variant af GRU (Gated Recurrent Unit) der behandler sekvenser i både fremad- og bagudrettet retning for at fange kontekst fra begge sider.
- BiGRUEn BiGRU er et neuralt netværk bestående af to GRU'er, der læser en inputsekvens henholdsvis forfra og bagfra og sammenkæder deres skjulte tilstande for at fange kontekst fra begge retninger.
- biLSTMEn type rekurrent neurale netværk, der behandler sekvenser i både fremad- og bagudgående retning for at fange kontekst fra begge sider.
- biLSTM-CRFbiLSTM-CRF er en arkitektur, der anvender en bidirectional LSTM til at fange kontekst fra begge sider af et ord og en CRF til at lære sekvensafhængigheder mellem etiketterne.
- bottleneck layerEt lag i et neuralt netværk med færre neuroner end de omkringliggende lag, som tvinger netværket til at lære en komprimeret repræsentation af inputdata.
- CNNEn CNN (Convolutional Neural Network) er et neuralt netværk designet til at bearbejde data med grid-lignende topologi, såsom billeder, ved hjælp af konvolutionelle lag til at lære hierarkiske mønstre.
- CNN-arkitekturArkitekturen for et konvolutionelt neuralt netværk består af en stak af konvolutionslag, aktiveringsfunktioner, poolinglag og til sidst fuldt forbundne lag, designet til at udtrække hierarkiske træk fra inputdata som billeder.
- Conditional GANConditional GAN (cGAN) er en variant af Generative Adversarial Network (GAN), hvor generator og diskriminator modtager en betingelsesvariabel (fx en klasse-etiket) udover støj, så genereringen kan styres.
- ConvNetConvNet er en type neuralt netværk, der primært bruger konvolutionslag til at udtrække hierarkiske mønstre fra inputdata som billeder.
- ConvNet-lagEt lag i et convolutional neural network, der udfører foldning for at ekstrahere lokale mønstre.
- convolutional layerEt convolutional layer er et neuralt netværkslag, der anvender foldningsoperationer (konvolution) på inputdata for at ekstrahere hierarkiske træk, typisk i form af feature maps.
- Convolutional neural networkEt neuralt netværk der anvender konvolutionelle lag til at ekstrahere hierarkiske træk fra input som billeder.
- cross encoderCross encoder er en neural netværksarkitektur, der behandler et par af sekvenser (fx forespørgsel og dokument) samtidigt og direkte beregner en relevansscore eller relation mellem dem.
- cross-attentionCross-attention er en mekanisme i Transformer-modeller, hvor attention beregnes mellem to forskellige sekvenser, typisk en encoder og en decoder.
- cross-attention modulEt modul i transformer-arkitekturer der beregner opmærksomhedsfordelingen mellem to forskellige sekvenser (f.eks. en encoder- og en decoder-sekvens) i stedet for inden for én sekvens.
- CycleGANEn type generativt modstridende netværk der muliggør uparret billed-til-billede-oversættelse ved hjælp af cykluskonsistens.
- DCGANEn DCGAN er en generativ adversarial netværksarkitektur, der anvender dybe konvolutionelle neurale netværk til både generator og diskriminator.
- DCGAN-diskriminatorDCGAN-diskriminator er det neurale netværk i en DCGAN, der klassificerer inputbilleder som ægte eller falske ved hjælp af konvolutionelle lag, batch-normalisering og Leaky ReLU-aktivering.
- DCGAN-generatorDCGAN-generatoren er den del af et Deep Convolutional GAN, der genererer syntetiske billeder ved hjælp af transponerede convolutionelle lag.
- DecoderEn neural netværkskomponent, der transformerer en latent repræsentation til en output-sekvens, ofte ved autoregressiv generering.
- decoder stackStakken af identisk opbyggede decoderlag i en transformerarkitektur, der transformerer en målsekvens til en outputsekvens ved hjælp af selvopmærksomhed, krydsopmærksomhed og feedforward-netværk.
- decoder-onlyEn transformer-model, som kun består af decoder-lag med kausal maskering og bruges til autoregressiv tekstgenerering.
- decoder-only modelEn transformer-model udelukkende bestående af dekoderblokke, typisk brugt til autoregressiv tekstgenerering.
- Decoder-only TransformerEn decoder-only transformer er en transformerarkitektur, der kun består af decoderblokke og anvendes til autoregressiv generering af sekvenser uden en separat encoder.
- decoderblokEn decoderblok er en komponent i transformer-arkitekturen, der består af et maskeret multi-head attention-lag, et kryds-opmærksomhedslag og et feed-forward neuralt netværk, arrangeret med residualforbindelser og lag-normalisering.
- decoderlagEt enkelt lag i en transformer-dekoder, typisk bestående af selvopmærksomhed (maskeret), krydsopmærksomhed (hvis encoder findes) og et feed-forward-netværk.
- deep feedforward networkEt dybt feedforward-netværk er et neuralt netværk med flere lag, hvor information flyder fra input til output uden cykler.
- deep GRUEn deep GRU er et neuralt netværk med flere stablede GRU-lag, der muliggør læring af hierarkiske tidsmæssige repræsentationer.
- deep LSTMEt neuralt netværk med flere LSTM-lag stablet oven på hinanden for at lære hierarkiske tidsmæssige repræsentationer.
- deep neural networkEt dybt neuralt netværk er et neuralt netværk med flere skjulte lag mellem input og output.
- DekoderblokDekoderblok er en central komponent i transformer-arkitekturen, der bruger selvopmærksomhed og krydsopmærksomhed til at generere outputsekvenser.
- deliberativ arkitekturEn arkitektur til sprogmodeller, der eksplicit genererer og evaluerer mellemliggende ræsonnementstrin før et endeligt svar.
- Denoising autoencoderEn denoising autoencoder er en autoencoder, der trænes til at rekonstruere et rent input fra en støjfyldt version.
- discriminator networkEt neuralt netværk der klassificerer om et input er ægte eller genereret.
- distribueret GPU-klyngeEn samling af flere GPU'er forbundet via et højhastighedsnetværk, der arbejder som én enhed for at udføre parallelle beregninger.
- DNNEn dyb neurale netværk er et neuralt netværk med mange skjulte lag, der kan lære komplekse mønstre.
- dybt neuralt netværkEt neuralt netværk med flere skjulte lag mellem input- og outputlaget, hvilket muliggør indlæring af komplekse hierarkiske repræsentationer.
- Embedding-matrixEn embedding-matrix er en vægtmatrix i et neuralt netværk, der kortlægger diskrete tokens til kontinuerte vektorer med lav dimensionalitet.
- embeddinglagEt lag i et neuralt netværk, der kortlægger diskrete kategoriske input, såsom ord eller tokens, til tætte vektorer af faste dimensioner.
- EncoderEn neural netværkskomponent, der transformerer inputdata til en latent repræsentation.
- encoder-decoderEn arkitektur med to neurale netværk: en encoder, der komprimerer input til en latent repræsentation, og en decoder, der genererer output fra denne repræsentation.
- encoder-decoder-transformerEn encoder-decoder-transformer er en variant af transformer-arkitekturen, der består af en encoder, der behandler inputsekvensen, og en decoder, der genererer outputsekvensen ved hjælp af krydsopmærksomhed over encoderens repræsentationer.
- encoder-onlyEn transformerarkitektur der kun består af encoder-delen, typisk brugt til repræsentationslæring og forståelsesopgaver.
- encoder-only modelEn transformer-baseret model bestående udelukkende af encoder-stakken, som genererer en kontekstafhængig repræsentation af inputsekvensen.
- encoder-only transformerEn transformerarkitektur der udelukkende består af encoderblokke, anvendt til at generere kontekstuelle repræsentationer af inputsekvenser, typisk til klassifikation eller forståelse.
- encoderblokEn encoderblok er en byggesten i en transformer-arkitektur, der består af et multi-head self-attention-lag og et feed-forward neuralt netværk, omgivet af residualforbindelser og lag-normalisering.
- expert networkEt ensemble af specialiserede delmodeller (eksperter) styret af en portmekanisme, der vælger eller vægter eksperternes output baseret på inputtet.
- feedforward neural networkEt neuralt netværk, hvor informationen flyder i én retning fra input til output uden tilbageløb.
- GANEt generativt neuralt netværk bestående af to konkurrerende netværk: en generator og en diskriminator.
- gating networkEt gating network er en komponent i en blanding af eksperter (MoE), der bestemmer, hvilke eksperter der skal aktiveres for et givet input.
- generativ adversarial networkEt generativt adversarial network (GAN) er en maskinlæringsarkitektur, hvor to neurale netværk – en generator og en diskriminator – konkurrerer mod hinanden for at generere realistiske syntetiske data.
- Generative Adversarial NetworkEt neuralt netværk bestående af to modeller, en generator og en diskriminator, der trænes samtidigt i et konkurrencepræget spil, hvor generatoren forsøger at producere data, der kan narre diskriminatoren.
- generator-netværkDel af et generativt adversarielt netværk (GAN), der genererer syntetiske data, typisk for at narre diskriminator-netværket.
- GRUEn GRU er en variant af en rekurrent neural netværksenhed, der bruger gate-mekanismer til at kontrollere informationsflow og afhjælpe forsvindende gradient-problemet.
- GRU-celleGRU-celle er en type tilbagevendende neural netværkscelle med to porte (reset og update), der regulerer informationsflowet og mindsker problemet med forsvindende gradienter.
- GRU-lagEt GRU-lag er et neuralt netværkslag baseret på en portstyret recurrent enhed, der løser problemet med forsvindende gradienter i traditionelle RNN’er ved hjælp af opdaterings- og nulstillingsporte.
- GRU-netværkGRU-netværk er en variant af et tilbagevendende neuralt netværk (RNN), der bruger opdaterings- og nulstille-porte til at kontrollere informationsstrømmen og afhjælpe forsvindende gradienter.
- hybrid arkitekturEn hybrid arkitektur i kunstig intelligens kombinerer to eller flere forskellige arkitekturtyper eller tilgange for at udnytte styrkerne fra hver.
- Keras-layerEn byggesten i Keras-modeller, der transformerer data gennem en eller flere operationer såsom fuldt forbundne lag, konvolutioner eller aktiveringsfunktioner.
- konvolutionel autoencoderEn konvolutionel autoencoder er en type neuralt netværk, der består af et encoder-netværk med konvolutionelle lag og et decoder-netværk med transponerede konvolutionelle lag, trænet til at rekonstruere inputdata.
- konvolutionelt neuralt netværkEt konvolutionelt neuralt netværk (CNN) er en type neurale netværk, der anvender konvolutionelle lag til at lære hierarkiske repræsentationer fra data med grid-lignende topologi, især billeder.
- lagEt lag er en samling af neuroner eller enheder i et neuralt netværk, der behandler input og sender output til næste lag.
- LeakyReLU-lagEt aktiveringslag i neurale netværk, der anvender LeakyReLU-funktionen, som tillader en lille, ikke-nul gradient for negative inputværdier.
- LightningModuleLightningModule er en basisklasse i PyTorch Lightning, der definerer en grænseflade til organisering af deep learning-modeller, herunder forward-pass, træningstrin og konfiguration.
- LSTMLSTM er en type recurrent neural network (RNN)-arkitektur, der kan lære langvarige afhængigheder ved hjælp af en hukommelsescelle og porte, der styrer informationsflowet.
- LSTM-celleEn LSTM-celle er en byggesten i LSTM-netværk, der kan lære at gemme og glemme information over tid.
- LSTM-lagLSTM-lag er et type recurrent neural network lag der anvender gating-mekanismer til at styre informationsflowet og håndtere langtidsafhængigheder.
- LSTM-netværkEn type recurrent neuralt netværk, der er designet til at lære langtidsafhængigheder i sekventielle data ved hjælp af hukommelsesceller og gating-mekanismer.
- MambaMamba er en state space model-arkitektur designet til effektiv sekvensmodellering med lineær kompleksitet i sekvenslængden, der anvender en selektiv mekanisme til at fokusere på relevant information.
- MambaMamba er en modelarkitektur til sekvensmodellering baseret på selective state space models, der opnår lineær kompleksitet og overgår Transformers på langtrækkende opgaver.
- Mamba-2Mamba-2 er en state space model (SSM) med en selektiv mekanisme, der forbedrer effektiviteten for lange sekvenser ved at eliminere softmax-opmærksomhed.
- Mamba-2-arkitekturMamba-2 er en state space model (SSM) arkitektur, der forbedrer Mamba ved at introducere state space duality (SSD) for effektiv sekventiel behandling uden opmærksomhedsmekanismer.
- Mamba-blokMamba-blok er den grundlæggende byggesten i Mamba-modellen, en state space model (SSM) der bruger en selektiv scanning-mekanisme til at opnå lineær tid og hukommelse i forhold til sekvenslængden.
- maskeret decoderlagEt lag i en Transformer-decoder der anvender maskering for at forhindre modellen i at se fremtidige tokens under autoregressiv generering.
- maskeret multi-head self-attentionEn mekanisme i neurale netværk, hvor opmærksomhedsberegningen begrænses til en specifik del af inputsekvensen ved hjælp af en maske, samtidig med at opmærksomheden opdeles i flere uafhængige hoveder.
- memory cellEn komponent i et neuralt netværk, typisk i LSTM, der kan lagre og opdatere information over lange sekvenser.
- memory-augmented neural networkEn neural netværksarkitektur, der inkorporerer en ekstern hukommelsesstruktur, som modellen dynamisk kan læse og skrive til under behandling.
- Mixture of ExpertsEn arkitektur hvor flere specialiserede netværk (eksperter) kombineres med en gate-mekanisme, så kun et subset aktiveres per input.
- modelarkitekturBetegnelse for en maskinlæringsmodel overordnede struktur, herunder antal lag, lagtyper og forbindelser mellem dem.
- MoEMoE er en neural netværksarkitektur, der opdeler opgaven i flere specialiserede eksperter og en gate-mekanisme, der dynamisk vælger en sparsom kombination af eksperter for hvert input.
- MoE layerEt MoE-lag er et neurale netværkslag der består af flere ekspertnetværk og en gate-mekanisme, som dynamisk vælger en sparsom aktivering af eksperter for hvert input.
- Multi-head attentionMulti-head attention er en mekanisme i Transformer-modeller, hvor inputtet opdeles i flere parallelle attention-hoveder, der hver især lærer forskellige repræsentationer af relationer mellem elementer i en sekvens.
- multi-head cross-attentionEn mekanisme i transformer-modeller hvor hvert hoved udfører kryds-opmærksomhed mellem to forskellige sekvenser, ofte mellem encoder og decoder.
- multi-head opmærksomhedMulti-head opmærksomhed er en mekanisme i Transformer-arkitekturen, der udfører skalær dot-produkt opmærksomhed flere gange parallelt med forskellige lineære projektioner og sammenkæder resultaterne.
- multi-head self-attentionMulti-head self-attention er en mekanisme i transformer-arkitekturer, hvor opmærksomheden beregnes parallelt over flere repræsentationsunderrum (heads) for hvert element i en sekvens.
- multilayer feedforward networkEt neuralt netværk med mindst ét skjult lag mellem input og output, hvor signaler flyder i én retning (fremad) og ikke danner cykler.
- multilayer perceptronEt multilayer perceptron er et kunstigt neuralt netværk bestående af mindst tre lag af neuroner: et inputlag, et eller flere skjulte lag og et outputlag, hvor neuronerne i hvert lag er fuldt forbundet til neuronerne i det næste lag.
- multimodal fusionslagEt neuralt netværkslag der kombinerer repræsentationer fra flere datatyper (modaliteter) som tekst, billede og lyd til en fælles repræsentation.
- MuZero-netværkMuZero er en forstærkende læringsalgoritme, der kombinerer Monte Carlo-træsøgning med et lært dynamikmodel i latent rum uden adgang til miljøets regler.
- Neural networkEt neuralt netværk er en beregningsmodel inspireret af hjernens struktur, bestående af lag af sammenkoblede noder (neuroner) der lærer mønstre fra data.
- Neuralt netværkEt neuralt netværk er en beregningsmodel inspireret af hjernens neurale struktur, bestående af lag af sammenkoblede knuder (neuroner) der kan lære komplekse mønstre fra data.
- Parametric ReLUParametric ReLU (PReLU) er en aktiveringsfunktion, der tillader en lærebar hældning for negative input, hvilket giver modellen fleksibilitet til at tilpasse ikke-lineariteten.
- PReLU-lagEt neuralt netværkslag, der anvender den parametrisk rettede lineære enhed (PReLU) som aktiveringsfunktion, hvilket giver mulighed for at lære hældningen for negative inputværdier under træning.
- RAG-generatorDen generative del af et RAG-system, typisk en stor sprogmodel, der producerer svar baseret på kontekst fra en retriever.
- reaktiv arkitekturEn softwarearkitektur, der fokuserer på at opbygge systemer, der er responsive, robuste, elastiske og meddelelsesdrevne, især anvendt i AI-systemer til realtidsinferens.
- recurrent state space modelEn modelklasse der kombinerer et tilbagevendende neuralt netværk med en tilstandsrummodel for at lære latente repræsentationer af sekventielle data og forudsige fremtidige tilstande.
- ResidualblokEn Residualblok er en byggesten i et residualt neuralt netværk, der består af en eller flere vægtede lag kombineret med en springende forbindelse (skip connection), så outputtet er summen af inputtet og transformationen af inputtet.
- ResNetResNet er et konvolutionelt neuralt netværk, der anvender residualforbindelser (springforbindelser) til at muliggøre træning af meget dybe netværk med hundredvis eller tusindvis af lag.
- retrieverEn komponent i et RAG-system (Retrieval-Augmented Generation) der henter relevante dokumenter eller informationer fra en stor samling baseret på en forespørgsel.
- RNNEt RNN er et neuralt netværk med cykliske forbindelser, designet til at behandle sekventielle data.
- RNN-celleEn RNN-celle er den grundlæggende byggesten i et rekurrent neuralt netværk, der opdaterer en skjult tilstand baseret på et input og den foregående tilstand.
- RNN-lagEt RNN-lag er et neuralt netværkslag med en skjult tilstand, der bevares over tid og muliggør behandling af sekventielle data.
- S4S4 er en modelarkitektur baseret på strukturerede tilstandsrum, designet til effektiv behandling af lange sekvenser med lineær eller nær-lineær kompleksitet.
- scaled dot product attentionOp mærksomhedsmekanisme, der beregner opmærksomhedsvægte som softmax af skalerede prikprodukter mellem queries og keys.
- selektiv tilstandsmodelEn selektiv tilstandsmodel er en type state space model, hvor overgangsdynamikken afhænger af inputtet, så modellen selektivt kan fremhæve eller undertrykke information.
- selektiv tilstandsmodel-arkitekturEn neurale netværksarkitektur, der anvender en selektionsmekanisme i tilstandsrummet til at filtrere irrelevante input og opnå effektiv sekvensbehandling.
- Self-attentionEn mekanisme i neurale netværk, hvor hvert element i en sekvens vægtes i forhold til alle andre elementer.
- self-attention layerEt neuralt netværkslag der beregner vægtede repræsentationer af en sekvens ved at lade hvert element 'kigge på' alle andre elementer.
- Self-Attention MechanismSelvopmærksomhedsmekanisme er en operation i neurale netværk, der beregner vægtede repræsentationer af elementer i en sekvens baseret på deres indbyrdes relationer.
- seq2seqEn modelarkitektur, der består af en encoder og en decoder, som begge typisk er rekursive neurale netværk (RNN'er), og som transformerer en inputsekvens til en outputsekvens af varierende længde.
- seq2seq med attentionEn encoder-decoder-model, hvor decoderens output på hvert tidstrin afhænger af en vægtet sum af encoderens skjulte tilstande, så modellen kan fokusere på relevante dele af inputsekvensen.
- seq2seq-modelEn modelarkitektur, der transformerer en inputsekvens til en outputsekvens via en encoder og en decoder, typisk baseret på RNN'er eller transformere.
- Softmax-lagEt softmax-lag er et outputlag i et neuralt netværk, der anvender softmax-funktionen til at konvertere en vektor af logits til en sandsynlighedsfordeling over klasser.
- softmax-layerSoftmax-laget er et outputlag i neurale netværk, der konverterer logits til en sandsynlighedsfordeling, hvor alle sandsynligheder summer til 1.
- Sparse autoencoderEn sparse autoencoder er en type autoencoder, der pålægger en sparsitetsbegrænsning på de latente repræsentationer for at fremme læring af sjældne, men informative features.
- sparse mixture of expertsEn neural netværksarkitektur, hvor kun en lille del af 'eksperterne' aktiveres for hvert input, hvilket reducerer beregningsomkostningerne.
- sparse MoEEn neural netværksarkitektur, der anvender en gate-mekanisme til at dirigere hvert input til et lille, sparsomt aktiveret subset af ekspertnetværk.
- stacked bidirectional LSTMEn neural netværksarkitektur, der stabler flere lag af bidirektionelle LSTM-enheder, så hvert lag behandler input i både fremad- og bagudrettet retning for at indfange hierarkiske tidsmæssige afhængigheder.
- stacked LSTMEn arkitektur, hvor flere LSTM-lag stables oven på hinanden, så outputtet fra et lag sendes som input til det næste.
- State space modelEn modelklasse der beskriver et dynamisk system ved hjælp af en latent tilstand, der udvikler sig over tid, og som anvendes inden for sekvensmodellering i kunstig intelligens.
- Structured State Space ModelEn sekvensmodel der bruger lineære dynamiske systemer til effektiv langtidsafhængighedsmodellering.
- struktureret tilstandsmodelEn arkitektur for sekvensmodellering der repræsenterer skjulte tilstande via et struktureret lineært system og opnår lineær kompleksitet i sekvenslængden.
- StyleGANStyleGAN er en type GAN med en stilbaseret generator, der muliggør kontrol over forskellige aspekter af det genererede billede ved at manipulere latente variabler.
- StyleGAN2StyleGAN2 er en forbedret version af StyleGAN, et generativt adversarial netværk (GAN) til billedsyntese, der adresserer artefakter i StyleGAN og introducerer vægtmodulation.
- Switch TransformerSwitch Transformer er en transformerarkitektur, der anvender en blanding af eksperter (MoE) med en 'switch'-routing, hvor hver token kun sendes til én ekspert, hvilket muliggør effektiv skalering til trillioner af parametre.
- tensor coreEn specialiseret hardwareenhed i NVIDIA GPU'er designet til effektivt at udføre matrix-multiplikation og andre tensoroperationer, typisk med blandet præcision.
- tensor processing unitEn specialbygget hardware-accelerator designet til at udføre tensoroperationer hurtigt og energieffektivt, primært brugt til træning og inferens af neurale netværk.
- tilbagekoblet neuralt netværkEt tilbagekoblet neuralt netværk (RNN) er en type neuralt netværk designet til at behandle sekventielle data ved at bevare en intern tilstand over tid gennem feedback-forbindelser.
- TransformerTransformer er en neural netværksarkitektur, der udelukkende er baseret på selvopmærksomhedsmekanismer og uden brug af rekurente eller konvolutionelle lag.
- Transformer-arkitekturTransformer-arkitekturen er en neural netværksarkitektur, der udelukkende baserer sig på opmærksomhedsmekanismer og har revolutionerende betydning for behandling af sekvensdata.
- Transformer-baseretTransformer-baseret beskriver en model eller et system, der bygger på Transformer-arkitekturen, karakteriseret ved attention-mekanismer og parallel behandling.
- Transformer-blokEn Transformer-blok er den grundlæggende byggesten i Transformer-modellen, bestående af et multi-head attention-lag efterfulgt af et feed-forward neuralt netværk, hver omgivet af residualforbindelser og layer normalization.
- Transformer-decoderDen del af Transformer-arkitekturen, der ansvarlig for autoregressiv generering af outputsekvenser ved at anvende maskeret selvopmærksomhed og krydsopmærksomhed.
- Transformer-encoderEn Transformer-encoder er den del af Transformer-arkitekturen, der behandler input-sekvensen ved hjælp af selvopmærksomhed og feed-forward lag for at producere kontekstualiserede repræsentationer for hvert token.
- Transformer-modelTransformer-modellen er en neural netværksarkitektur baseret på self-attention-mekanismer, der erstatter rekursive og konvolutionelle lag.
- transposed convolutional layerEt transponeret konvolutionslag er en type neuralt netværkslag, der anvender en transponeret konvolution for at opnå op-sampling af en input-featuremap, i modsætning til et almindeligt konvolutionslag, der udfører nedsampling.
- VAEEn generativ model der kombinerer en encoder-decoder-struktur med variationel inferens for at lære en latent repræsentation af data.
- Vision TransformerVision Transformer (ViT) er en neural netværksarkitektur, der anvender Transformer-modellen direkte på billeder ved at opdele dem i patches og behandle disse som en sekvens af tokens.
- ViTVision Transformer (ViT) er en neural netværksarkitektur, der anvender transformer-mekanismen direkte på billeder opdelt i patches.
- VQ-VAEVQ-VAE er en type variational autoencoder der anvender vektorkvantisering til at lære diskrete latente repræsentationer.
- VQ-VAE-2VQ-VAE-2 er en hierarkisk udgave af VQ-VAE, der bruger flere niveauer af kvantiserede latente repræsentationer og autoregressive priors for at generere højkvalitetsbilleder.
- Wasserstein GANEn Generative Adversarial Network (GAN), der anvender Wasserstein-afstanden (Earth Mover's Distance) som tabsfunktion for at stabilisere træningen og undgå mode collapse.