model

95 termer

BERTBERT er en præ-trænet transformermodel, der bruger bidirektionel kontekst til at lære dybe ordrepræsentationer.
BERT-baseBERT-base er en specifik konfiguration af BERT-modellen med 12 lag, 768 skjulte enheder og 12 opmærksomhedshoveder, hvilket giver cirka 110 millioner parametre.
BERT-largeBERT-large er den store version af BERT-modellen med 340 millioner parametre, trænet på store mængder ustruktureret tekst.
billedklassifikationsmodelEn model, der trænes til at tildele et inputbillede en etiket fra et foruddefineret sæt klasser.
ChatGPTChatGPT er en chatbott baseret på OpenAI's GPT-sprogmodel, der er finjusteret til samtale.
classification modelEn model, der forudsiger en diskret klasse (kategori) for en given input.
computer vision-modelEn computer vision-model er en maskinlæringsmodel trænet til at fortolke og forstå visuel information fra billeder eller video.
Conditional VAEEn generativ model, der udvider VAE med betingelsesvariable for at styre outputtet.
ConvNet-modelEn neural netværksarkitektur, der anvender konvolutionslag til at lære hierarkiske repræsentationer af strukturelle data, typisk billeder.
cross-encoder modelEn cross-encoder model er en transformer-baseret arkitektur, der tager to tekster som input og direkte producerer en sammenligningsscore, typisk til re-ranking eller parvis klassifikation.
CVAEEn CVAE er en variant af variational autoencoder (VAE), der betinger den latente repræsentation på en ekstra inputvariabel for at generere betingede uddata.
deep-RL-agentEn agent i reinforcement learning, der bruger dybe neurale netværk til at tilnærme politik eller værdifunktion.
Denoising Diffusion Probabilistic ModelEn generativ model, der lærer at generere data ved at vende en gradvis støjtilførselsproces om.
Diffusion modelEn generativ model, der lærer at reversere en gradvis støjproces for at generere data fra tilfældig støj.
diffusionsmodelEn generativ model, der lærer at omvendt en støjtilførselsproces for at generere data fra tilfældig støj.
discriminatorEn neural netværkskomponent, der klassificerer inputdata som ægte eller falsk i et generativt adversarisk netværk.
DistilBERTEn mindre og hurtigere version af BERT, trænet ved hjælp af knowledge distillation.
DreamerV3DreamerV3 er en modelbaseret forstærkningslæringsalgoritme, der lærer en verdensmodel fra erfaring og bruger den til at planlægge gennem imaginære baner for at opnå høj præstation på tværs af mange opgaver.
dVAEEn dVAE (discrete Variational Autoencoder) er en type variational autoencoder, der kortlægger kontinuerte inputdata til et diskret latent repræsentationsrum via kvantisering.
embeddingmodelEn neural netværksmodel, der kortlægger diskrete objekter (ord, sætninger, dokumenter) til kontinuerte vektorer i et højdimensionelt rum, kaldet embeddings.
embeddingmodelEn model der konverterer sprogdata (ord, sætninger, dokumenter) til tætte vektorer (embeddings) i et kontinuerligt vektorrum, så semantisk lighed afspejles i afstanden mellem vektorerne.
environment modelEn model, der repræsenterer dynamikken i et miljø, typisk brugt i forstærkningslæring til at forudsige næste tilstand og belønning givet en handling.
few-shot indlæringsmodelEn model der er trænet til at genkende nye klasser eller udføre nye opgaver med kun få træningseksempler.
fortrænet billedmodelEn fortrænet billedmodel er et neuralt netværk, der er blevet trænet på en stor billeddatabase (f.eks. ImageNet) og derefter genbruges eller finjusteres til specifikke opgaver inden for computer vision.
fortrænet modelEn fortrænet model er en maskinlæringsmodel, der er trænet på et stort datasæt og derefter tilpasses til en specifik opgave gennem finjustering.
fortrænet modelEn model, der er trænet på en stor, generel datasæt og efterfølgende finjusteres til en specifik opgave.
fortrænet sprogmodelEn sprogmodel, der er trænet på en stor tekstkorpus og efterfølgende finjusteres til specifikke opgaver.
forudtrænet billede-modelEn forudtrænet billede-model er en neural netværksmodel, der er trænet på et stort datasæt af billeder og efterfølgende anvendes som udgangspunkt for andre opgaver.
forudtrænet ord-embeddingEn forudtrænet ord-embedding er en vektorrepræsentation af ord, der er lært på et stort tekstkorpus og derefter genbrugt i andre NLP-opgaver.
forudtrænet sprogmodelEn sprogmodel der er trænet på en stor generel tekstmængde, typisk ved selvovervåget læring, for derefter at blive finjusteret til specifikke opgaver.
forudtrænet transformerEn transformer-baseret sprogmodel der er blevet forudtrænet på et stort korpus og efterfølgende finjusteres til specifikke NLP-opgaver.
forudtrænet transformer-modelEn transformer-model, der er blevet trænet på en stor mængde tekstdata for at lære generelle sprogmønstre, inden den eventuelt finjusteres til specifikke opgaver.
forudtrænet transformer-modelEn transformer-model, der er blevet trænet på en stor og generel datasæt (foruddannelse) og efterfølgende kan finjusteres til specifikke opgaver.
Foundation modelEn stor, forudtrænet model trænet på bredt data, der kan finjusteres til en bred vifte af opgaver.
generativ AI-modelEn type kunstig intelligens-model, der lærer at generere nye datapunkter lignende dets træningsdata.
Generative modelEn generativ model er en type maskinlæringsmodel, der lærer den underliggende fordeling af træningsdata og kan generere nye, realistiske datapunkter.
generatorEn generator er en neural netværkskomponent der genererer nye data (f.eks. billeder, tekst) fra en latent repræsentation.
GloVeGloVe er en uovervåget læringsalgoritme, der producerer tætte ordvektorer ved at faktorisere en ord-med-forekomstmatrix.
GloVe-modelEn model der lærer ordvektorer ved at udnytte globale co-forekomststatistikker fra et korpus.
GPTGPT er en type sprogmodel baseret på transformeren, der er fortrænet på store tekstmængder og finjusteret til forskellige opgaver.
GPT-3GPT-3 er en stor sprogmodel udviklet af OpenAI, der kan generere menneskelignende tekst baseret på inputprompts.
GPT-4OpenAIs fjerde generation af sprogmodeller i GPT-serien, trænet på store mængder tekst og kode.
kodegenereringsmodelEn maskinlæringsmodel, der automatisk genererer kildekode baseret på en given beskrivelse eller kontekst.
language modelEn sprogmodel er en statistisk eller neural model, der tillægger en sandsynlighed til en sekvens af ord eller tokens.
Large Language ModelEn stor sprogmodel er en neural netværksbaseret model, typisk baseret på transformerarkitekturen, trænet på enorme mængder tekstdata til at generere, forstå og manipulere naturligt sprog.
latent diffusion modelEn latent diffusionsmodel (LDM) er en type generativ model, der udfører diffusionsprocessen i et komprimeret latent rum (indkodet af en VAE) i stedet for i det originale pixelrum, hvilket reducerer beregningsomkostningerne markant.
latent dynamics modelEn latent dynamics model er en model, der lærer overgangsfunktionen for en latent tilstandsrepræsentation i et system, ofte brugt til planlægning og kontrol i forstærkningslæring.
LDMLDM (Latent Diffusion Model) er en type diffusionsmodel, der udfører diffusionsprocessen i et latent repræsentationsrum i stedet for i pixelrummet.
lineær tids modelEn model hvis tidsmæssige kompleksitet er lineær i længden af inputsekvensen, typisk opnået ved at erstatte fuld attention med tilnærmelser eller lineære transformationer.
LLMEn LLM (Large Language Model) er en neural netværksbaseret model, typisk en transformer, trænet på enorme tekstmængder til at generere og forstå menneskeligt sprog.
logistisk regressionEn statistisk model der forudsiger sandsynligheden for en binær udfaldsvariabel ved at anvende en logistisk funktion på en lineær kombination af inputvariabler.
meta-learning modelEn meta-learning model er en model, der er trænet til at lære nye opgaver hurtigt ved at udnytte erfaring fra tidligere opgaver.
multimodal modelEn model der kan behandle og integrere flere datatyper (fx tekst, billeder, lyd).
neural language modelEn neural language model er en type sprogmodel baseret på neurale netværk, der forudsiger sandsynligheden af sekvenser af ord.
neurale sprogmodelEn sprogmodel baseret på neurale netværk, der forudsiger sandsynligheden af sekvenser af ord.
objektdetektionsmodelEn model, der identificerer og lokaliserer objekter i et billede ved at forudsige bounding boxes og klasser.
opsummeringsmodelEn maskinlæringsmodel, der genererer en kortfattet, sammenhængende tekst, der bevarer hovedindholdet i en længere tekst.
ord-embeddingmodelEn model der transformerer sproglige elementer (ord, tokens) til tætte vektorer (embeddings) i et kontinuert vektorrum, så semantisk lighed afspejles i vektorafstande.
PerceptronEn perceptron er den enkleste form for et neuralt netværk, en lineær binær klassifikator.
prætrænet modelEn model, der er trænet på en stor, generel datasæt for at lære grundlæggende repræsentationer, som derefter kan finjusteres til specifikke opgaver.
PTMEn PTM er en model, der er blevet trænet på en stor, generel datasæt, som derefter kan finjusteres til specifikke opgaver.
Recurrent neural networkEn klasse af neurale netværk med hukommelse via tilbagekoblede forbindelser, designet til sekventielle data.
Reranker-modelEn reranker-model er en sekundær model, der rangerer et mindre sæt af kandidatdokumenter efter relevans for en given forespørgsel, typisk brugt efter en grov første udvælgelse.
reranking-modelEn model der genrangerer en liste af kandidater for at forbedre rækkefølgen.
resumé-modelEn AI-model der genererer en kortfattet version af en længere tekst.
Reward modelEn model, der forudsiger en belønningsscore for inputsekvenser for at guide forstærkningslæring.
RLHF-modelEn model, der er finjusteret ved hjælp af forstærkningslæring baseret på menneskelig feedback (RLHF) for at tilpasse sig menneskelige præferencer.
RoBERTaRoBERTa er en forbedret version af BERT, der optimerer træningsproceduren for bedre ydeevne.
score-based generative modelEn generativ model der lærer gradienten af log-sandsynlighedstætheden (score-funktionen) og genererer samples via Langevin-dynamik.
score-based modelEn generativ model der lærer gradienten af datæns log-tæthed (score-funktionen) for at generere nye data via Langevin-dynamik.
sekvensmodelEn sekvensmodel er en type maskinlæringsmodel, der behandler sekventielle data, hvor rækkefølgen af input har betydning, såsom tidsserier, tekst eller tale.
Skip-gramSkip-gram er en neural netværksarkitektur i word2vec, der forudsiger kontekstord ud fra et målord.
Small Language ModelEn sprogmodel med et relativt lille antal parametre, typisk under 1 milliard, optimeret til effektivitet og implementering på enheder med begrænsede ressourcer.
Softmax-regressionEn generalisering af logistisk regression til multiklasse-klassifikation, hvor softmax-funktionen bruges til at forudsige sandsynlighedsfordelingen over flere klasser.
sprogmodelEn sprogmodel er en statistisk eller neural model, der beregner sandsynligheden for sekvenser af ord eller tokens.
SRCNNSRCNN er et konvolutionelt neuralt netværk, der lærer en direkte mapping fra lavopløselige til højopløselige billeder.
SRGANSRGAN er en dyb lærings-model baseret på et generativt adversarial netværk (GAN), der anvendes til at generere højopløsningsbilleder fra lavopløsningsinput.
Stable DiffusionStable Diffusion er en latent diffusionsmodel, der genererer billeder ud fra tekstbeskrivelser ved at anvende en diffusionsproces i et latent rum.
Stable Diffusion XLEn avanceret latent diffusionsmodel til tekst-til-billede-generering, udviklet af Stability AI, der producerer billeder i høj opløsning med forbedret detaljegrad og komposition sammenlignet med forgængeren.
stor sprogmodelEn stor sprogmodel er en type neural netværksmodel med et meget stort antal parametre, trænet på store mængder tekstdata, som kan generere og forstå menneskeligt sprog.
student modelEn mindre, komprimeret model der trænes til at efterligne en større og mere kompleks lærer-models adfærd og prædiktioner.
StyleGAN-ADAStyleGAN-ADA er en variant af StyleGAN, der anvender adaptiv diskriminator-augmentering for at træne på begrænsede datasæt.
StyleGAN3StyleGAN3 er en generativ adversarial netværksarkitektur til billedgenerering, der forbedrer translation- og rotationsækvarians ved at eliminere aliasing i netværket.
supervised learning-modelEn supervised learning-model er en maskinlæringsmodel, der trænes på et mærket datasæt, hvor hvert input har en kendt output-værdi.
sætnings-embedding-modelEn model der transformerer en sætning til en tæt vektor (embedding), som fanger dens semantiske betydning, så sætninger med lignende betydning placeres tæt i vektorrummet.
sætnings-embeddingmodelEn sætnings-embeddingmodel er en neurale netværksmodel, der kortlægger sætninger til fikserede vektorer (embeddings), som fanger sætningens semantiske betydning.
target modelDen model der er genstand for optimering, træning eller tilpasning, i modsætning til en reference-, kilde- eller lærer-model.
tool-augmented language modelEn sprogmodel, der er udvidet med eksterne værktøjer (f.eks. søgning, beregning) for at udføre opgaver uden for ren tekstgenerering.
Transformer-baseret sprogmodelEn transformer-baseret sprogmodel er en neural netværksmodel, der anvender Transformer-arkitekturen til at forudsige eller generere sprog ved at lære mønstre fra store tekstmængder.
Variational AutoencoderEn generativ model der kombinerer en autoencoder med variational inference for at lære en latent repræsentation af data.
voice cloning modelEn model der kan generere tale der lyder som en bestemt person, baseret på en lydprøve.
voice cloning systemEt AI-system der syntetiserer naturligt klingende tale, der efterligner en specifik persons stemme baseret på en lydprøve.
VQ-GANEn generativ adversarial netværksarkitektur, der kombinerer vektorkvantisering i latent rum med en GAN for at lære diskrete repræsentationer til billedgenerering.
Word2vecWord2vec er en familie af neurale netværksmodeller, der lærer vektorrepræsentationer af ord fra store tekstkorpus.
β-VAEβ-VAE er en variant af variational autoencoder (VAE), der introducerer en vægtningsparameter β for at kontrollere graden af disentanglement i den latente repræsentation.