model
95 termer- BERTBERT er en præ-trænet transformermodel, der bruger bidirektionel kontekst til at lære dybe ordrepræsentationer.
- BERT-baseBERT-base er en specifik konfiguration af BERT-modellen med 12 lag, 768 skjulte enheder og 12 opmærksomhedshoveder, hvilket giver cirka 110 millioner parametre.
- BERT-largeBERT-large er den store version af BERT-modellen med 340 millioner parametre, trænet på store mængder ustruktureret tekst.
- billedklassifikationsmodelEn model, der trænes til at tildele et inputbillede en etiket fra et foruddefineret sæt klasser.
- ChatGPTChatGPT er en chatbott baseret på OpenAI's GPT-sprogmodel, der er finjusteret til samtale.
- classification modelEn model, der forudsiger en diskret klasse (kategori) for en given input.
- computer vision-modelEn computer vision-model er en maskinlæringsmodel trænet til at fortolke og forstå visuel information fra billeder eller video.
- Conditional VAEEn generativ model, der udvider VAE med betingelsesvariable for at styre outputtet.
- ConvNet-modelEn neural netværksarkitektur, der anvender konvolutionslag til at lære hierarkiske repræsentationer af strukturelle data, typisk billeder.
- cross-encoder modelEn cross-encoder model er en transformer-baseret arkitektur, der tager to tekster som input og direkte producerer en sammenligningsscore, typisk til re-ranking eller parvis klassifikation.
- CVAEEn CVAE er en variant af variational autoencoder (VAE), der betinger den latente repræsentation på en ekstra inputvariabel for at generere betingede uddata.
- deep-RL-agentEn agent i reinforcement learning, der bruger dybe neurale netværk til at tilnærme politik eller værdifunktion.
- Denoising Diffusion Probabilistic ModelEn generativ model, der lærer at generere data ved at vende en gradvis støjtilførselsproces om.
- Diffusion modelEn generativ model, der lærer at reversere en gradvis støjproces for at generere data fra tilfældig støj.
- diffusionsmodelEn generativ model, der lærer at omvendt en støjtilførselsproces for at generere data fra tilfældig støj.
- discriminatorEn neural netværkskomponent, der klassificerer inputdata som ægte eller falsk i et generativt adversarisk netværk.
- DistilBERTEn mindre og hurtigere version af BERT, trænet ved hjælp af knowledge distillation.
- DreamerV3DreamerV3 er en modelbaseret forstærkningslæringsalgoritme, der lærer en verdensmodel fra erfaring og bruger den til at planlægge gennem imaginære baner for at opnå høj præstation på tværs af mange opgaver.
- dVAEEn dVAE (discrete Variational Autoencoder) er en type variational autoencoder, der kortlægger kontinuerte inputdata til et diskret latent repræsentationsrum via kvantisering.
- embeddingmodelEn neural netværksmodel, der kortlægger diskrete objekter (ord, sætninger, dokumenter) til kontinuerte vektorer i et højdimensionelt rum, kaldet embeddings.
- embeddingmodelEn model der konverterer sprogdata (ord, sætninger, dokumenter) til tætte vektorer (embeddings) i et kontinuerligt vektorrum, så semantisk lighed afspejles i afstanden mellem vektorerne.
- environment modelEn model, der repræsenterer dynamikken i et miljø, typisk brugt i forstærkningslæring til at forudsige næste tilstand og belønning givet en handling.
- few-shot indlæringsmodelEn model der er trænet til at genkende nye klasser eller udføre nye opgaver med kun få træningseksempler.
- fortrænet billedmodelEn fortrænet billedmodel er et neuralt netværk, der er blevet trænet på en stor billeddatabase (f.eks. ImageNet) og derefter genbruges eller finjusteres til specifikke opgaver inden for computer vision.
- fortrænet modelEn fortrænet model er en maskinlæringsmodel, der er trænet på et stort datasæt og derefter tilpasses til en specifik opgave gennem finjustering.
- fortrænet modelEn model, der er trænet på en stor, generel datasæt og efterfølgende finjusteres til en specifik opgave.
- fortrænet sprogmodelEn sprogmodel, der er trænet på en stor tekstkorpus og efterfølgende finjusteres til specifikke opgaver.
- forudtrænet billede-modelEn forudtrænet billede-model er en neural netværksmodel, der er trænet på et stort datasæt af billeder og efterfølgende anvendes som udgangspunkt for andre opgaver.
- forudtrænet ord-embeddingEn forudtrænet ord-embedding er en vektorrepræsentation af ord, der er lært på et stort tekstkorpus og derefter genbrugt i andre NLP-opgaver.
- forudtrænet sprogmodelEn sprogmodel der er trænet på en stor generel tekstmængde, typisk ved selvovervåget læring, for derefter at blive finjusteret til specifikke opgaver.
- forudtrænet transformerEn transformer-baseret sprogmodel der er blevet forudtrænet på et stort korpus og efterfølgende finjusteres til specifikke NLP-opgaver.
- forudtrænet transformer-modelEn transformer-model, der er blevet trænet på en stor mængde tekstdata for at lære generelle sprogmønstre, inden den eventuelt finjusteres til specifikke opgaver.
- forudtrænet transformer-modelEn transformer-model, der er blevet trænet på en stor og generel datasæt (foruddannelse) og efterfølgende kan finjusteres til specifikke opgaver.
- Foundation modelEn stor, forudtrænet model trænet på bredt data, der kan finjusteres til en bred vifte af opgaver.
- generativ AI-modelEn type kunstig intelligens-model, der lærer at generere nye datapunkter lignende dets træningsdata.
- Generative modelEn generativ model er en type maskinlæringsmodel, der lærer den underliggende fordeling af træningsdata og kan generere nye, realistiske datapunkter.
- generatorEn generator er en neural netværkskomponent der genererer nye data (f.eks. billeder, tekst) fra en latent repræsentation.
- GloVeGloVe er en uovervåget læringsalgoritme, der producerer tætte ordvektorer ved at faktorisere en ord-med-forekomstmatrix.
- GloVe-modelEn model der lærer ordvektorer ved at udnytte globale co-forekomststatistikker fra et korpus.
- GPTGPT er en type sprogmodel baseret på transformeren, der er fortrænet på store tekstmængder og finjusteret til forskellige opgaver.
- GPT-3GPT-3 er en stor sprogmodel udviklet af OpenAI, der kan generere menneskelignende tekst baseret på inputprompts.
- GPT-4OpenAIs fjerde generation af sprogmodeller i GPT-serien, trænet på store mængder tekst og kode.
- kodegenereringsmodelEn maskinlæringsmodel, der automatisk genererer kildekode baseret på en given beskrivelse eller kontekst.
- language modelEn sprogmodel er en statistisk eller neural model, der tillægger en sandsynlighed til en sekvens af ord eller tokens.
- Large Language ModelEn stor sprogmodel er en neural netværksbaseret model, typisk baseret på transformerarkitekturen, trænet på enorme mængder tekstdata til at generere, forstå og manipulere naturligt sprog.
- latent diffusion modelEn latent diffusionsmodel (LDM) er en type generativ model, der udfører diffusionsprocessen i et komprimeret latent rum (indkodet af en VAE) i stedet for i det originale pixelrum, hvilket reducerer beregningsomkostningerne markant.
- latent dynamics modelEn latent dynamics model er en model, der lærer overgangsfunktionen for en latent tilstandsrepræsentation i et system, ofte brugt til planlægning og kontrol i forstærkningslæring.
- LDMLDM (Latent Diffusion Model) er en type diffusionsmodel, der udfører diffusionsprocessen i et latent repræsentationsrum i stedet for i pixelrummet.
- lineær tids modelEn model hvis tidsmæssige kompleksitet er lineær i længden af inputsekvensen, typisk opnået ved at erstatte fuld attention med tilnærmelser eller lineære transformationer.
- LLMEn LLM (Large Language Model) er en neural netværksbaseret model, typisk en transformer, trænet på enorme tekstmængder til at generere og forstå menneskeligt sprog.
- logistisk regressionEn statistisk model der forudsiger sandsynligheden for en binær udfaldsvariabel ved at anvende en logistisk funktion på en lineær kombination af inputvariabler.
- meta-learning modelEn meta-learning model er en model, der er trænet til at lære nye opgaver hurtigt ved at udnytte erfaring fra tidligere opgaver.
- multimodal modelEn model der kan behandle og integrere flere datatyper (fx tekst, billeder, lyd).
- neural language modelEn neural language model er en type sprogmodel baseret på neurale netværk, der forudsiger sandsynligheden af sekvenser af ord.
- neurale sprogmodelEn sprogmodel baseret på neurale netværk, der forudsiger sandsynligheden af sekvenser af ord.
- objektdetektionsmodelEn model, der identificerer og lokaliserer objekter i et billede ved at forudsige bounding boxes og klasser.
- opsummeringsmodelEn maskinlæringsmodel, der genererer en kortfattet, sammenhængende tekst, der bevarer hovedindholdet i en længere tekst.
- ord-embeddingmodelEn model der transformerer sproglige elementer (ord, tokens) til tætte vektorer (embeddings) i et kontinuert vektorrum, så semantisk lighed afspejles i vektorafstande.
- PerceptronEn perceptron er den enkleste form for et neuralt netværk, en lineær binær klassifikator.
- prætrænet modelEn model, der er trænet på en stor, generel datasæt for at lære grundlæggende repræsentationer, som derefter kan finjusteres til specifikke opgaver.
- PTMEn PTM er en model, der er blevet trænet på en stor, generel datasæt, som derefter kan finjusteres til specifikke opgaver.
- Recurrent neural networkEn klasse af neurale netværk med hukommelse via tilbagekoblede forbindelser, designet til sekventielle data.
- Reranker-modelEn reranker-model er en sekundær model, der rangerer et mindre sæt af kandidatdokumenter efter relevans for en given forespørgsel, typisk brugt efter en grov første udvælgelse.
- reranking-modelEn model der genrangerer en liste af kandidater for at forbedre rækkefølgen.
- resumé-modelEn AI-model der genererer en kortfattet version af en længere tekst.
- Reward modelEn model, der forudsiger en belønningsscore for inputsekvenser for at guide forstærkningslæring.
- RLHF-modelEn model, der er finjusteret ved hjælp af forstærkningslæring baseret på menneskelig feedback (RLHF) for at tilpasse sig menneskelige præferencer.
- RoBERTaRoBERTa er en forbedret version af BERT, der optimerer træningsproceduren for bedre ydeevne.
- score-based generative modelEn generativ model der lærer gradienten af log-sandsynlighedstætheden (score-funktionen) og genererer samples via Langevin-dynamik.
- score-based modelEn generativ model der lærer gradienten af datæns log-tæthed (score-funktionen) for at generere nye data via Langevin-dynamik.
- sekvensmodelEn sekvensmodel er en type maskinlæringsmodel, der behandler sekventielle data, hvor rækkefølgen af input har betydning, såsom tidsserier, tekst eller tale.
- Skip-gramSkip-gram er en neural netværksarkitektur i word2vec, der forudsiger kontekstord ud fra et målord.
- Small Language ModelEn sprogmodel med et relativt lille antal parametre, typisk under 1 milliard, optimeret til effektivitet og implementering på enheder med begrænsede ressourcer.
- Softmax-regressionEn generalisering af logistisk regression til multiklasse-klassifikation, hvor softmax-funktionen bruges til at forudsige sandsynlighedsfordelingen over flere klasser.
- sprogmodelEn sprogmodel er en statistisk eller neural model, der beregner sandsynligheden for sekvenser af ord eller tokens.
- SRCNNSRCNN er et konvolutionelt neuralt netværk, der lærer en direkte mapping fra lavopløselige til højopløselige billeder.
- SRGANSRGAN er en dyb lærings-model baseret på et generativt adversarial netværk (GAN), der anvendes til at generere højopløsningsbilleder fra lavopløsningsinput.
- Stable DiffusionStable Diffusion er en latent diffusionsmodel, der genererer billeder ud fra tekstbeskrivelser ved at anvende en diffusionsproces i et latent rum.
- Stable Diffusion XLEn avanceret latent diffusionsmodel til tekst-til-billede-generering, udviklet af Stability AI, der producerer billeder i høj opløsning med forbedret detaljegrad og komposition sammenlignet med forgængeren.
- stor sprogmodelEn stor sprogmodel er en type neural netværksmodel med et meget stort antal parametre, trænet på store mængder tekstdata, som kan generere og forstå menneskeligt sprog.
- student modelEn mindre, komprimeret model der trænes til at efterligne en større og mere kompleks lærer-models adfærd og prædiktioner.
- StyleGAN-ADAStyleGAN-ADA er en variant af StyleGAN, der anvender adaptiv diskriminator-augmentering for at træne på begrænsede datasæt.
- StyleGAN3StyleGAN3 er en generativ adversarial netværksarkitektur til billedgenerering, der forbedrer translation- og rotationsækvarians ved at eliminere aliasing i netværket.
- supervised learning-modelEn supervised learning-model er en maskinlæringsmodel, der trænes på et mærket datasæt, hvor hvert input har en kendt output-værdi.
- sætnings-embedding-modelEn model der transformerer en sætning til en tæt vektor (embedding), som fanger dens semantiske betydning, så sætninger med lignende betydning placeres tæt i vektorrummet.
- sætnings-embeddingmodelEn sætnings-embeddingmodel er en neurale netværksmodel, der kortlægger sætninger til fikserede vektorer (embeddings), som fanger sætningens semantiske betydning.
- target modelDen model der er genstand for optimering, træning eller tilpasning, i modsætning til en reference-, kilde- eller lærer-model.
- tool-augmented language modelEn sprogmodel, der er udvidet med eksterne værktøjer (f.eks. søgning, beregning) for at udføre opgaver uden for ren tekstgenerering.
- Transformer-baseret sprogmodelEn transformer-baseret sprogmodel er en neural netværksmodel, der anvender Transformer-arkitekturen til at forudsige eller generere sprog ved at lære mønstre fra store tekstmængder.
- Variational AutoencoderEn generativ model der kombinerer en autoencoder med variational inference for at lære en latent repræsentation af data.
- voice cloning modelEn model der kan generere tale der lyder som en bestemt person, baseret på en lydprøve.
- voice cloning systemEt AI-system der syntetiserer naturligt klingende tale, der efterligner en specifik persons stemme baseret på en lydprøve.
- VQ-GANEn generativ adversarial netværksarkitektur, der kombinerer vektorkvantisering i latent rum med en GAN for at lære diskrete repræsentationer til billedgenerering.
- Word2vecWord2vec er en familie af neurale netværksmodeller, der lærer vektorrepræsentationer af ord fra store tekstkorpus.
- β-VAEβ-VAE er en variant af variational autoencoder (VAE), der introducerer en vægtningsparameter β for at kontrollere graden af disentanglement i den latente repræsentation.