Bag kulisserne
Sådan bragte vi præsident Nixon til live igen
(Og gjorde det af med astronauterne fra Apollo 11)
Historien
Vores inspiration var beredskabstalen for Apollo 11-missionen.
Den blev skrevet af præsident Richard Nixons taleskriver, Bill Safire, som skrev den i tilfælde af en ulykke på missionen.
Den farligste del af den otte dage lange rejse var at forlade Månen. Michael Collins, den "tredje astronaut" på missionen, sagde, at han "ikke ville give bedre end lige odds på en vellykket landing og tilbagevenden."
Det visuelle
Deepfakes er lavet ved hjælp af en type kunstig intelligens kaldet deep learning. Deep learning fungerer lidt som den menneskelige hjerne ved at genkende mønstre i data og "lære" ud fra dem.
Vi brugte "Video Dialogue Replacement" til at træne en AI-model til at "forstå" ansigtsbevægelser. Ved at bruge masser af visuelle data om menneskelige ansigter "lærer" den de forskellige ansigtsdele at kende, og hvordan de bevæger sig sammen, når folk taler. AI'en kan derefter rekonstruere videoer billede for billede på en realistisk måde.
For at lave deepfaken havde vi først brug for en "mål"-video.
Vores nye video skulle se ud nøjagtig som denne, bortset fra at munden skulle sige de nye ord. Alle bevægelser og manerer, herunder hans hovedbevægelser, hænder, der blandede papirer og blinkende øjne, skulle forblive de samme.
Vi valgte Nixons afskedstale, fordi den havde den rigtige alvorlige og dystre tone.
Vi filmede en skuespiller, der udførte beredskabstalen.
Fordi AI'en kunne forstå ansigter, var den i stand til at overføre vores skuespillers ansigtsbevægelse til Nixons ansigt i fratrædelsesvideoen.
Lyden
Vi havde også brug for en syntetisk version af Nixons stemme, så vi var nødt til at udvikle en AI-model til lyd.
Igen var vi nødt til at fodre modellen med masser af data. Vores skuespiller optog hundredvis af korte klip med Nixons Vietnamkrigs-taler.
Vi havde derefter to parallelle sæt lyd: de originale Nixon-klip og vores skuespiller, der gentog dem.
Det gjorde det muligt for AI'en at lære at "oversætte" den ene stemme til den anden.
Vi optog derefter vores skuespiller, der læste beredskabstalen, og AI'en "konverterede" den til Nixons stemme.
Den komplette Deepfake
Til sidst synkroniserede vi videoen og lyden og fik vores "komplette deepfake."
Ressourcer
Skuespiller gentager
--:--
--:--
Skuespiller træningsklip
--:--
--:--
Skuespiller holder talen
--:--
--:--
Endelig AI-version
--:--
--:--