Google researchers find novel way of turning a single photo of a human into AI-generated video good enough to make you think ‘this might go badly’-

Google researchers have found a way to create video versions of humans generated from just a single still image. This enables it to do things like, generate a video of someone speaking from input text, or changing a person’s mouth movements to match an audio track in a different language to the one originally spoken. It also feels like a slippery slope into identity theft and misinformation, but what’s AI if not with a hint of frightening consequences.

The tech itself is rather interesting: it’s called Vlogger by the Google researchers that published the paper. In it the authors (Enric Corona et al) offer up various examples of how the AI takes a single input image of a human—in this case, I believe mostly AI-generated humans—and with an audio file produces both facial and bodily movements for them to match.

That’s just one of a few potential use cases for the tech. Another is editing video, specifically a video subject’s facial expressions. In an example, the researchers show various versions of the same clip: one has a presenter speaking to camera, another with the presenter’s mouth closed in an eerie fashion, another with their eyes closed. My favourite is the video of the presenter with their eyes artificially held open by the AI, unblinking. Huge serial killer vibes. Thanks, AI.

The most useful feature in my opinion is the ability to swap an audio track for a video with a dubbed foreign language version and have the AI lip-sync the person’s facial movements to the audio track.

It works through the use of two stages: “1) a stochastic human-to-3d-motion diffusion model, and 2) a novel diffusion based architecture that augments text-to-image models with both temporal and spatial controls. This approach enables the generation of high quality videos of variable length, that are easily controllable through high-level representations of human faces and bodies,” the GitHub page says.

Admittedly the tech isn’t perfect. In the examples given the mouth movements have certain qualities common across AI-generated video content. It’s also pretty creepy at times, as noted by users responding to a thread about the technology by EyeingAI on X. But Vlogger doesn’t need to fool everyone, or even fool anyone at all, to have some use. Similarly, if it were a more perfect technology, it’d be even more worrying to think about how this technology could be used to create deep fakes, spread misinformation, or steal identities. We’ll get there one day, and I for one hope we have some handle on how to deal with this stuff a bit more by then. 

Related Posts

เชียเรอร์ฟันผีไม่รอดเกมเยือนวิลล่าพาร์ค

อดีตกองหน้าทีมชาติอังกฤษวิเคราะห์ว่า “แอสตัน วิลล่า เปิดบ้านรับ แมนเชสเตอร์ ยูไนเต็ด ในวันอาทิตย์ และมันเป็นเกมใหญ่ โดยเฉพาะอย่างยิ่งกับทีมเยือน, แมนฯ ยูไนเต็ด จะแพ้ไม่ได้อีกแล้ว สำหรับ แอสตัน วิลล่า พวกเขาเล่นในบ้าน พวกเขาจะพยายามเต็มที่เพื่อเก็บแต้มและใช้โมเมนตัมจากการชนะ บาเยิร์น เมื่อกลางสัปดาห์” “อูไน เอเมรี่ ทำงานได้อย่างยอดเยี่ยมที่ แอสตัน วิลล่า แง่ของสโมสรฟุตบอลทั้งสโมสร เมื่อคุณมองว่าพวกเขาอยู่จุดไหนในตอนนี้เทียบตอนที่เขาเข้ามารับงาน ผมไม่แปลกใจที่…

สื่ออ้างบาร์ซ่าอาจรอหวนคืนคัมป์นูช่วงเดือนเม.ย.

เรเลโบ สื่อเมืองกระทิงรายงานเมื่อวันอังคารที่ผ่านมาว่าแผนการหวนคืนสังเวียน สปอติฟาย คัมป์ นู ของ บาร์เซโลน่า ล่าช้ากว่าที่คาดการณ์ในตอนแรกและอาจต้องรอจนถึงช่วงเดือนเมษายนศกหน้า ราวหนึ่งเดือนก่อนหน้านี้ โจน ลาปอร์ต้า ประธานสโมสร บาร์เซโลน่า ยืนกรานว่าการปรับโฉมสนาม สปอติฟาย คัมป์ นู เดินหน้าไปตามกำหนดและทีมอาซูลกราน่าเตรียมหวนคืนรังเหย้าของพวกเขาในช่วงปลายปีนี้ เมื่อการปรับปรุงสนามบางส่วนเสร็จสิ้นลงและจะลดความจุเหลือ 64,000 ที่นั่ง อย่างไรก็ตามการก่อสร้างดำเนินไปอย่างล่าช้าหลังสภาเมืองบาร์เซโลน่าถูกร้องเรียนหลายครั้งเกี่ยวกับมลพิษทางเสียงจากการก่อสร้างดังกล่าวทำให้ต้องกำหนดช่วงเวลาการทำงานที่ส่งผลกระทบต่อแผนงานของสโมสรโดยตรง แม้ว่าจะได้รับอนุญาตให้การมีทำงานได้ตลอด 24 ชั่วโมงก่อนหน้านี้ไม่นานนักก็ตาม จากรายงานก่อนหน้านี้ระบุว่า บาร์เซโลน่า…

มิเกลปลุกฟุตซอลไทยเชือดไก่

ณ สนาม โอลิมปิก แอนด์ พาราลิมปิก เทรนนิ่งเซ็นเตอร์ เมืองบูคารา ประเทศอุซเบกีสถาน ฟุตซอลชายทีมชาติไทยลงฝึกซ้อมเพื่อเตรียมความพร้อมก่อนทำศึกฟุตซอลชิงแชมป์โลก 2024 รอบ 16 ทีมสุดท้าย กับทีมชาติฝรั่งเศส การฝึกซ้อมครั้งนี้ มิเกล โรดริโก้ เฮดโค้ชทีมไทย เน้นที่แท็คติก,การจบสกอร์ และปิดท้ายด้วยลูกจุดโทษ ใช้เวลา 1 ชั่วโมง 15 นาที ก่อนการฝึกซ้อม มิเกล…

เทย์เลอร์-บริตต์ไม่เสียใจเคยปรามาสทีมบุกคอมแมนเดอร์ส

แคม เทย์เลอร์-บริตต์ คอร์เนอร์แบ็กวัย 24 ปีของ ซินซินเนติ เบงกอลส์ ยืนยันว่าเขาไม่เสียใจที่เคยปรามาส วอชิงตัน คอมแมนเดอร์ส เกี่ยวกับการเล่นเกมรุกระดับคอลเลจที่ยอดเยี่ยม ก่อนทีมเสือลายพาดกลอนจะพ่ายคู่แข่งคาบ้าน 33-38 ตามรายงานจาก ซินซินเนติ เอ็นไควเรอร์ 'ผมไม่เสียใจเลย ผมไม่มีเจตนาจะทำร้ายใครจากความคิดเห็นนั้น มันยิ่งใหญ่กว่ามาก ใช่แล้ว ผมสามารถกลืนน้ำลายของตัวเองได้อย่างแน่นอน วันนี้เราแพ้' เทย์เลอร์-บริตต์ กล่าว คอร์เนอร์แบ็กวัย 24 ปีเคยพูดถึง…

โชต้าชี้ไม่ง่ายแม้หงส์ยิงค้อนกระจุย_1

หงส์แดง เปิดบ้านถล่ม เวสต์แฮม ที่เหลือ 10 คนด้วยสกอร์ 5-1 ในศึก คาราบาว คัพ รอบ 3 เมื่อคืนวันพุธที่ผ่านมา โดยรอบที่ 4 เตรียมตัวออกไปเยือน ไบรท์ตัน คำพูดจาก สล็อตเว็บตรง “ผลการแข่งขันบอกแบบนั้น (ว่าเป็นเกมที่สบาย) แต่เกมในสนามแตกต่างออกไปอย่างสิ้นเชิง” แนวรุกที่ทำคนเดียวสองประตูกล่าวกับ สกาย สปอร์ตส์ “ผมคิดว่าพวกเขาสร้างความยากลำบากให้กับพวกเรา โดยรวมมันเป็นเกมที่ดีและพวกเรามีความสุขกับการเข้ารอบ…

มาเรสก้าชี้เป็นวาสนาได้กูกูเรย่าแบ็กสไตล์โปรดคอยท่า

กูกูเรย่า อาจไม่ใช่แบ็กสไตล์เลี้ยงตะลุย, วิ่งตีนระเบิด แต่เป็นส่วนผสมของสมดุลหลายมิติ ที่สำคัญครองบอลเชื่องเท้า, หุบเป็นอินเวิร์ตช่วยต่อบอลแดนกลางได้ และเอาตัวรอดจากการโดนเพรสซิ่งเก่ง ออร่าแชมป์ ยูโร 2024 ยิ่งทำให้แข้งสแปนิชเล่นอย่างมั่นใจกว่าเดิม จนเบียดขาประจำเดิมอย่าง เบน ชิลเวลล์ ตกกระป๋อง นั่นทำให้ มาเรสก้า เชื่อว่าเหมือนผู้เล่นคนนี้รอการมาถึงของเขาเพื่อผลิบานจริงๆ “มาร์ก คือผู้เล่นที่สำคัญมากๆ หมอนั่นมีอะไรบางอย่างที่คุณไม่ได้หาเจอง่ายๆจากนักเตะทุกคน” การเปิดปากก่อนเกมพบ ไบรท์ตัน (28 ก.ย.) ทีมเก่าของ กูกูเรย่า…