计算机视觉

科学技术

谷歌的Gemini AI突破性地实现视听理解

在这个精彩的播客讨论中,了解谷歌的Gemini多模态AI技术如何同时处理文本、图像、音频和视频
科学技术

人工智能学会通过观察虚拟世界中的数字演员来识别危险行为

发现SynthDa如何创造逼真的合成视频,以训练监控学校、养老院和工作场所安全的AI系统,同时不侵犯隐私。