品玩3月17日讯,据 9to5Mac 报道,苹果研究人员推出名为LiTo(Surface Light Field Tokenization)的新型AI模型,旨在通过单张图像重建具备真实光影效果的3D对象。该研究提出了一种统一的3D潜在空间表示法,能够联合建模物体几何结构与视角相关的外观特征。
传统方法多侧重于几何重建或预测与视角无关的漫反射外观,难以捕捉复杂的光照效应。LiTo利用RGB深度图像作为表面光场采样,将其编码为紧凑的潜在向量。通过编码器压缩形状与光照交互信息,再由解码器重构完整3D对象,模型能精准复现高光、菲涅尔反射等随视角变化的视觉效果。
在训练阶段,研究人员使用数千个对象在不同角度及光照下的渲染数据进行学习。系统最终能够通过单张输入图像预测潜在表示,并生成包含动态光影变化的高质量3D模型。对比测试显示,LiTo在细节还原度上显著优于TRELLIS等现有模型,为计算机视觉领域提供了新的技术路径。