苹果发布LiTo模型，实现单图高保真3D重建

Source

品玩3月17日讯，据 9to5Mac 报道，苹果研究人员推出名为LiTo（Surface Light Field Tokenization）的新型AI模型，旨在通过单张图像重建具备真实光影效果的3D对象。该研究提出了一种统一的3D潜在空间表示法，能够联合建模物体几何结构与视角相关的外观特征。

传统方法多侧重于几何重建或预测与视角无关的漫反射外观，难以捕捉复杂的光照效应。LiTo利用RGB深度图像作为表面光场采样，将其编码为紧凑的潜在向量。通过编码器压缩形状与光照交互信息，再由解码器重构完整3D对象，模型能精准复现高光、菲涅尔反射等随视角变化的视觉效果。

在训练阶段，研究人员使用数千个对象在不同角度及光照下的渲染数据进行学习。系统最终能够通过单张输入图像预测潜在表示，并生成包含动态光影变化的高质量3D模型。对比测试显示，LiTo在细节还原度上显著优于TRELLIS等现有模型，为计算机视觉领域提供了新的技术路径。