kaiyun体育登录网页入口相干商酌效劳现在已入选 CVPR 2025-kaiyun欧洲杯app(官方)官方网站·IOS/安卓通用版/手机APP下载
从东谈主体单图变身高保真 3D 模子,不知谈伤害了几许设施猿头发的行业可贵kaiyun体育登录网页入口,果然被港科广团队一招破解了!
团队最新提议的MultiGO革命决策,借助分层建模想路——将东谈主体剖析为不同精度层级,从基础体型到衣物褶皱逐级细化。
这有点像在搭乐高积木:先大模块构建举座笼统,再用小零件补充细节,终末再处理材质纹理。
相干商酌效劳现在已入选 CVPR 2025,神色代码也在加紧开源的路上。
更多笃定,让咱们接着链接看~
期间雠校路在何方?传统方法的瓶颈
基于单目图像的三维东谈主体重建存在固有深度歧义性,现存方法继续依赖 SMPL-X 等东谈主体笼统的预测验模板提供几何先验,但也曾难以捕捉细节特征和特定剖解学结构。
这些方法一样聚焦于东谈主体举座几何建模,而坑诰了多档次结构(如骨骼、环节,以及手指、面部等部位的邃密皱纹)。这种过度简化的建模面貌导致骨骼重建不准确、环节位置偏差,以及衣物皱纹等细节隐约不清。
MultiGO 革命框架
该商酌提议三级几何学习框架完结冲破:
骨架增强模块:通过将 3D 傅里叶特征投影到 2D 空间,勾通 SMPL-X 东谈主体网格行为几何先验,增强东谈主体骨架建模。傅里叶空间位置编码晋升了 3D 模子与 2D 图像的语义对都智力。
环节增强计谋:在测验时对环节点位置施加扰动,晋升模子对深度计算舛误的鲁棒性。通过重心转机影响深度感知的参数,使模子能更好稳妥本体不雅测中的结构偏差。
皱纹优化模块:经受访佛扩散模子去噪的方法,将名义皱纹视为可优化的噪声模式。从约略的东谈主体网格中,回应出更细密化的高频细节。
MultiGO 期间剖解
MultiGO 方法的中枢在于通过多档次几何学习框架全面晋升单目纹理 3D 东谈主体重建的质地。该方法基于现存物体高斯重建预测验模子,针对东谈主体几何的不同粒度层级(骨骼、环节、皱纹)想象了协同优化的三重机制:
骨骼层级:骨架增强模块通过将 3D 傅里叶特征投影到输入图像一致的 2D 空间,使高斯重建模子简略充分交融先验的东谈主体方式常识,从而精确捕捉东谈主体姿态特征。这种特征投影机制灵验料理了单目视角下 3D 结构信息缺失的问题。
环节层级:环节增强计谋在测验阶段对信得过的 SMPL ( X ) 模子的环节参数进行扰动。通过模拟深度不确定性,增强模子对推理历程中环节深度舛误的鲁棒性。这种数据增强面貌使模子简略学习更踏实的环节空间关系,幸免因深度歧义导致的肢体位置重建不准。
微不雅几何细节层面:皱纹优化模块革命性地模仿扩散表面想想。该模块将约略网格视为高斯噪声,而以重建的高质地高斯纹理行为条目输入,通过访佛扩散模子去噪的历程逐渐优化皱纹等微小几何特征。这种纹理指令的细化机制完结了亚毫米级名义细节的生成,弥补了传统方法在衣物褶皱等高频细节上的不及。
三个层级模块并非孑然运作,而是变成从宏不雅姿态到微不雅特征的递进式优化链条:骨架增强模块缔造的准确骨骼框架为环节定位提供基础,环节增强计谋踏实的环节展望又为皱纹细化创造了低噪声的几何环境。整个框架通过端到端测验完结多档次几何信号的纠合优化,最终输出兼具准确拓扑结构和丰富名义细节的高保真 3D 东谈主体模子。
效果 show time
所提议的多层级几何学习框架在CustomHuman和THuman3.0两个测试集上完结了起首进的性能证明,在东谈主体几何重建任务中显赫优于其他现存期间:
在 CustomHuman 数据集上,倒角距离 ( CD ) 晋升 0.180/0.406,法向一致性 ( NC ) 提高 0.034,f-score 增多 6.277;在 THuman3.0 数据集上,CD 筹划晋升 0.355/0.369,NC 提高 0.047,f-score 大幅晋升 9.861。
这种性能冲破源于咱们提议的革命性料理决策——通过三级分层建模计谋(而非传统单一档次建模)细密化处理东谈主体几何特征,从多档次协同优化东谈主体重建效果,从而完结了更精确的几何细节回应。
多场景应用
MultiGO 的分层高斯建模期间通过将东谈主体剖析为不同精度层级(从基础体型到衣物褶皱和材质纹理逐级细化),并期骗高斯溅射点行为 3D 基元完结高效、高保的确单图重建,使其在杜撰试衣与前锋电商 (实时生成可动态转机的 3D 东谈主体与服装模子)、游戏与元世界 (快速创建个性化杜撰变装并援手细节裁剪)以及影视殊效 (高精度动态东谈主体重建与后期分层转机)等鸿沟具有卓越上风,尤其合乎需要快速生成且对信得过感和多要领细节还原要求高的应用场景。
杜撰试衣与前锋电商
滥用者上传一张全身像片即可生成高保真 3D 东谈主体模子,系统能自动模拟不同服装的穿戴效果(包括衣物褶皱和材质细节),援手 360 度检察,晋升在线购物体验。勾通分层建模智力,可分散用户体型(基础层)与服装细节(细密层),完结动态布料仿真。
游戏与元世界变装生成
通过单张像片快速创建个性化的 3D 杜撰形象,分层结构援手天真转机(如更换发型、配饰等)。高斯溅射点的特质可保留皮肤纹理和光影细节,增强杜撰变装的信得过感。适用于应答元世界、NPC 批量生成等场景,显赫缩小好意思术资源坐褥本钱。
影视殊效与杜撰制作
在殊效制作中,仅需演员的单视角像片即可重建高精度 3D 模子,用于动作捕捉或替身合成。分层想象允许后期单独裁剪特定层级(如转机肌肉线条或添加伤疤殊效)。勾通动态高斯溅射点期间,可进一步完结毛发、湿润皮肤等微小效果的实时渲染。
论文衔接:https://arxiv.org/pdf/2412.03103
神色衔接:https://multigohuman.github.io/
一键三连「点赞」「转发」「拦截心」
接待在驳斥区留住你的认识!
— 完 —
学术投稿请于职责日发邮件到:
ai@qbitai.com
标题注明【投稿】,告诉咱们:
你是谁,从哪来,投稿内容
附上论文 / 神色主页衔接,以及商酌面貌哦
咱们会(尽量)实时回复你
� � 点亮星标 � �
科技前沿进展逐日见kaiyun体育登录网页入口