项目简介
这是 LGM:用于高分辨率 3D 内容创建的大型多视图高斯模型的官方实现。
支持文字生成模型、图片生成模型,分辨率512*512,5秒内即可生成。
安装
pip install torch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0
pip install -U xformers
git clone
pip install ./diff-gaussian-rasterization
pip install git+https://github.com/NVlabs/nvdiffrast
pip install -r requirements.txt
预训练权重
我们预先训练的重量可以从huggingface下载。
例如,要下载用于推理的 fp16 模型:
mkdir pretrained && cd pretrained
wget https://huggingface.co/ashawkey/LGM/resolve/main/model_fp16_fixrot.safetensors
cd ..
对于 MVDream 和 ImageDream,我们使用扩散器实现。他们的权重将自动下载。
推理
推理大约需要 10GB GPU 内存(加载所有 imagedream、mvdream 和我们的 LGM)。
python app.py big --resume pretrained/model_fp16.safetensors
python infer.py big --resume pretrained/model_fp16.safetensors --workspace workspace_test --test_path data_test
python gui.py big --output_size 800 --test_path workspace_test/saved.ply
python convert.py big --test_path workspace_test/saved.ply
有关更多选项,请查看选项。
训练
注意:由于我们训练中使用的数据集基于 AWS,因此不能直接用于新环境中的训练。我们提供必要的训练代码框架,请检查并修改数据集实现!
我们还提供了 ~80K 的 Objaverse 子集,用于在 objaverse_filter 中训练 LGM。