"topic:spatial-intelligence" — Search | GitHunt

© 2026 GitHunt · tansuasici

46 results for “topic:spatial-intelligence”

manycore-research/SpatialLM

[NeurIPS 2025] SpatialLM: Training Large Language Models for Structured Indoor Modeling

Python4.3k340Updated 8 hours ago

mllmpoint-cloudsscene-understandingspatial-intelligence

worldbench/awesome-3d-4d-world-models

🌐 3D and 4D World Modeling: A Survey

HTML84250Updated 16 hours ago

3d3d-generation4d4d-generationautonomous-drivingawesome-listembodied-ailidar-generationoccupancy-generationspatial-intelligencevideo-generationworld-models

InternRobotics/InternNav

InternRobotics' open platform for building generalized navigation foundation models.

Jupyter Notebook71184Updated just now

mllmsnavigationroboticsspatial-aispatial-intelligencevision-language-action-modelvision-language-navigationvisual-navigationvlavlm

InternRobotics/Aether

[ICCV 2025 & ICCV 2025 RIWM Outstanding Paper] Aether: Geometric-Aware Unified World Modeling

Python5787Updated 14 hours ago

4d-generation4d-reconstructionembodied-aifoundation-modelsmulti-modalnavigationspatial-intelligencevideo-generationvideo-predictionvisual-planningworld-model

NJU-3DV/SpatialVID

[CVPR 2026] SpatialVID: A Large-Scale Video Dataset with Spatial Annotations

Python50917Updated 5 hours ago

3d-generation3d-reconstruction4d-generation4d-reconstructionspatial-intelligencevideo-datasetvideo-generationvideo-reasoningvision-language-modelworld-models

THU-SI/Spatial-MLLM

[NeurIPS 2025] Official implementation of Spatial-MLLM: Boosting MLLM Capabilities in Visual-based Spatial Intelligence

Python44517Updated 2 days ago

aigcllmmultimodalmultimodal-large-language-modelsspatial-intelligence

yangzhou24/OmniWorld

[ICLR 2026] OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling

Python4378Updated 3 days ago

4d-reconstructionreal-datasetspatial-intelligencesynthetic-datavideo-generationworld-model

InternRobotics/G2VLM

[CVPR 2026] G2VLM: Geometry Grounded Vision Language Model with Unified 3D Reconstruction and Spatial Reasoning

Python2849Updated 13 hours ago

3d-llms3d-reconstructionmllmsspatial-intelligencespatial-reasoningspatial-understanding

UMass-Embodied-AGI/Mirage

[CVPR 2026] Machine Mental Imagery: Empower Multimodal Reasoning with Latent Visual Tokens

Python24918Updated 1 day ago

multimodal-reasoningreasoningspatial-intelligencevisual-chain-of-thoughtvlm

UMass-Embodied-AGI/3D-Mem

[CVPR 2025] Source codes for the paper "3D-Mem: 3D Scene Memory for Embodied Exploration and Reasoning"

Python22216Updated 6 days ago

aicomputer-visionembodied-aispatial-intelligence

worldbench/3EED

[NeurIPS 2025 DB Track] 3EED: Ground Everything Everywhere in 3D

Python20613Updated 4 days ago

3d3d-grounding3d-visual-grounding3eedgptllmllm-for-3dmllmmllm-for-3dmulti-modalityqwenspatial-intelligencevlmvlm-for-3d

worldbench/LiDARCrafter

[AAAI 2026 Oral] LiDARCrafter: Dynamic 4D World Modeling from LiDAR Sequences

Python18813Updated 5 days ago

3d-generation3d-object-detection4d-generationaigcaigc3dautonomous-drivinggenerative-ailidarlidar-generationscene-understandingspatial-intelligenceworld-models

worldbench/WorldLens

[CVPR 2026] WorldLens: Full-Spectrum Evaluations of Driving World Models in Real World

Python18516Updated 1 day ago

3d4daigcaigc3dautonomous-drivinggenerationgenerative-aihuman-preferenceslidaroccupancyreconstructionscene-understandingspatial-intelligencevideo-generationworld-model

Visual Spatial Tuning

Jupyter Notebook1828Updated 18 hours ago

spatial-intelligencespatial-reasoningspatial-understandingvlm

OpenSenseNova/SenseNova-SI

Scaling Spatial Intelligence with Multimodal Foundation Models

Python1809Updated 14 hours ago

mllmmllm-for-3dmultimodal-modelsspatial-intelligence

[ICLR 2025] SPA: 3D Spatial-Awareness Enables Effective Embodied Representation

Python1736Updated 4 days ago

embodied-airepresentation-learningrobot-learningspatial-awarenessspatial-intelligence

worldbench/Pi3DET

[ICCV 2025] Perspective-Invariant 3D Object Detection

Python16813Updated 5 days ago

3d-object-detection3d-scene-understandingautonomous-drivingdroneembodied-ailidar-point-cloudmultimodalquadruped-robotroboticsspatial-intelligence

keshik6/HourVideo

[NeurIPS 2024] Official code for HourVideo: 1-Hour Video Language Understanding

Jupyter Notebook1574Updated 1 week ago

1-hour-video-language-understandingbenchmark-datasetegocentric-videosevalsgemini-progpt-4long-context-understandinglong-form-video-language-understandingmultimodal-large-language-modelsmultiple-choice-questionsnavigationneurips-2024perceptionreasoningspatial-intelligencesummarizationvideo-language-understandingvisual-reasoning

worldbench/awesome-spatial-intelligence

🌐 Forging Spatial Intelligence: A Roadmap of Multi-Modal Data Pre-Training for Autonomous Systems

HTML14112Updated 2 days ago

3d4dautonomous-drivingawesome-listembodied-ailidarlidar-point-cloudllmmllmmultimodal-learningoccupancyplanningpretrained-modelsspatial-intelligencevision-languagevision-language-modelsvlm

UMass-Embodied-AGI/MindJourney

[NeurIPS 2025] Source codes for the paper "MindJourney: Test-Time Scaling with World Models for Spatial Reasoning"

Python1394Updated 1 day ago

3dembodied-aispatial-intelligencevision-language-modelworld-models

[CVPR 2025] Code for "StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation".

1240Updated 2 weeks ago

3d-aigcgen-aispatial-intelligence

THUSI-Lab/hstar

[CVPR 2026] Thinking in 360°: Humanoid Visual Search in the Wild

Python1233Updated 2 days ago

computer-visionmllm-reasoningspatial-intelligencevision-language-modelvisual-search

EvolvingLMMs-Lab/EASI

Holistic Evaluation of Multimodal LLMs on Spatial Intelligence

Dockerfile877Updated 1 week ago

mllmmllm-evaluationmultimodal-modelsspatial-intelligence

vulab-AI/Awesome-Spatial-VLMs

[Awesome-Spatial-VLMs] This repository is the official, community-maintained resource for the survey paper: Spatial Intelligence in Vision-Language Models: A Comprehensive Survey;

Python652Updated 1 week ago

awesome-listawesome-spatial-vlmsmllmspatial-intelligencespatial-reasoningsurveyvision-language-modelvlm

[ICLR 2025] Where Am I and What Will I See : An Auto-Regressive Model for Spatial Localization and View Prediction

Python440Updated 3 weeks ago

autoregressive-modelgenerative-modelnext-token-predictionnovel-view-synthesispose-estimationspatial-intelligence

worldbench/SPIRAL

[NeurIPS 2025] SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation and Understanding

Python433Updated 2 weeks ago

3d3d-genaigcaigc3dautonomous-drivinglidarlidar-generationlidar-segpoint-cloudsemantic-segmentationspatial-intelligence

thuml/Vid2World

Official repository for "Vid2World: Crafting Video Diffusion Models to Interactive World Models" (ICLR 2026), https://arxiv.org/abs/2505.14357

Python421Updated 4 days ago

game-simulationnavigationreal2simrobot-manipulationspatial-intelligencetransfer-learningvideo-generationworld-model

Multimodal datasets for spatial intelligence

Python393Updated 1 month ago

aidatasetsmachine-learningmcappolarspytorchrerunroboticsspatial-intelligencetensordict

TidalHarley/NavSpace

[ICRA 2026] Official codebase for NavSpace: How Navigation Agents Follow Spatial Intelligence Instructions

Python320Updated 3 days ago

benchmarkspatial-intelligencevln-ce

worldbench/awesome-3d-in-the-wild

🌐 A Roadmap for 3D Scene Understanding in the Wild

HTML231Updated 1 week ago

3d3d-scene-understanding4dautonomous-drivingawesome-listembodied-ailidar-point-cloudoccupancy-predictionpanoptic-segmentationroboticssemantic-scene-completionsemantic-segmentationspatial-intelligence

Page 1 of 2