Machine Perception

March 18, 2024
MELON: Reconstructing 3D objects from images with unknown poses
- Machine Intelligence ·
- Machine Perception
March 14, 2024
Cappy: Outperforming and boosting large multi-task language models with a small scorer
- Machine Intelligence ·
- Machine Perception ·
- Natural Language Processing
March 8, 2024
Health-specific embedding tools for dermatology and pathology
- Health & Bioscience ·
- Machine Perception
February 22, 2024
VideoPrism: A foundational visual encoder for video understanding
- Machine Intelligence ·
- Machine Perception
January 31, 2024
MobileDiffusion: Rapid text-to-image generation on-device
- Machine Intelligence ·
- Machine Perception ·
- Mobile Systems
December 19, 2023
VideoPoet: A large language model for zero-shot video generation
- Generative AI ·
- Machine Intelligence ·
- Machine Perception
December 15, 2023
StyleDrop: Text-to-image generation in any style
- Conferences & Events ·
- Generative AI ·
- Machine Perception
November 21, 2023
Open sourcing Project Guideline: A platform for computer vision accessibility technology
- Human-Computer Interaction and Visualization ·
- Machine Perception ·
- Open Source Models & Datasets
November 14, 2023
Scaling multimodal understanding to long videos
- Machine Intelligence ·
- Machine Perception
October 9, 2023
SANPO: A Scene understanding, Accessibility, Navigation, Pathfinding, & Obstacle avoidance dataset
- Machine Perception ·
- Open Source Models & Datasets
September 28, 2023
DynIBaR: Space-time view synthesis from videos of dynamic scenes
- Conferences & Events ·
- Machine Perception ·
- Photography
September 26, 2023
Google Research embarks on effort to map a mouse brain
- Machine Intelligence ·
- Machine Perception