Feng Gao

Feng Gao received his Ph.D. from UCLA in 2022 co-advised by Ying Nian Wu and Mark Handcock. From 2017 to 2021, he was advised by Song-Chun Zhu.

He is currenty an Applied Scientist in Amazon and affliated to store foundation AI (SFAI). Specifically, he

🐶 Build Rufus [News1], [News2], Amazon’s LLM-powered Shopping Assistant.
🚀 Launch multimodal Rufus (Rufus-MM).
- Full-stack M-LLM development: data, pre-training, post-training, evaluation.
🔬 Actively research on

Feel free to contact me: fenggo [at] amazon [dot] com.

news

Feb 26, 2025	One paper about Relightable 3D Generation 🪑 [paper] [Demo] is accepted to CVPR2025.
Feb 25, 2025	One paper about efficient video-LLM 🎞️ [paper] is accepted to CVPR2025.
Oct 14, 2024	Our work about Embodied AI, Planning as In-Painting is accepted in NeurIPS2024 OWA. [paper]
Sep 25, 2024	Two paper accepted to NeurIPS2024. They are about physically constrained Text-to-3D 🤸🏻‍♀️ [paper] [demo] and flow matching generative model [paper].
Jun 01, 2024	Our paper on spatial generalizable T2I 🐱🐭 is accepted in ECCV2024. [paper]

selected publications

CVPR

M-LLM Based Video Frame Selection for Efficient Video Understanding

Kai Hu, Feng Gao, Xiaohan Nie, Peng Zhou, Son Tran, Tal Neiman, Lingyun Wang, Mubarak Shah, and 3 more authors

CVPR, 2025

PDF
NeurIPS

Atlas3D: Physically Constrained Self-Supporting Text-to-3D for Simulation and Fabrication

Yunuo Chen, Tianyi Xie, Zeshun Zong, Xuan Li, Feng Gao, Yin Yang, Ying Nian Wu, and Chenfanfu Jiang

NeurIPS, 2024

HTML PDF Code
ECCV

Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation

Yingshan Chang, Yasi Zhang, Zhiyuan Fang, Yingnian Wu, Yonatan Bisk, and Feng Gao

ECCV, 2024

PDF Code
NeurIPS

Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty

Cheng-Fu Yang, Haoyang Xu, Te-Lin Wu, Xiaofeng Gao, Kai-Wei Chang, and Feng Gao

NeurIPS OWA, 2024

HTML PDF Code
NeurIPS

Learning non-Markovian Decision-Making from State-only Sequences

Aoyang Qin, Feng Gao, Qing Li, Song-Chun Zhu, and Sirui Xie

NeurIPS, 2023

PDF Code
CVPR

GIVL: Improving Geographical Inclusivity of Vision-Language Models with Pre-Training Methods

Da Yin, Feng Gao, Govind Thattai, Michael Johnston, and Kai-Wei Chang

CVPR, 2023

PDF Supp
TPA-Net: Generate A Dataset for Text to Physics-based Animation

Yuxing Qiu, Feng Gao, Minchen Li, Govind Thattai, Yin Yang, and Chenfanfu Jiang

arXiv preprint arXiv:2211.13887, 2022

HTML PDF
CVPR

Transform-Retrieve-Generate: Natural Language-centric Outside-Knowledge Visual Question Answering

Feng Gao, Qing Ping, Govind Thattai, Aishwarya Reganti, Ying Nian Wu, and Prem Natarajan

CVPR, 2022

PDF Supp Code
Science Robotics

A Tale of Two Explanations: Enhancing Human Trust by Explaining Robot Behavior

Mark Edmonds^*, Feng Gao^*, Hangxin Liu^*, Xu Xie^*, Siyuan Qi, Brandon Rothrock, Yixin Zhu, Ying Nian Wu, and 2 more authors

Science Robotics, 2019

(* co-first author)

PDF Code
NeurIPS

Learning Perceptual Inference by Contrasting

Chi Zhang, Baoxiong Jia, Feng Gao, Yixin Zhu, Hongjing Lu, and Song-Chun Zhu

NeurIPS, 2019

HTML PDF Code
CVPR

RAVEN: A Dataset for Relational and Analogical Visual Reasoning

Chi Zhang^*, Feng Gao^*, Baoxiong Jia, Yixin Zhu, and Song-Chun Zhu

CVPR, 2019

(* co-first author)

HTML PDF Supp Code
ICRA

Unsupervised Learning of Hierarchical Models for Hand-object Interactions

Xu Xie, Hangxin Liu, Mark Edmonds, Feng Gao, Siyuan Qi, Yixin Zhu, Brandon Rothrock, and Song-Chun Zhu

ICRA, 2018

PDF Video Code
IROS

A Glove-based System for Studying Hand-object Manipulation via Joint Pose and Force Sensing

Hangxin Liu, Xu Xie, Matt Millar, Mark Edmonds, Feng Gao, Yixin Zhu, Veronica J Santos, Brandon Rothrock, and 1 more author

IROS, 2017

PDF Code
IROS

Feeling the Force: Integrating Force and Pose for Fluent Discovery through Imitation Learning to Open Medicine Bottles

Mark Edmonds^*, Feng Gao^*, Xu Xie, Hangxin Liu, Siyuan Qi, Yixin Zhu, Brandon Rothrock, and Song-Chun Zhu

IROS, 2017

(* co-first author)

PDF Video Code