Chat2Map: Efficient Scene Mapping from Multi-Ego Conversations

Sagnik Majumder^1,2,3, Hao Jiang², Pierre Moulon², Ethan Henderson²,
Paul Calamia², Kristen Grauman^1,3*, Vamsi Krishna Ithapu^2*,

¹UT Austin,²Reality Labs Research at Meta, ³FAIR at Meta
^* Equal contribution
Accepted to CVPR 2023

[arXiv] [Code and data]

Citation



@inproceedings{majumder2023chat2map,
  title={Chat2Map: Efficient Scene Mapping from Multi-Ego Conversations},
  author={Majumder, Sagnik and Jiang, Hao and Moulon, Pierre and Henderson, Ethan and
          Calamia, Paul and Grauman, Kristen and Ithapu, Vamsi Krishna},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={10554--10564},
  year={2023}
}

References

(1) Senthil Purushwalkam, Sebastia Vincenc Amengual Gari, Vamsi Krishna Ithapu, Carl Schissler, Philip Robinson, Abhinav Gupta, Kristen Grauman. Audio-Visual Floorplan Reconstruction. In ICCV 2021 [Bibtex]

(2) Santhosh K. Ramakrishnan, Ziad Al-Halah, Kristen Grauman. Occupancy Anticipation fo Efficient Exploration and Navigation. In ECCV 2020 [Bibtex]

(3) Changan Chen*, Unnat Jain*, Carl Schissler, Sebastia Vicenc Amengual Gari, Ziad Al-Halah, Vamsi Krishna Ithapu, Philip Robinson, Kristen Grauman. SoundSpaces: Audio-Visual Navigation in 3D Environments. In ECCV 2020 [Bibtex]

(4) Angel Chang, Angela Dai, Thomas Funkhouser, Maciej Halber, Matthias Niessner, Manolis Savva, Shuran Song, Andy Zeng, Yinda Zhang. Matterport3D: Learning from RGB-D Data in Indoor Environments. In 3DV 2017 [Bibtex]

(5) Vassil Panayotov, Guoguo Chen, Daniel Povey, Sanjeev Khudanpur. Librispeech: An ASR corpus based on public domain audio books. In ICASSP 2015 [Bibtex]