Mert Yuksekgonul

Optimizing generative AI by backpropagating language model feedback

Nature

Mert Yuksekgonul*, Federico Bianchi*, Joseph Boen*, Sheng Liu*, Pan Lu*, Zhi Huang*, Carlos Guestrin, James Zou

Paper Code

When and why vision-language models behave like bags-of-words, and what to do about it?

Oral, ICLR '23 (Top 5% of all accepted papers)

Mert Yuksekgonul, Federico Bianchi, Pratyusha (Ria) Kalluri, Dan Jurafsky, James Zou

Paper Code

Beyond Confidence: Reliable Models Should Also Quantify Atypicality

NeurIPS '23, Contributed Talk - ICLR '23 Trustworthy ML

Mert Yuksekgonul, Linjun Zhang, James Zou, Carlos Guestrin

Paper Code

Attention Satisfies: A Constraint-Satisfaction Lens on Factual Errors of Language Models

ICLR '24

Mert Yuksekgonul, Varun Chandrasekaran, Erik Jones, Suriya Gunasekar, Ranjita Naik, Hamid Palangi, Ece Kamar, Besmira Nushi

Paper Code

Post-hoc Concept Bottleneck Models

Spotlight, ICLR '23 (Top 25% of all accepted papers)

Mert Yuksekgonul, Maggie Wang, James Zou

Paper Code

A visual–language foundation model for pathology image analysis using medical Twitter

Nature Medicine '23, Cover

Zhi Huang*, Federico Bianchi*, Mert Yuksekgonul, Thomas J Montine, James Zou

Paper Code

Meaningfully debugging model mistakes using conceptual counterfactual explanations

ICML '22

Abubakar Abid*, Mert Yuksekgonul*, James Zou

Paper Code

Holistic Evaluation of Language Models

TMLR '23

Percy Liang, Rishi Bommasani, Tony Lee, Dimitris Tsipras, Dilara Soylu, Michihiro Yasunaga, Yian Zhang, Deepak Narayanan, Yuhuai Wu, Ananya Kumar, Benjamin Newman, Binhang Yuan, Bobby Yan, Ce Zhang, Christian Cosgrove, Christopher D. Manning, Christopher Ré, Diana Acosta-Navas, Drew A. Hudson, Eric Zelikman, Esin Durmus, Faisal Ladhak, Frieda Rong, Hongyu Ren, Huaxiu Yao, Jue Wang, Keshav Santhanam, Laurel Orr, Lucia Zheng, Mert Yuksekgonul, Mirac Suzgun, Nathan Kim, Neel Guha, Niladri Chatterji, Omar Khattab, Peter Henderson, Qian Huang, Ryan Chi, Sang Michael Xie, Shibani Santurkar, Surya Ganguli, Tatsunori Hashimoto, Thomas Icard, Tianyi Zhang, Vishrav Chaudhary, William Wang, Xuechen Li, Yifan Mai, Yuhui Zhang, Yuta Koreeda

Paper Code

Selected Publications