Markus Freitag

Are LLMs Breaking MT Metrics? Results of the WMT24 Metrics Shared Task

Markus Freitag

Nitika Mathur

Dan Deutsch

Chi-kiu Lo

Eleftherios Avramidis

Ricardo Rei

Brian Thompson

Frédéric Blain

Tom Kocmi

Jiayi Wang

David Adelani

Marianna Buchicchio

Chrysoula Zerva

Alon Lavie

2024

Beyond Human-Only: Evaluating Human-Machine Collaboration for Collecting High-Quality Translation Data

Zhongtao Liu

Parker Riley

Dan Deutsch

Alison Lui

Mengmeng Niu

Apu Shah

Markus Freitag

2024

Introducing the NewsPaLM MBR and QE Dataset: LLM-Generated High-Quality Parallel Data Outperforms Traditional Web-Crawled Data

Mara Finkelstein

David Vilar Torres

Markus Freitag

2024

Finding Replicable Human Evaluations via Stable Ranking Probability

Parker Riley

Dan Deutsch

George Foster

Viresh Ratnakar

Ali Dabir

Markus Freitag

2024

Findings of the WMT24 General Machine Translation Shared Task: The LLM Era is Here but MT is Not Solved Yet

Tom Kocmi

Eleftherios Avramidis

Rachel Bawden

Ondrej Bojar

Anton Dvorkovich

Christian Federman

Mark Fishel

Markus Freitag

Thamme Gowda

Roman Grundkiewicz

Barry Haddow

Marzena Karpinska

Philipp Koehn

Benjamin Marie

Christof Monz

Kenton Murray

Masaaki Nagata

Martin Popel

Maja Popovic

Mariya Shmatova

Steinþór Steingrímsson

Vilém Zouhar

2024

Mitigating metric bias in minimum bayes risk decoding

Geza Kovacs

Daniel Deutsch

Markus Freitag

Proceedings of the Ninth Conference on Machine Translation (2024), pp. 1063-1094

Ties Matter: Meta-Evaluating Modern Metrics with Pairwise Accuracy and Tie Calibration

Dan Deutsch

George Foster

Markus Freitag

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Singapore, pp. 12914-12929

MetricX-23: The Google Submission to the WMT 2023 Metrics Shared Task

Jurik Juraska

Mara Finkelstein

Dan Deutsch

Aditya Siddhant

Mahdi Mirzazadeh

Markus Freitag

Conference on Machine Translation (2023)

INSTRUCTSCORE: Towards Explainable Text Generation Evaluation with Automatic Feedback

Wenda Xu

Danqing Wang

Liangming Pan

Zhenqiao Song

Markus Freitag

William Wang

Lei Li

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Singapore, pp. 5967-5994

Prompting PaLM for Translation: Assessing Strategies and Performance

David Vilar Torres

Markus Freitag

Colin Cherry

Jiaming Luo

Viresh Ratnakar

George Foster

Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), Association for Computational Linguistics, Toronto, Canada (2023), 15406–15427

Explore our many areas of focus

Building a collaborative ecosystem

Shaping the future together

Translating discovery into real-world impact

Markus Freitag

Research Areas

Join us

Google Ai

Google Cloud

Google DeepMind

Google Labs

Markus Freitag

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us