Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Knowledge Science - Alles über KI, ML und NLP

Inhalt bereitgestellt von Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.

6M ago 36:40

MP3•Episode-Home

Send us a text

In der heutigen Sendung versuchen wir rauszufinden, ob man sich auf die öffentlichen Benchmarks zum Testen und Vergleichen von Sprachmodellen verlassen kann. Oder ob Benchmark Testdaten zum Trainieren verwendet werden. Hierbei handelt es sich um das Benchmark Leakage. Hören Sie rein.
Wir sprechen vor allem über das Paper: Benchmarking Benchmark Leakage in Large Language Models https://arxiv.org/abs/2404.18824

Support the show

204 Episoden

#Technologie #Bildung #Sigurd Schacht, Carsten Lanquillon #Carsten Lanquillon #Sigurd Schacht #Wissenschaft #Künstliche Intelligenz

Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Knowledge Science - Alles über KI, ML und NLP

12 subscribers

published 6M ago

MP3•Episode-Home

Send us a text

Support the show

204 Episoden

#Technologie #Bildung #Sigurd Schacht, Carsten Lanquillon #Carsten Lanquillon #Sigurd Schacht #Wissenschaft #Künstliche Intelligenz

Alle Folgen

Willkommen auf Player FM!

Player FM scannt gerade das Web nach Podcasts mit hoher Qualität, die du genießen kannst. Es ist die beste Podcast-App und funktioniert auf Android, iPhone und im Web. Melde dich an, um Abos geräteübergreifend zu synchronisieren.

Höre 500+ Themen zu

Ähnelt Knowledge Science - Alles über KI, ML und NLP

Podcasts, die es wert sind, gehört zu werden

Knowledge Science - Alles über KI, ML und NLP « » Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Podcasts, die es wert sind, gehört zu werden

Willkommen auf Player FM!

Ähnelt Knowledge Science - Alles über KI, ML und NLP

Kurzanleitung

Knowledge Science - Alles über KI, ML und NLP « »
Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?