חוקרים וחוקרות שואלים שאלות מרתקות ומתגלגלים מהן אל שאלות רבות אחרות, תחומי ידע נפגשים עם תחומים אחרים, ולעתים גם נמצאת תשובה. בכל תוכנית גיל מרקוביץ תצלול עם החוקרים לעומקם של התהליכים המורכבים שמשפיעים על חיינו
…
continue reading
Inhalt bereitgestellt von Tamir Nave & Uri Goren, Tamir Nave, and Uri Goren. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Tamir Nave & Uri Goren, Tamir Nave, and Uri Goren oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.
Player FM - Podcast-App
Gehen Sie mit der App Player FM offline!
Gehen Sie mit der App Player FM offline!
מדידת GenAI עם אסף בורד
MP3•Episode-Home
Manage episode 471257416 series 2995782
Inhalt bereitgestellt von Tamir Nave & Uri Goren, Tamir Nave, and Uri Goren. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Tamir Nave & Uri Goren, Tamir Nave, and Uri Goren oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.
להכניס מודלי שפה כמו ChatGPT למערכת, זה יחסית קל ונגיש, עם אלפי דוגמאות ותמחור תחרותי אצל הספקים השונים. אבל למדוד את הביצועים של מודל כזה או אחר נשארת בעיה פתוחה, במיוחד אם משלבים גם מדדים עסקיים. בפרק זה נארח את אסף בורד, שמוביל את מאמצי ה GenAI בחברת Northwestern Mutual והשיק לאחרונה את Multinear.com כקוד פתוח לאבלאוציה. נדבר על חמשת הרכיבים שיש לבדוק כשמנסים להעריך מערכת AI בשלמותה: דאטא, פונקציית המטרה, הפרומפט, הסטאק הטכנולוגי ובדיקות. ונעמיק בהשוואה מול ספריות אחרות וטכניקות מדידה כגון GPT as a judge
…
continue reading
116 Episoden
MP3•Episode-Home
Manage episode 471257416 series 2995782
Inhalt bereitgestellt von Tamir Nave & Uri Goren, Tamir Nave, and Uri Goren. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Tamir Nave & Uri Goren, Tamir Nave, and Uri Goren oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.
להכניס מודלי שפה כמו ChatGPT למערכת, זה יחסית קל ונגיש, עם אלפי דוגמאות ותמחור תחרותי אצל הספקים השונים. אבל למדוד את הביצועים של מודל כזה או אחר נשארת בעיה פתוחה, במיוחד אם משלבים גם מדדים עסקיים. בפרק זה נארח את אסף בורד, שמוביל את מאמצי ה GenAI בחברת Northwestern Mutual והשיק לאחרונה את Multinear.com כקוד פתוח לאבלאוציה. נדבר על חמשת הרכיבים שיש לבדוק כשמנסים להעריך מערכת AI בשלמותה: דאטא, פונקציית המטרה, הפרומפט, הסטאק הטכנולוגי ובדיקות. ונעמיק בהשוואה מול ספריות אחרות וטכניקות מדידה כגון GPT as a judge
…
continue reading
116 Episoden
Alle Folgen
×Willkommen auf Player FM!
Player FM scannt gerade das Web nach Podcasts mit hoher Qualität, die du genießen kannst. Es ist die beste Podcast-App und funktioniert auf Android, iPhone und im Web. Melde dich an, um Abos geräteübergreifend zu synchronisieren.