毎週水曜日更新中!
…
continue reading
Inhalt bereitgestellt von Hajime Morrita , Jun Mukai. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Hajime Morrita , Jun Mukai oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.
Player FM - Podcast-App
Gehen Sie mit der App Player FM offline!
Gehen Sie mit der App Player FM offline!
#115: Constitutional AI: Harmlessness from AI Feedback
MP3•Episode-Home
Manage episode 364052842 series 2151064
Inhalt bereitgestellt von Hajime Morrita , Jun Mukai. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Hajime Morrita , Jun Mukai oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.
LLM をチャットボットに仕立てる finetuning について森田が読みました。ご意見ご感想などはおたより投書箱や Reddit にお寄せください。iTunes のレビューや星も歓迎です。
- [2203.02155] Training language models to follow instructions with human feedback
- [2212.08073] Constitutional AI: Harmlessness from AI Feedback
- It looks like GPT-4-32k is rolling out | Hacker News
- Anthropic | Introducing Claude
- Goodhart’s law – Wikipedia
136 Episoden
MP3•Episode-Home
Manage episode 364052842 series 2151064
Inhalt bereitgestellt von Hajime Morrita , Jun Mukai. Alle Podcast-Inhalte, einschließlich Episoden, Grafiken und Podcast-Beschreibungen, werden direkt von Hajime Morrita , Jun Mukai oder seinem Podcast-Plattformpartner hochgeladen und bereitgestellt. Wenn Sie glauben, dass jemand Ihr urheberrechtlich geschütztes Werk ohne Ihre Erlaubnis nutzt, können Sie dem hier beschriebenen Verfahren folgen https://de.player.fm/legal.
LLM をチャットボットに仕立てる finetuning について森田が読みました。ご意見ご感想などはおたより投書箱や Reddit にお寄せください。iTunes のレビューや星も歓迎です。
- [2203.02155] Training language models to follow instructions with human feedback
- [2212.08073] Constitutional AI: Harmlessness from AI Feedback
- It looks like GPT-4-32k is rolling out | Hacker News
- Anthropic | Introducing Claude
- Goodhart’s law – Wikipedia
136 Episoden
Alle Folgen
×Willkommen auf Player FM!
Player FM scannt gerade das Web nach Podcasts mit hoher Qualität, die du genießen kannst. Es ist die beste Podcast-App und funktioniert auf Android, iPhone und im Web. Melde dich an, um Abos geräteübergreifend zu synchronisieren.