ComputerphileSleeper Agents in Large Language Models

2025 • 第36話    2025年9月12日    14m
It's an older paper, but it checks out. Rob Miles discusses the problem of 'Sleeper Agents' - where LLMs could have hidden traits we don't know about until it's too late.

Computerphile - 2025 • 第36話の視聴方法

お使いのデバイス向けのPlexを入手

20種類以上のプラットフォームで無料で使えます。お手持ちのデバイスをお選びください。
すべてのサポート済みデバイスを見る →