Anthropic evalúa cuatro "sabotaje" vectores de amenaza para sus modelos Claude 3 Opus y Claude 3.5 Sonnet y descubre que "las mitigaciones mínimas son suficientes" (antrópico)


antrópico:

Anthropic evalúa cuatro vectores de amenaza de “sabotaje” para sus modelos Claude 3 Opus y Claude 3.5 Sonnet y descubre que “unas mitigaciones mínimas son suficientes”— Cualquier industria donde existan daños potenciales necesita evaluaciones. Las centrales nucleares tienen un seguimiento continuo de la radiación…



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here