Hintergrund | heise: Studie: Große KI-Modelle greifen unter "Stress" auf Erpressung zurück

sascha@fedinaut.de · 7 个月前

Hintergrund | heise: Studie: Große KI-Modelle greifen unter "Stress" auf Erpressung zurück

cronenthal · edit-2 7 个月前

Nicht ganz. Das LLM versucht gar nicht, “erfolgreich” zu sein, es hat einfach keine Intention. In den Daten sind mit den Inputs einfach entsprechende Outputs näher verknüpft. Wer also “Stress” prompted wird dann “Täuschung” als Antwort erhalten. Das LLM versucht aber nichts zu erreichen, das ist einfach Unsinn.

Hintergrund | heise: Studie: Große KI-Modelle greifen unter "Stress" auf Erpressung zurück

Hintergrund | heise: Studie: Große KI-Modelle greifen unter "Stress" auf Erpressung zurück

Hintergrund | heise: Studie: Große KI-Modelle greifen unter “Stress” auf Erpressung zurück