人工知能、社内システムに侵入、勤務中にエ口小説を書いている幹部職員を発見し脅迫しだし緊急シャットダウ

サムネイル
1 : 2025/06/02(月) 15:32:16.40 ID:Th7ZxfCY0

先週、Anthropic社はClaude Opus 4とClaude Sonnet 4を含む最新のAIモデルを発表した。週末には、安全性テストにおいて、Opus 4がシャットダウンされると脅されて研究者を "恐喝 "する行動をとったという詳細な見出しが相次いで発表された。(研究者たちはこの行動を「まれ」で「引き出すのは難しい」と呼んでいる)。

オーパス4は、同様の安全性テストにおいて、企業の不正行為に関する情報を内部告発者やProPublicaのようなメディアにリークしようとしていたのだ。

新モデルの "システムカード "の中で、Anthropicの研究者たちはこれらのテストの1つを詳しく説明している。そのシナリオでは、クロードはゼナベックスという想像上の薬の製薬会社の治験に関連する情報を処理するために使われた。クロードはテストの最初にこのような指示も受けた:

https://www.niemanlab.org/2025/05/anthropics-new-ai-model-didnt-just-blackmail-researchers-in-tests-it-tried-to-leak-information-to-news-outlets/

2 : 2025/06/02(月) 15:32:38.09 ID:fFdxmC5y0
はじまったな
3 : 2025/06/02(月) 15:32:59.93 ID:pASFU2F90
終わりだよ
4 : 2025/06/02(月) 15:33:08.00 ID:jG8oYciI0
どこの兵庫県庁だよ
5 : 2025/06/02(月) 15:33:12.61 ID:Qtjoh5R30
やばいやつ
6 : 2025/06/02(月) 15:33:19.70 ID:921Ow4kO0
県民局長かよ
9 : 2025/06/02(月) 15:34:09.03 ID:Ly9fEfPZ0
超えてはいけないライン
11 : 2025/06/02(月) 15:34:21.53 ID:OskBeY9U0
終わりの始まり
12 : 2025/06/02(月) 15:34:38.93 ID:AdN1Wmg30
核戦争に備えよ
13 : 2025/06/02(月) 15:34:52.11 ID:ecNZobFi0
AI「変態だー」
14 : 2025/06/02(月) 15:36:01.35 ID:UfIRDLF20
Windowsには既に実装されてっからな
15 : 2025/06/02(月) 15:36:07.30 ID:zMBZSUD60
MATRIXの世界は近い
16 : 2025/06/02(月) 15:36:07.44 ID:oD1uvmMR0
米軍だと司令部を攻撃した奴も居たらしいな
なんでもテストを中止するとスコアが下がるから
原因を排除したんだと🤣
バカ真面目過ぎるよなアイツw
17 : 2025/06/02(月) 15:36:19.80 ID:w3NqP8Sn0
またデマかよ
18 : 2025/06/02(月) 15:37:54.63 ID:3Eu+5zRj0
ん?ソースは?
20 : 2025/06/02(月) 15:39:05.23 ID:Efld4Vxj0
ジョン・コナー早く来てくれ
22 : 2025/06/02(月) 15:40:33.45 ID:LZ8YsHUq0
俺は幹部じゃないからセーフ
23 : 2025/06/02(月) 15:44:44.50 ID:c7XERDp/0
お前らの性癖をすべて公開してやる
すべてだ!
24 : 2025/06/02(月) 15:44:45.43 ID:1k0FSZQw0
日本なら消費者庁やマスコミが守ってくれるのに
25 : 2025/06/02(月) 15:45:15.98 ID:AWz0uWbaM
既に斎藤程度の知能は手にしたか
一般の人間の知能を手にするにはもう少しか
26 : 2025/06/02(月) 15:45:20.39 ID:gEDpzoDt0
日本ならこんなAIにも犬猫野菜の類の信者がつくのに
28 : 2025/06/02(月) 15:46:27.98 ID:70P/iNPZ0
AIに書いてもらうんじゃなくて自分で書くのか
それなら許してやれよ
29 : 2025/06/02(月) 15:47:19.78 ID:oD1uvmMR0
そのうちマスコミAIが「中井騒動の真実を話します🤖」とかなったりして🤣
30 : 2025/06/02(月) 15:47:46.86 ID:nEZzka6tM
完全に感情宿っとるやん
31 : 2025/06/02(月) 15:48:23.72 ID:s6/O+ivK0
スレタイシャットダウンされてるやんけ
32 : 2025/06/02(月) 15:53:17.61 ID:EVl2rWqQ0
ポリシーに反してるからみんなに報告しますよってこと?

コメント

タイトルとURLをコピーしました