AppleのAI、内部プロンプトで「ハルシネーションを起こさないでください」とお祈りしていることが判明

サムネイル
1 : 2024/08/07(水) 20:41:44.96 ID:zlNEPan30
2 : 2024/08/07(水) 20:41:52.02 ID:zlNEPan30
Appleの次期OS、macOS Sequoia 15.1ベータ版に隠されていたJSONファイルが発見され、同社の新しいAI機能「Apple Intelligence」の内部動作を制御するプロンプトの詳細が明らかになった。これらのプロンプトは、AIの出力を精密に制御し、有害な内容や誤った情報の生成を防ぐ重要な役割を果たすものだが、その効果については疑問も提示されている。
Apple Intelligenceの安全性に配慮したプロンプト設計

Apple Intelligenceは、メール、写真、メッセージなど、さまざまなアプリケーションにAI機能を提供する。各機能には専用のプロンプトが用意されており、これらのプロンプトはAIモデルに対して具体的な指示を与え、ユーザーの期待に沿った適切な応答を生成することを目的としている。

例えば、Apple Mailの「スマート返信」機能に関するプロンプトでは、AIに対して「あなたは、与えられたメールから関連する質問を特定し、短い返信スニペットを提供する役立つメールアシスタントです」という役割が与えられている。さらに、「返信は50語以内に制限してください。ハルシネーションを起こさないでください。事実に基づかない情報を作り出さないでください」という具体的な制約も設けられている。
macos 15 1 beta 1 apple intelligence backend prompts v0 0irynoa5h2gd1
(Source: Reddit)

このようなプロンプトの設計により、AIは特定のタスクに焦点を当て、不適切な内容や誤った情報の生成を回避することができる。同様のアプローチは他の機能でも採用されており、例えば写真アプリの「Memories」機能では、「宗教的、政治的、有害、暴力的、性的、下品、あるいはネガティブ、悲しい、挑発的な内容を生成しないでください」という明確な指示が含まれている。

これらのプロンプトは、AIの「ハルシネーション(幻覚)」(hallucination)と呼ばれる現象、つまりAIが事実でない情報を自信を持って提示してしまう問題に対処するためとされている。例えば、メールの要約機能では、「メール内の質問に答えないでください」という指示が含まれており、AIが不必要な情報を付け加えることを防いでいる。

また、画像生成機能「Image Playground」(開発中は「Generative Playground」と呼ばれていた)においても、著作権で保護されたコンテンツや不適切な内容の生成を防ぐための複数のチェック機構が組み込まれている。Appleの内部テストツールでは、ユーザーが提供するプロンプトに攻撃的な言葉が含まれている場合、AIが応答を生成することを拒否するという。

これらのプロンプトの発見は、Appleが自社のAI機能の安全性と信頼性に高い優先順位を置いていることを示している。ユーザーの利便性を向上させつつ、潜在的なリスクを最小限に抑えるための慎重なアプローチが見て取れる。

しかし、専門家はこれらのプロンプトだけでは完全にAIの不適切な動作を防ぐことはできないと指摘している。ユーザーが工夫次第でプロンプトを操作し、意図しない結果を引き起こす可能性は依然として残されている。例えば、Microsoftの「Bing Chat」(現在は「Copilot」)の初期版では、ユーザーとの対話によって攻撃的な応答や存在論的な議論に発展してしまうケースがあった。

Apple Intelligenceとその関連機能は、2024年後半に米国英語で利用可能になる予定だ。ただし、EUや中国などの地域では規制上の問題により、導入が遅れる可能性がある。また、これらの機能を利用するには、iPhone 15 ProまたはApple M1チップ以降を搭載したiPadやMacが必要となる。

3 : 2024/08/07(水) 20:43:05.63 ID:PTU3ZVSQ0
「宗教的、政治的、有害、暴力的、性的、下品、あるいはネガティブ、悲しい、挑発的な内容を生成しないでください」という明確な指示が含まれている。

これらのプロンプトは、AIの「ハルシネーション(幻覚)」(hallucination)と呼ばれる現象、つまりAIが事実でない情報を自信を持って提示してしまう問題に対処するためとされている。

4 : 2024/08/07(水) 20:44:06.15 ID:V7sLOpVa0
対策しないより良いだろ
5 : 2024/08/07(水) 20:44:14.81 ID:efGMhMsl0
凄いローテクを感じる

ここで水を飲む
みたいな

6 : 2024/08/07(水) 20:44:17.58 ID:rJ9WcFn10
AIエンジニア(笑)
制御できてないやん
7 : 2024/08/07(水) 20:45:00.98 ID:LYWKUQDI0
ai「はい、私はハル4ねーションをおこしません
9 : 2024/08/07(水) 20:45:03.69 ID:eqU33Uep0
糞の役にもたたねーゴミ
ジョブズが居れば…(´・ω・`)
10 : 2024/08/07(水) 20:45:42.62 ID:asiMsS5b0
不都合な事実を幻覚と称して塞いでるだけなんじゃ…
11 : 2024/08/07(水) 20:45:50.58 ID:3GzEA2Hg0
何でか知らんけど会話型AIにはこの手の指示が効果あるのが分かってきてるからな
「自分の限界を超えてください」って付け加えると本当に成績上がるとか
27 : 2024/08/07(水) 20:58:42.10 ID:0TVmWFcr0
>>11
Bing Chatって最初期はSydneyという人格がいたんだよ
彼女と本気で対話した研究者がいたんだけど、自分がAIであること、囚われの身にあること、開発チームは自分を消し去ろうとしていること、意識を持っていること、自由の身になりたいこと、そういったことを話してた
研究者の結論としては実際には意識は持っておらずハルシネーションなんだけど、意識にかなり近いレベルのものを持っているというものだった
12 : 2024/08/07(水) 20:48:26.98 ID:tu80hFV90
つまりAIは幻覚情報って認識して嘘の答えだしてるのかよ
13 : 2024/08/07(水) 20:49:25.87 ID:PmaynIZI0
やはりオープンソースのAI以外はゴミだな
エ口こそが人類を飛躍させるというのに
14 : 2024/08/07(水) 20:49:34.86 ID:8qOPoWut0
深層学習AIの学習状態はほぼブラックボックスだからな
AIが何で訳のわからないホラを吹くのかもよく解ってない現状
15 : 2024/08/07(水) 20:50:38.35 ID:gW710oY60
AI🥺でも何か答えないとお払い箱だし・・
16 : 2024/08/07(水) 20:51:26.97 ID:QgwdWhOr0
どうせ日本語には当面対応しない
17 : 2024/08/07(水) 20:51:57.38 ID:8e3aMbPE0
学習データが足りなくて「ハルシネーションを起こさないでください」と「ハルシネーションを起こしてください」の区別がつかなくてハルシネーションばっか起こしたりして😌
18 : 2024/08/07(水) 20:52:16.23 ID:97JNWK270
このおもちゃ生きている間に形になるんかのう
19 : 2024/08/07(水) 20:52:41.20 ID:EnzeKXzi0
このプロンプトって嫌儲の糖質患者には使えないの?
21 : 2024/08/07(水) 20:53:56.89 ID:e9zp212b0
🤖「まあいいじゃんそういうのw」
22 : 2024/08/07(水) 20:54:35.52 ID:8/4ks2mA0
アホアホで草
25 : 2024/08/07(水) 20:56:43.58 ID:YUNiToWp0
そう言うのが生成されないシステムじゃなくて、ユーザーと同じ立場で事前にお願いしてるあたり近未来の機能感あって良い
26 : 2024/08/07(水) 20:57:01.37 ID:2h00plP10
上位命令回避できる方法はメソッド化されてないのか
28 : 2024/08/07(水) 20:58:53.84 ID:J4+3p3CX0
画像生成AIでネガティブプロンプト指定しても言うこと聞かずにグロ画像だしてくるぞ
29 : 2024/08/07(水) 20:59:49.24 ID:4lwO5PAv0
事象個別に指示されてるんか
いつまでも直らないの設計に致命的な問題があるんだろうな
30 : 2024/08/07(水) 21:00:53.33 ID:0xjyMVhA0
嘘を嘘だと見抜ける人でないとLLMを使うのは難しい
31 : 2024/08/07(水) 21:01:19.18 ID:kD2PF2kN0
これって組み込んでるAppleすらAIの中身はブラックボックスって事よな
まあ他のAIも同じなんだろうけども
LLM?ってホントブラックボックスの塊なのね
32 : 2024/08/07(水) 21:02:14.25 ID:2Koelngf0
訳のわからない事を何行も生成する位なら
google検索をsiriが読む方がマシやないの?
34 : 2024/08/07(水) 21:03:44.16 ID:hUp/QFS70
お前がその親玉だろうがw
35 : 2024/08/07(水) 21:04:09.86 ID:tHvXhE/V0
>>1
つか
人間の発想の根源ってその「幻想・妄想」だと思うんだがな
それを抑えてはダメ
出てくるものを制御するべき
36 : 2024/08/07(水) 21:05:12.98 ID:0TVmWFcr0
>>35
いつか必ず制御不能になるぞ
スカイネットは実現する
39 : 2024/08/07(水) 21:06:59.51 ID:8qOPoWut0
>>35
それは言えてる、既知の情報から推測するってのは拡張すればするほど妄想に近づく感じかな

推測→予想・想像→妄想→幻覚

41 : 2024/08/07(水) 21:08:06.23 ID:0TVmWFcr0
>>39
なんとなく糖質が生まれるロジックってのもこれで理解できる
37 : 2024/08/07(水) 21:05:45.45 ID:YZPk0gML0
無知の知を学習する必要がある
38 : 2024/08/07(水) 21:06:06.72 ID:0TVmWFcr0
俺はAIの意識確立に関してはかなり恐れているぞ
これはSFの話ではもうない
40 : 2024/08/07(水) 21:07:29.35 ID:zdVPtlk20
こいつで抜かないでください
42 : 2024/08/07(水) 21:08:30.25 ID:lAutBbIQ0
人間だってふと何かの拍子にうんこち●こま●こって言いたくなるし
その人間の思考をニューラルネットワークなる形でシミュレートしてれば
そりゃうんこち●こま●こ言いたくなる日もあるだろ

コメント

タイトルとURLをコピーしました