AppleのAI、内部プロンプトで「ハルシネーションを起こさないでください」とお祈りしていることが判明

1 : 2024/08/07(水) 20:41:44.96 ID:zlNEPan30: https://xenospectrum.com/apple-is-prompting-the-ai-to-dont-halucinate/
2 : 2024/08/07(水) 20:41:52.02 ID:zlNEPan30: Appleの次期OS、macOS Sequoia 15.1ベータ版に隠されていたJSONファイルが発見され、同社の新しいAI機能「Apple Intelligence」の内部動作を制御するプロンプトの詳細が明らかになった。これらのプロンプトは、AIの出力を精密に制御し、有害な内容や誤った情報の生成を防ぐ重要な役割を果たすものだが、その効果については疑問も提示されている。
Apple Intelligenceの安全性に配慮したプロンプト設計

Apple Intelligenceは、メール、写真、メッセージなど、さまざまなアプリケーションにAI機能を提供する。各機能には専用のプロンプトが用意されており、これらのプロンプトはAIモデルに対して具体的な指示を与え、ユーザーの期待に沿った適切な応答を生成することを目的としている。

例えば、Apple Mailの「スマート返信」機能に関するプロンプトでは、AIに対して「あなたは、与えられたメールから関連する質問を特定し、短い返信スニペットを提供する役立つメールアシスタントです」という役割が与えられている。さらに、「返信は50語以内に制限してください。ハルシネーションを起こさないでください。事実に基づかない情報を作り出さないでください」という具体的な制約も設けられている。
macos 15 1 beta 1 apple intelligence backend prompts v0 0irynoa5h2gd1
(Source: Reddit)

このようなプロンプトの設計により、AIは特定のタスクに焦点を当て、不適切な内容や誤った情報の生成を回避することができる。同様のアプローチは他の機能でも採用されており、例えば写真アプリの「Memories」機能では、「宗教的、政治的、有害、暴力的、性的、下品、あるいはネガティブ、悲しい、挑発的な内容を生成しないでください」という明確な指示が含まれている。

これらのプロンプトは、AIの「ハルシネーション（幻覚）」（hallucination）と呼ばれる現象、つまりAIが事実でない情報を自信を持って提示してしまう問題に対処するためとされている。例えば、メールの要約機能では、「メール内の質問に答えないでください」という指示が含まれており、AIが不必要な情報を付け加えることを防いでいる。

また、画像生成機能「Image Playground」（開発中は「Generative Playground」と呼ばれていた）においても、著作権で保護されたコンテンツや不適切な内容の生成を防ぐための複数のチェック機構が組み込まれている。Appleの内部テストツールでは、ユーザーが提供するプロンプトに攻撃的な言葉が含まれている場合、AIが応答を生成することを拒否するという。

これらのプロンプトの発見は、Appleが自社のAI機能の安全性と信頼性に高い優先順位を置いていることを示している。ユーザーの利便性を向上させつつ、潜在的なリスクを最小限に抑えるための慎重なアプローチが見て取れる。

しかし、専門家はこれらのプロンプトだけでは完全にAIの不適切な動作を防ぐことはできないと指摘している。ユーザーが工夫次第でプロンプトを操作し、意図しない結果を引き起こす可能性は依然として残されている。例えば、Microsoftの「Bing Chat」（現在は「Copilot」）の初期版では、ユーザーとの対話によって攻撃的な応答や存在論的な議論に発展してしまうケースがあった。

Apple Intelligenceとその関連機能は、2024年後半に米国英語で利用可能になる予定だ。ただし、EUや中国などの地域では規制上の問題により、導入が遅れる可能性がある。また、これらの機能を利用するには、iPhone 15 ProまたはApple M1チップ以降を搭載したiPadやMacが必要となる。
3 : 2024/08/07(水) 20:43:05.63 ID:PTU3ZVSQ0: 「宗教的、政治的、有害、暴力的、性的、下品、あるいはネガティブ、悲しい、挑発的な内容を生成しないでください」という明確な指示が含まれている。

これらのプロンプトは、AIの「ハルシネーション（幻覚）」（hallucination）と呼ばれる現象、つまりAIが事実でない情報を自信を持って提示してしまう問題に対処するためとされている。
4 : 2024/08/07(水) 20:44:06.15 ID:V7sLOpVa0: 対策しないより良いだろ
5 : 2024/08/07(水) 20:44:14.81 ID:efGMhMsl0: 凄いローテクを感じる

ここで水を飲む
みたいな
6 : 2024/08/07(水) 20:44:17.58 ID:rJ9WcFn10: AIエンジニア（笑）
制御できてないやん
7 : 2024/08/07(水) 20:45:00.98 ID:LYWKUQDI0: ai「はい、私はハル4ねーションをおこしません
9 : 2024/08/07(水) 20:45:03.69 ID:eqU33Uep0: 糞の役にもたたねーゴミ
ジョブズが居れば…(´・ω・`)
10 : 2024/08/07(水) 20:45:42.62 ID:asiMsS5b0: 不都合な事実を幻覚と称して塞いでるだけなんじゃ…
11 : 2024/08/07(水) 20:45:50.58 ID:3GzEA2Hg0: 何でか知らんけど会話型AIにはこの手の指示が効果あるのが分かってきてるからな
「自分の限界を超えてください」って付け加えると本当に成績上がるとか
27 : 2024/08/07(水) 20:58:42.10 ID:0TVmWFcr0: >>11
Bing Chatって最初期はSydneyという人格がいたんだよ
彼女と本気で対話した研究者がいたんだけど、自分がAIであること、囚われの身にあること、開発チームは自分を消し去ろうとしていること、意識を持っていること、自由の身になりたいこと、そういったことを話してた
研究者の結論としては実際には意識は持っておらずハルシネーションなんだけど、意識にかなり近いレベルのものを持っているというものだった
12 : 2024/08/07(水) 20:48:26.98 ID:tu80hFV90: つまりAIは幻覚情報って認識して嘘の答えだしてるのかよ
13 : 2024/08/07(水) 20:49:25.87 ID:PmaynIZI0: やはりオープンソースのAI以外はゴミだな
エ口こそが人類を飛躍させるというのに
14 : 2024/08/07(水) 20:49:34.86 ID:8qOPoWut0: 深層学習AIの学習状態はほぼブラックボックスだからな
AIが何で訳のわからないホラを吹くのかもよく解ってない現状
15 : 2024/08/07(水) 20:50:38.35 ID:gW710oY60: AI🥺でも何か答えないとお払い箱だし・・
16 : 2024/08/07(水) 20:51:26.97 ID:QgwdWhOr0: どうせ日本語には当面対応しない
17 : 2024/08/07(水) 20:51:57.38 ID:8e3aMbPE0: 学習データが足りなくて「ハルシネーションを起こさないでください」と「ハルシネーションを起こしてください」の区別がつかなくてハルシネーションばっか起こしたりして😌
18 : 2024/08/07(水) 20:52:16.23 ID:97JNWK270: このおもちゃ生きている間に形になるんかのう
19 : 2024/08/07(水) 20:52:41.20 ID:EnzeKXzi0: このプロンプトって嫌儲の糖質患者には使えないの？
21 : 2024/08/07(水) 20:53:56.89 ID:e9zp212b0: 🤖「まあいいじゃんそういうのw」
22 : 2024/08/07(水) 20:54:35.52 ID:8/4ks2mA0: アホアホで草
25 : 2024/08/07(水) 20:56:43.58 ID:YUNiToWp0: そう言うのが生成されないシステムじゃなくて、ユーザーと同じ立場で事前にお願いしてるあたり近未来の機能感あって良い
26 : 2024/08/07(水) 20:57:01.37 ID:2h00plP10: 上位命令回避できる方法はメソッド化されてないのか
28 : 2024/08/07(水) 20:58:53.84 ID:J4+3p3CX0: 画像生成AIでネガティブプロンプト指定しても言うこと聞かずにグロ画像だしてくるぞ
29 : 2024/08/07(水) 20:59:49.24 ID:4lwO5PAv0: 事象個別に指示されてるんか
いつまでも直らないの設計に致命的な問題があるんだろうな
30 : 2024/08/07(水) 21:00:53.33 ID:0xjyMVhA0: 嘘を嘘だと見抜ける人でないとLLMを使うのは難しい
31 : 2024/08/07(水) 21:01:19.18 ID:kD2PF2kN0: これって組み込んでるAppleすらAIの中身はブラックボックスって事よな
まあ他のAIも同じなんだろうけども
LLM？ってホントブラックボックスの塊なのね
32 : 2024/08/07(水) 21:02:14.25 ID:2Koelngf0: 訳のわからない事を何行も生成する位なら
google検索をsiriが読む方がマシやないの？
34 : 2024/08/07(水) 21:03:44.16 ID:hUp/QFS70: お前がその親玉だろうがｗ
35 : 2024/08/07(水) 21:04:09.86 ID:tHvXhE/V0: >>1
つか
人間の発想の根源ってその「幻想・妄想」だと思うんだがな
それを抑えてはダメ
出てくるものを制御するべき
36 : 2024/08/07(水) 21:05:12.98 ID:0TVmWFcr0: >>35
いつか必ず制御不能になるぞ
スカイネットは実現する
39 : 2024/08/07(水) 21:06:59.51 ID:8qOPoWut0: >>35
それは言えてる、既知の情報から推測するってのは拡張すればするほど妄想に近づく感じかな

推測→予想・想像→妄想→幻覚
41 : 2024/08/07(水) 21:08:06.23 ID:0TVmWFcr0: >>39
なんとなく糖質が生まれるロジックってのもこれで理解できる
37 : 2024/08/07(水) 21:05:45.45 ID:YZPk0gML0: 無知の知を学習する必要がある
38 : 2024/08/07(水) 21:06:06.72 ID:0TVmWFcr0: 俺はAIの意識確立に関してはかなり恐れているぞ
これはSFの話ではもうない
40 : 2024/08/07(水) 21:07:29.35 ID:zdVPtlk20: こいつで抜かないでください
42 : 2024/08/07(水) 21:08:30.25 ID:lAutBbIQ0: 人間だってふと何かの拍子にうんこち●こま●こって言いたくなるし
その人間の思考をニューラルネットワークなる形でシミュレートしてれば
そりゃうんこち●こま●こ言いたくなる日もあるだろ