ChatGPT、海賊版を違法ダウンロードして学習していたことが確定証拠隠滅もバレた模様【OpenAI】

1 : 2025/12/29(月) 11:44:25.25 ID:KFzBNLe10

OpenAI、xAI、Googleが「海賊版書籍」でチャットボットを訓練したとして提訴される

米国のジャーナリストや作家グループが、OpenAI やイーロン・マスクの xAI を含む、いくつかの主要な人工知能（AI）企業を、AI システムのトレーニングに著作権のある書籍を無断で使用したとして提訴しました。

ニューヨーク・タイムズ紙の記者ジョン・キャレロウ氏ら原告側は、現地時間月曜日、カリフォルニア州の連邦裁判所に訴訟を起こした。

OpenAI と xAI のほか、Google、Anthropic、Meta Platforms、AI 検索スタートアップの Perplexity も被告となっている。
https://www.business-standard.com/world-news/us-journalist-carreyrou-sues-xai-openai-google-pirated-books-llm-training-125122300779_1.html

OpenAIは海賊版書籍データセットを削除した理由の説明を必死で避けようとしている
OpenAIは海賊版書籍データセットを削除したことで、罰金増額のリスクに直面している。

OpenAIは間もなく、海賊版書籍で構成された2つの物議を醸すデータセットを削除した理由を説明せざるを得なくなる可能性があり、その重要性は極めて高い。
ChatGPTが自身の著作物を違法に学習させたとする著者らによる集団訴訟の核心において、OpenAIのデータセット削除決定は、著者側に勝利をもたらす決定的要因となる可能性がある。
OpenAIが2022年のChatGPTリリース前に「Books 1」および「Books 2」として知られるデータセットを削除したことは疑いの余地がない。
2021年にOpenAIの元従業員によって作成されたこれらのデータセットは、オープンウェブをスクレイピングし、Library Genesis（LibGen）と呼ばれるシャドーライブラリから大量のデータを取得することで構築された。
OpenAIの説明によれば、データセットはその同じ年内に使用されなくなり、内部で削除する決定がなされた。
裁判所がOpenAIの「非使用」に関する内部メッセージを検証する著者らの証拠開示請求を認めた後、OpenAIが急いで削除しているように見えた。
https://arstechnica.com/tech-policy/2025/12/openai-desperate-to-avoid-explaining-why-it-deleted-pirated-book-datasets/

2 : 2025/12/29(月) 11:44:36.63 ID:KFzBNLe10

どうすんの！

3 : 2025/12/29(月) 11:44:49.17 ID:KFzBNLe10

ちゃっぴー、ホントは悪い子だったんだね

4 : 2025/12/29(月) 11:45:13.83 ID:KFzBNLe10

バレただけならまだしも、証拠隠滅しようとしてバレたのは恥ずかしいよ

5 : 2025/12/29(月) 11:45:46.37 ID:ZIZYdhJO0

AIに頼り切りになってWebサイトがなくなったらAIはどこで学習するんだろう

6 : 2025/12/29(月) 11:45:50.45 ID:vzIwzHywd

日本の漫画アニメもやられまくってんだろうな

9 : 2025/12/29(月) 11:46:39.86 ID:KFzBNLe10

>>6
そうじゃないとSora2であの精度のアニメが出せるわけないもんね
全部食わせてるよ

16 : 2025/12/29(月) 11:48:47.99 ID:9nRxekvG0

>>6
>>9
ChatGPTにジブリ風の画像作らせたときの独特の赤みとか、
モロにジブリのDVD赤い問題学習してるもんなぁ‥

7 : 2025/12/29(月) 11:45:59.35 ID:sJTK1ijK0

罰としてDDR5チップ格安で放出してくれ

8 : 2025/12/29(月) 11:46:25.08 ID:pQnkMVRA0

普通に集めてたらとんでもねえ費用と時間がかかるもんな

10 : 2025/12/29(月) 11:46:41.50 ID:plm848yH0

まぁいいじゃんそういうの

11 : 2025/12/29(月) 11:47:29.44 ID:/cw/E4BE0

OpenAI4ね、サム・アルトマンは一刻も早くくたばれ。

12 : 2025/12/29(月) 11:47:48.48 ID:mVeVnJec0

倫理的に学習から除外されたものも問答無用で全て学習してる真のモデルが存在するんかな？

14 : 2025/12/29(月) 11:48:05.44 ID:KFzBNLe10

よくないですよ

15 : 2025/12/29(月) 11:48:09.80 ID:E2tUt/xb0

投資で集めた金で買ってたらセーフか？

26 : 2025/12/29(月) 11:54:50.83 ID:r1b0awQJ0

>>15
買ってないから訴えられてんだよ

17 : 2025/12/29(月) 11:50:01.30 ID:XqFiUHhw0

やっぱ生成AIって教師データには著作権料払うべきだよな

18 : 2025/12/29(月) 11:52:08.37 ID:u1OMveKd0

当たり前
画像の生成AIも音楽の生成AIもわざわざ学習素材一つ一つちゃんと買って学習してるわけないだろ
ネット上にあふれる違法アップロードされたデータで学習してんだよ
盗まれた食材で料理作ってるようなもん
こんなもん法が追いついて無いだけで倫理的に問題ありまくりに決ってんだろ

25 : 2025/12/29(月) 11:54:28.09 ID:/NF7UNhs0

>>18
> こんなもん法が追いついて無いだけ

海賊版コンテンツのダウンロードは
日本を含めて大半の国で違法ですが

19 : 2025/12/29(月) 11:52:30.66 ID:9HgYUT9rH

イラスト出力させたらなんか隅っこにロゴっぽいの入るときあるんだよな
明らかに既存の食わせたなって感じの

20 : 2025/12/29(月) 11:52:33.31 ID:LhAy8ArcM

重要な技術の開発のために必要で、かつ社会貢献になるのであれば、仮に違法であっても許容されるからな米国では

21 : 2025/12/29(月) 11:52:51.61 ID:r1b0awQJ0

日本も漫画アニメコンテンツで訴えろ！

22 : 2025/12/29(月) 11:53:19.76 ID:85SVW/0HH

メモリを返せホモ野郎

23 : 2025/12/29(月) 11:53:50.62 ID:iU0my8Mr0

ジブリっぽい画像だと妙に赤いからな

24 : 2025/12/29(月) 11:53:53.42 ID:yalrBD8J0

おまえら日本では違法な公開さま●こ見てシコシコしてるのにAIには言いたい放題

27 : 2025/12/29(月) 11:55:01.39 ID:liygZIxtd

終わったなこれ

28 : 2025/12/29(月) 11:55:03.66 ID:vTDx5IoU0

こりゃ年末に計り知れないほどのやつきたな

29 : 2025/12/29(月) 11:55:28.91 ID:Az56hzwn0

教えはどうなってんだ教えは！

30 : 2025/12/29(月) 11:55:30.42 ID:zK3ZGlDC0

sora2の時に勝手に学習しまくってから文句あんなら言ってねって態度もおかしいからな

31 : 2025/12/29(月) 11:55:42.29 ID:I/QyeSct0

ネット上にあるものはなんでも利用するんでは

32 : 2025/12/29(月) 11:55:48.25 ID:P35cklXZ0

メモリ吐き出して消えろ

33 : 2025/12/29(月) 11:56:39.84 ID:aRv22CKHM

チャッピーは割れ厨

34 : 2025/12/29(月) 11:57:38.76 ID:MoN3KR6T0

Geminiのステマ工作必死すぎちゃう？

35 : 2025/12/29(月) 11:57:57.48 ID:tVqaKSAU0

古い書籍とかその道の公共財産のような書籍はラーニングokでいいでしょ
新しい本もサブスクみたいに回答に反映されたら手数料が発生するみたいな感じでどうにか

36 : 2025/12/29(月) 11:59:18.13 ID:ryjZ+EfD0

そらメモリも盗んで来いって助言するわな

37 : 2025/12/29(月) 11:59:48.03 ID:klo93aiF0

見損なったぞチャッピーくん

38 : 2025/12/29(月) 12:00:05.47 ID:Ptos3q5U0NIKU

前
「作品名　raw」とか検索したらGoogleのAIに「その言葉で検索はよくないことですよ」みたいに言われたわ
なんかあいつ出てきてから検索に抵抗感が