OpenAI、xAI、Googleが「海賊版書籍」でチャットボットを訓練したとして提訴される
米国のジャーナリストや作家グループが、OpenAI やイーロン・マスクの xAI を含む、いくつかの主要な人工知能(AI)企業を、AI システムのトレーニングに著作権のある書籍を無断で使用したとして提訴しました。
ニューヨーク・タイムズ紙の記者ジョン・キャレロウ氏ら原告側は、現地時間月曜日、カリフォルニア州の連邦裁判所に訴訟を起こした。
OpenAI と xAI のほか、Google、Anthropic、Meta Platforms、AI 検索スタートアップの Perplexity も被告となっている。
https://www.business-standard.com/world-news/us-journalist-carreyrou-sues-xai-openai-google-pirated-books-llm-training-125122300779_1.htmlOpenAIは海賊版書籍データセットを削除した理由の説明を必死で避けようとしている
OpenAIは海賊版書籍データセットを削除したことで、罰金増額のリスクに直面している。OpenAIは間もなく、海賊版書籍で構成された2つの物議を醸すデータセットを削除した理由を説明せざるを得なくなる可能性があり、その重要性は極めて高い。
ChatGPTが自身の著作物を違法に学習させたとする著者らによる集団訴訟の核心において、OpenAIのデータセット削除決定は、著者側に勝利をもたらす決定的要因となる可能性がある。
OpenAIが2022年のChatGPTリリース前に「Books 1」および「Books 2」として知られるデータセットを削除したことは疑いの余地がない。
2021年にOpenAIの元従業員によって作成されたこれらのデータセットは、オープンウェブをスクレイピングし、Library Genesis(LibGen)と呼ばれるシャドーライブラリから大量のデータを取得することで構築された。
OpenAIの説明によれば、データセットはその同じ年内に使用されなくなり、内部で削除する決定がなされた。
裁判所がOpenAIの「非使用」に関する内部メッセージを検証する著者らの証拠開示請求を認めた後、OpenAIが急いで削除しているように見えた。
https://arstechnica.com/tech-policy/2025/12/openai-desperate-to-avoid-explaining-why-it-deleted-pirated-book-datasets/
そうじゃないとSora2であの精度のアニメが出せるわけないもんね
全部食わせてるよ
>>9
ChatGPTにジブリ風の画像作らせたときの独特の赤みとか、
モロにジブリのDVD赤い問題学習してるもんなぁ‥
買ってないから訴えられてんだよ
画像の生成AIも音楽の生成AIもわざわざ学習素材一つ一つちゃんと買って学習してるわけないだろ
ネット上にあふれる違法アップロードされたデータで学習してんだよ
盗まれた食材で料理作ってるようなもん
こんなもん法が追いついて無いだけで倫理的に問題ありまくりに決ってんだろ
> こんなもん法が追いついて無いだけ
海賊版コンテンツのダウンロードは
日本を含めて大半の国で違法ですが
明らかに既存の食わせたなって感じの
新しい本もサブスクみたいに回答に反映されたら手数料が発生するみたいな感じでどうにか
「作品名 raw」とか検索したらGoogleのAIに「その言葉で検索はよくないことですよ」みたいに言われたわ
なんかあいつ出てきてから検索に抵抗感が




コメント