OpenAI 因训练 ChatGPT 数据再被高达 15 项指控

外媒报导，加州律师事务所 Clarkson Law Firm 最近对 OpenAI 提起集体诉讼，因未经同意窃取百万使用者数据，甚至包括各年龄儿童可辨识身分，训练 AI 聊天机器人 ChatGPT 和图片生成AI DALL‧E。

Clarkson Law Firm 指 OpenAI 为了训练大语言模型，从网络采集 3,000 亿文字，包括个人信息、Twitter 和 Reddit 等社群媒体的文章，且非常隐密，没有依法律要求注册成为数据经纪人。

OpenAI 如何收集和使用哪些数据训练和开发 ChatGPT，一直备受争议，直到 4 月才让相关者能拒绝通话内容和个人资料提供 ChatGPT。

虽然集体诉讼针对 OpenAI 未经同意进行网络采集且不与 ChatGPT 分享的数据，但也包括不透明的用户隐私政策。

Clarkson Law Firm 认为 OpenAI 获微软大量注资，加上从 ChatGPT Plus 订阅用户赚钱，但未补偿数据来源者。指控高达 15 项，有侵犯隐私、未保障个人信息、非法手段取得大量数据训练模型等。