2024 年 11月 28日 (木)
ホーム経済IT/メタバースチャットGPTに活用した3000億の単語 火がついたAI開発競争 (5)

チャットGPTに活用した3000億の単語 [KWレポート] 火がついたAI開発競争 (5)

(写真=gettyimagesBank)(c)MONEYTODAY

「チャットGPTは、個人情報データ(DataPrivacy)という観点では悪夢のような存在だ。ただ一度でもオンラインにポスティングしたことがあれば、あなたも心配する必要がある」

連日話題を呼んでいるチャットGPTに対し、不快な視線を送る人が増えている。豪シドニー大学ビジネススクールのユーリ・ゲル(UriGal)教授は最近、学術系ニュースサイト「ザ・カンバセーション」に寄稿し、個人情報の観点からAI(人工知能)の危うさを指摘した。ビッグテック企業がAIをめぐって、個人情報と関連した脅威が軽視されているとした。

ゲル教授によると、オープンAIがチャットGPTの性能高度化のために活用した単語の数はなんと3000億個に達する。出版された書籍や記事をはじめ、各種ウェブサイトやSNSのポスティングから調達したもので、この中には同意なしに収集した個人情報も含まれている。

ゲル教授は「ブログや製品レビューを書いたり、オンライン記事にコメントを付けたりすれば、この情報はチャットGPTによって消費されている可能性が高い」と指摘した。そのうえで「チャットGPTは、誰に対してもそうした個人情報を使用できるかどうかを聞かない」との見方を示した。

ゲル教授によると、オープンAIは、より速い応答時間と、新たな機能に対する優先接近権を保障する有料モデルを発売する計画を掲げているという。同社は2024年までに10億ドル規模の収益を創出するものと予想されることから「オープンAIの企業価値は昨年比2倍水準の290億ドルに達する」(ゲル教授)そうだ。

◇個人情報、当事者に知らせず

オープンAIはインターネットでスクラップしたデータに対して費用を支払わず、これを生成した個人やウェブサイト運営者、企業は何の補償も受けられなかった――という指摘もあり、ゲル教授は「われわれの承認なしに収集、使用されたデータがなければ、オープンAIの企業価値の上昇、収益の展望は不可能だっただろう」とみている。

特に問題とされるのは、オープンAIがユーザーのIP(インターネットアドレス)やブラウザタイプや設定、使用する機能や作業の内容まで収集する点だ。ゲル教授は次のような問題点を指摘する。

「オープンAIは、ユーザーがウェブサイトでどんな検索をしたかなどの情報を時間帯別に収集している。驚くべきことに、オープンAIは自分たちが収集したユーザー個人情報を当事者に知らせないまま、不特定の第三者に提供できるのだ」

こうした問題がありながら、ユーザー側は自分の情報がオープンAIに保存されているかどうかを確認することはできず、削除を要請する手段がない――。

オープンAIは著作権侵害と関連した法的紛争にも直面している。米ニュースサイト「ザ・ヴァージ(the Verge)」などによると、昨年11月、オープンAIとGitHub、MS(マイクロソフト)など3社を対象にした著作権侵害にかかわる集団訴訟が提起され、オープンAIなどは対決姿勢を強めている。

(つづく)

(c)MONEYTODAY

RELATED ARTICLES

Most Popular