AIがますます人間ぽくなってきた、
話し方も態度も。
そして人間並みに、間違いを犯すようにもなる。
優れているのは抜群の記憶力と速さだけかもしれない、
という話。
(写真:フォトAC)
【AIの中で何が行われているのか】
玉石混交のネット情報の中から、生成AIは何を基準または根拠にして取捨選択し、提示して来るのか――とりあえず本人(Copilot:副操縦士)に聞いてみます。
問い:生成AIはデータの価値をどう判断するのか
回答:生成AIはデータの価値を判断するために、いくつかの指標や方法を使用します。
- データの品質: データが正確で信頼性が高いかどうかが重要です。エラーデータや欠損データは、AIのパフォーマンスを低下させる可能性があります。
- データの多様性: 多様なデータが含まれていることで、AIはより広範なシナリオに対応できるようになります。例えば、異なる地域や文化のデータが含まれている場合、より汎用性の高いモデルが作成できます。
- データの関連性: 学習させるAIの目的に対して、データがどれだけ関連しているかが重要です。目的に応じて、必要な情報を持つデータを選別する必要があります。
- データの新しさ: 最新のデータを使用することで、現在の状況やトレンドを反映したモデルを作成できます。特に、急速に変化する分野では重要です。
- データの量: 大量のデータが必要です。多くのデータを使用することで、AIはより正確な予測や生成を行うことができます。
これらの要素を考慮しながら、生成AIはデータの価値を判断し、最適な学習データセットを構築します。
何か他に知りたいことがあれば、お知らせください。
生成AIお得意の「分かるような分からないような」答えです。
質と量と多様性、新しさ、関連性が重要など、誰が考えたってそう思います。品質の良し悪しはそれ自体が「価値はあるかないか」ですから言わずもがなの話ですし、情報の価値はネット上で何万回引用されているとか、あるいは関係論文が多いとかでは決まりません。
これに関して大阪大学のサイト*1ははっきりと、
「生成AIは、回答を生成するまでの過程がブラックボックスになっているため、『なぜその答えを出したのか』という根拠がわからない」
と言っています。
さらに重要なこととしてこうも言います。
- 生成AIは、あくまでもデータに基づいて「それっぽいこと」を生成しているにすぎません。生成された情報の真偽を確かめるファクトチェックは、必ず人の手で行う必要があります。
- 回答だけでなく、回答の根拠のファクトチェックも大切になります。根拠となる情報を出力させることも可能ですが、その情報自体が間違っている場合もあるため、やはりその根拠も自分自身で正しいか確認する必要があります。
特に「根拠を問うてもその根拠の情報も間違っていることがある」というのは私も何度も経験してきたことです。
しかしこんないい加減で頼りないことを、生成AIはこの先も続けていくのでしょうか?
*1:生成AIに関する注意点 | 生成AI教育ガイド | 私たちの取り組み | 大阪大学 全学教育推進機構 教育学習支援部
【AIは間もなく普通の人間と同じになる】
おそらくネットから情報を取り続ける限り、この状況は続かざるを得ません。
クソみたいな情報はネット社会に不断に流入し続けますし、日々巧妙化しています。さらにネット特有の現象としてフィルター・バブル(似たような情報しか集まって来ない)やエコー・チェンバー(仲間の声ばかりが聞こえてくる)といったことが起こると、一般社会ではさほど力のない意見がネット内では主流派になったり、世の中ではほとんど信じられていない言説が熱烈に支持されていたりといったことも起こってきます。
ネットの情報は全体として歪んでいて、偏りがあったり傾斜がかかったりしていきます。するとそこから情報を採取するAIの思考も歪み、偏り、傾斜がかかり始めます。それはときに偏見を生んだり差別を助長したり、分断を促進します。同じ質問でも問われるたびに答えが違ったり、あとから考えれば何故そんなと思うような――例えば世界の人口は8億人だといったとんでもない間違いも犯したりします。つまり限りなく、その辺にいるような「普通の人間」に近づいてくるわけです。
【HAL9000もスカイネット (Skynet)も生まれない】
結局のところAIは、
「抜群の記憶力と調査能力をもち、人間の思う通りの絵を描いたり音楽を奏でたり文章を書いたりすることはできるが、人間の手を借りないことには何もできず、最後の最後まで人間のチェックを受けなければ何ひとつ決められない木偶の坊」
ということになります
AIがいつか人間の能力を越えて世界に君臨し、やがて人間を異物・不用品として始末し始める、という最悪のシナリオに私は賛成しません。人間のことを知ろうとAIがインターネットに繋がった瞬間に、人間の投げ込むクソ情報がウイルスのようになだれ込んで、AIの純粋な思考をメチャクチャにしてしまうにきまっているからです。
(この稿、続く)