近年、目覚ましい発展を遂げるディープラーニング技術は、社会のあらゆる分野に革新をもたらしています。そんなディープラーニングの基礎知識を体系的に学び、事業活用につなげる能力を証明するのが、一般社団法人日本ディープラーニング協会(JDLA)が実施する「G検定(ジェネラリスト検定)」です。
これからG検定受験を目指すあなたのために、G検定の出題範囲を順番に解説していきます。第1回目の今回は、人工知能の歴史と抱えている問題について3つのステップに分け、分かりやすく解説します。
人工知能(AI)の全体像を理解する
1.1 人工知能(AI)とは何か?
人工知能(Artificial Intelligence, AI)は、人間のように考え、行動する機械を実現する技術分野です。具体的には、以下の能力を実現することを目指します。
多くの専門家の間で認識が一致している「人工知能」は、推論、認識、判断など、人間と同じ知的な処理能力を持つ機械(情報処理システム)であるということです。しかし、「人工知能とは何か」という問いについては、専門家の間でも定まった意見はまだありません。「知性」や「知能」自体の定義がまだなく、「人間と同じ知的な処理能力」の解釈が研究者によって異なるためです。
1.2 人工知能の大まかな分類
人工知能は、その歴史的経緯などから大きく4つのレベルに分類されています。
レベル1:単純な制御プログラム
エアコンの温度調節や洗濯機の水量調整など、あらかじめ全ての振る舞いが決められているものをレベル1のカテゴリに分類します。
レベル2:古典的な人工知能
掃除ロボットや診断プログラムなど、探索・推論、知識データを利用することで、状況に応じて極めて複雑な振る舞いをする製品がレベル2のカテゴリに分類されます。
レベル3:機械学習を取り入れた人工知能
検索エンジンや交通渋滞予測など、非常に多くのサンプルデータをもとに入力と出力の関係を学習した製品がレベル3のカテゴリに分類されます。
レベル4:ディープラーニング(深層学習)を取り入れた人工知能
機械学習では、学習対象となるデータの、どのような特徴が学習結果に大きく影響を及ぼすか(これを特徴量と呼ぶ)を知ることがとても重要です。この特徴量と呼ばれる変数を自動的に学習するサービスや製品がレベル4のカテゴリに分類されます。
ディープラーニングは、特徴量を自動的に学習する技術で、画像認識や自動翻訳などの分野で活用が進んでいます。
1.3 強いAIと弱いAI
また、アメリカの哲学者であるジョン・サールが1980年に発表した論文で提示したAIの区分によると、AIは、その動作様式によって大きく2つに分類されます。
弱いAI(Weak AI, Narrow AI)
特定の課題に特化したAI。囲碁や将棋などのゲームや、画像認識、音声認識などの分野で活躍している。コンピュータは人間の心を持つ必要はなく、有用な道具であれば良いと考える立場。
強いAI(Artificial General Intelligence, AGI)
汎用人工知能とも呼ばれ、人間と同じように幅広い知能を持つAI。適切にプログラムされたコンピュータは人間が心を持つのと同じ意味で心を持つと考える立場。現時点では実現していないが、将来的には実現を目指されている。
1.4 AI効果
人工知能で新しいことが実現されて、原理が分かってしまうと、「それは単純な自動化であり知能とは関係ない」と結論付ける人間の心理的効果をAI効果と呼びます。機械によって実現できたことは、それは知能ではないと思いたくなるようです。
人工知能研究の歴史を知る
2.1 ダートマス会議
1956年に行われたダートマス会議は、人工知能研究の始まりとされています。ジョン・マッカーシーが主催したこの会議で、AI研究の重要性が広く認識され、その後の研究の発展に大きく貢献しました。
2.2 人工知能のブームの流れ
AI研究は、その後、以下のブームを経験しています。
第1次AIブーム(探索・推論の時代)
1950年代後半~1960年代:コンピュータによる「探索」や「推論」の研究が進むことで、特定の問題に対して解を提示できるようになった事がブームの要因になりました。しかし、簡単な問題(後述するトイ・プロブレム)は解けても、複雑な現実の問題が解けないことでブームは下火になっていきました。
第2次AIブーム(知識の時代)
1980年代:コンピュータに「知識」を入れると賢くなるというアプローチが全盛となった時代です。データべースに大量の専門知識を溜め込んだエキスパートシステムと呼ばれるシステムが大量に作られました。日本政府によって「第五世代コンピュータ」と名付けられた大型プロジェクトが推進されたのもこの時代です。
第3次AIブーム(機械学習・特徴表現学習の時代)
2010年代前半:ビッグデータと呼ばれる大量のデータを用いる事で、人工知能が自ら知識を獲得する機械学習が実用化されました。また、知識を定義する要素(特徴量)を人工知能が自ら学習するディープラーニング(深層学習)の登場によりブームに火が付きました。
第4次AIブーム(生成AIの時代)
2010年代中盤以降:ディープラーニングを駆使して、創造的な画像や音楽、文章などを生み出す「生成AI」という分野の研究が活性化しました。
自然言語処理の分野では、大量の言語データを効率的に学習することで自然な文章を生成できる大規模言語モデル(Large Language Model, LLM)と呼ばれる技術やそれを応用したサービスが次々と開発されました。中でも「ChatGPT」というサービスは、その革新性から多くの一般人がAIに触れる機会となりました。
人工知能分野の問題を知る
AI研究は目覚ましい進歩を遂げている一方で、以下のような問題も残されています。
トイ・プロブレム
現実世界の問題は複雑すぎるため、問題をコンピュータで扱えるように本質を損なわない程度に問題を簡略化したもの。これらは非常に限定的な状況で設定された問題なので、人工知能はそのような問題しか解けないことが次第に明らかになり、第1次AIブームが下火になる原因ともなりました。
フレーム問題
フレーム問題は、「今しようとしていることに関係のある事柄だけを選び出すことが、実は非常に難しい」ことを指すものです。状況を理解し、適切な行動をとるために必要な知識の範囲を明確にすることが難しいという事が明らかになり、人工知能研究の最大の難問とも言われています。
チューリングテスト
人間と会話できるほど高度な知能を持っているかどうかを判断するテスト。
イギリスの数学者であるアラン・チューリングが提唱した判定テストで、別の場所にいる人間がコンピュータを会話をし、相手がコンピュータだと見抜けなければコンピュータには知能があるとするものです。現時点では、このテストに完全に合格できたAIはまだありません。
1966年にジョセフ・ワイゼンバウムによって開発されたイライザ(ELIZA)は精神科セラピストの役割を演じるプログラムですが、本物のセラピストだと信じてしまう人が現れるような出来事でした。1991年以降、チューリングテストに合格する会話ソフトウェアを目指すローブナーコンテストも毎年開催されています。
思考実験:中国語の部屋
ある部屋に英語しかわからない人が閉じ込められます。その部屋には中国語の質問に完璧に答えられるマニュアルがあり、マニュアルの指示通りに中国語の文字を置き換えることで、中国語の受け答えが出来るようになります。
この部屋をブラックボックスと捉えて外からその様子を見ると、部屋の外の人は部屋の中の人が中国語を理解できると判断するでしょう。しかし、実際には英語しか理解できないのですから、受け答えが成立したからといって、中国語を理解していることにはなりません。
つまりチューリングテストに合格したとしても、本当に知能があるかは分からないという議論です。
シンボルグラウンディング問題
AIが扱うシンボルと現実世界のモノや事象をどのように結びつけるのかという問題。シンボルグラウンティング問題は、1990年に認知科学者のスティーブン・ハルナッドにより議論されたもので、記号(シンボル)とその対象がいかにして結びつくか(グラウンティングするか)という問題です。フレーム問題と同様に人工知能の難問とされています。
人間は、本物のシマウマ(Zebra)を初めて目にした時でも、あれが話に聞いていたシマウマかもしれない、とすぐに認識できます。人間の場合はシマ(Stripe)の意味もウマ(Horse)の意味も分かっているため認知できるのです。しかし、コンピュータは記号(文字)の意味が分かっていないため、記号が意味するものを結びつけることが出来ません。コンピュータにとってはただの記号の羅列にすぎないからです。
人間にとっては簡単な問題でも、コンピュータにとっては難問になる問題のひとつがこのシンボルグラウンティング問題なのです。
身体性に着目したアプローチ
知能が成立するためには身体が不可欠であるという考え方があります。物事を認知したり、思考したりできるのは人間に身体があるためで、外界と相互作用できる身体がないと、概念は捉え切れないという考え方です。このようなアプローチのことを身体性に着目したアプローチと呼ばれています。
知識獲得のボトルネック
ひとつの英文を日本語に翻訳する場合でも、一般常識がなければ正確に翻訳することはできません。人間が持っている一般常識は膨大で、それらの知識を全て扱うことは極めて困難です。このようにコンピュータが知識を獲得する事の難しさを、人工知能の分野では知識獲得のボトルネックと呼んでいます。