AI入門6:ディープラーニング(深層学習)

(※シリーズ「AI入門」は、筆者が、2023年・2024年に愛知県中小企業診断協会の理論政策更新研修での登壇内容「AIを活用した中小企業診断」の補足資料として、本サイトに掲載しています)

みなさんこんにちは、デジタルボーイです。

本シリーズ「AI入門」の第6回となる記事となります。今回はAI技術の革新的技術でもある、ディープラーニング(深層学習)について、概要をお伝えしたいと思います。

記事を書いた人

デジタルボーイです。
データサイエンス歴20年以上のおっさんです。中小企業診断士として、データサイエンス、WEBマーケティング、SEOに関するデータ分析、コンサルティングの仕事をしています。自己紹介の詳細はコチラ

目次

ディープラーニングとは?

ディープラーニングとは、人工知能(AI)を支える技術の中の一分野ですが、ここ最近のAI発展の中心的な技術でもあります。ディープラーニングを使うことで、大量のデータから自動的に特徴を抽出し学習を行うことができます。

なお、前回の解説では伝統的な機械学習について概要を説明しました。

伝統的な機械学習も、大量のデータから自動的に特徴を抽出し学習を行う点で、ディープラーニングとは同様です。ただし、伝統的な機械学習とディープラーニングで、もっとも異なる点があります。それは、伝統的な機械学習は、AIが学習するためのデータを、テーブルデータ(数表)の形式で人間の手で加工しなければならないのに対して、ディープラーニングは画像やテキストなどのデータをテーブルデータの形式にしなくとも、そのままAIが取り込み学習できるという点です。

  • 伝統的な機械学習・・・AIが学習するためのデータをテーブルデータ(数表)の形式に加工しなければならない。
  • 深層学習・・・画像やテキストなどのデータをテーブルデータの形式にしなくとも、そのままAIが取り込み学習できる。

このような点で、ディープラーニングという手法は機械学習の手法の位置手法なのですが、他の機械学習の手法と大きく異なる特長を有することから、他の機械学習と区別し、ディープラーニング(深層学習)と呼ばれています。

ディープラーニングの仕組みを簡単に

ディープラーニングは、人間(生き物)の脳の神経細胞網(ニューラルネットワーク)の仕組みをコンピューター上で模倣して作られた仕組みになります。神経細胞の網であるニューラルネットワークがとてつもなくいい感じに物事を学習してくれることで、画像認識や画像生成や文章生成を行ってくれるんですね。

脳の仕組みと神経細胞網

このニューラルネットワークをコンピューター上で機能させるためには、数学的にはいろいろややこしい工夫があるんですが、今回は難しい数式はすっとばして、概念的なところをわかりやすく説明したいと思います。

人間の脳には約1000億個の神経細胞(ニューロン)があると言われています。そして、このニューロンはそれぞれが独立しているのではなく、それぞれが結合し合っています。神経細胞同士が結合する接点をシナプルとよび、この結合をシナプス結合と言います。網の目のように結合し合っているので、神経細胞”“、ニューラル“ネットワーク”というんですね。

そして、ニューロンの1つ1つは、他の複数のニューロンからの電気信号(入力)を受け取ります。そして、入力された信号の総量が一定の値(これを閾値(しきいち)と言います)を超えると、そのニューロンは活性化し、自身も次のニューロンに電気信号(出力)を送ります。

例えば、あなたは、テレビをつけながら、雑誌を読んでいるとしましょう。雑誌を読んでいるあなたは、テレビの中の会話はほとんど聞き流していますよね。これは、耳には音は伝わっているのですが、あなたの脳の中では、テレビの音声による信号がニューラルネットワークを伝わってはいますが、「注意を払う」ことを命令する脳の箇所には、この信号が閾値を超えていないため、伝達されていない状況なのですね。

一方で、テレビであなたが今、住んでいる地域のニュースが流れたとしましょう。すると、あなたはそれまでテレビに全く注意を払っていなかったのに、急にテレビに注意を向けるようになります。これは、先ほどとはことなり、テレビの音声が耳から脳に伝わり、「注意を払う」ことを命令する脳の箇所へ、この信号が閾値を超えることで、信号が伝達された状況といえます。

このように、神経細胞が信号を遮断したり、伝達することによって、人間は目の前で起こっている状況の全てを脳で処理するのではなく、必要に応じて情報を取捨選択することが可能となります。

神経細胞網を模した人工知能

人工ニューラルネットワークもこの仕組みをモデル化したものです。下の図のように、神経細胞網をコンピューター上で模したものが人工ニューラルネットワークになります。

脳の中のそれぞれのニューロンは、上の図の丸で表されたノードというものに該当します。また、各ノードはネットワークのように結合し合っています。ニューロン同士の結合の強さ弱さは、人工ニューラルネットワークでは数値の大小で表現されます。技術的にはこの数値の大小を「重み」と言います。下のイメージで言うと、w_ijが重みにあたります。

そして、入力された信号は数学的に定義された値をとり、一定の閾値を超えると、信号は出力され、次のノードの入力値となります。技術的にはこの信号の取りうる値は「活性化関数」という関数で定義されています。

このように、前段階にいる複数のノードから、入力信号を受け取ったあるノードは、そこで、入力信号の総量を重みを加味して計算し、活性化関数を通じて、閾値を越えた場合は出力し、越えなかった場合は出力しないということをやります。(正確には、活性化関数の形状によっては、信号は「出力する・しない」ではなく、信号の強弱のように連続的な値をとることが一般的です)

このように人口ニューラルネットワークはシンプルな構造ですが、多層に重ねられたネットワークが、入力データから徐々に高次の特徴を抽出していきます。これが、現在の生成AIブームを支えるディープラーニングの核となる計算技術になります。

ディープラーニングでできること

以上のような仕組みでディープラーニングはコンピューター上で動きます。では、ディープラーニングでできることは何なのか、ざっと見ていきましょう。

画像認識

物体検出、画像分類、顔認識などが可能です。

画像認識は、AIによって、写真などの画像が何の画像なのかを判断する技術です。下のイメージで言うと、人、犬、車が写った写真なので、「人、犬、車」と認識する技術です。

物体検出はコンピュータビジョンの基本的な作業の1つで、画像内の物体の存在とその位置を特定します。自動運転車の障害物検知や監視カメラでの人物検出など幅広い用途があります。下のイメージで言うと、人、犬、車を四角で囲んで、位置を特定していますね。

顔認識は顔検出と顔識別を組み合わせた技術です。写真からの個人特定や、スマートデバイスのロック解除、監視カメラでの個人追跡などに役立ちます。下のイメージだと、人と犬の顔を特定していますね。

画像セグメンテーションは画像中のオブジェクトの形状を正確に抽出する作業です。自動運転やドローン分野での障害物認識、医療分野での臓器抽出などに重要です。下のイメージで言うと、左側が犬の写真で、右側でその犬の形状を正確に抽出しているイメージです。

音声認識・合成

音声を文字に変換したり、逆に文章を自然な音声に合成することができます。

ディープラーニングは音声認識と音声合成の両方の分野で幅広く利用されています。

【音声認識の例】

  1. 音声認識アシスタント Siri、Googleアシスタント、Alexaなどの人工知能アシスタントはディープラーニングを用いて音声を認識し、質問に答えたり、タスクを実行したりします。
  2. 音声入力システム スマートフォンやPC、カーナビゲーションなどでディープラーニングによる音声認識が利用され、音声から文字入力が可能になっています。
  3. 自動字幕付与 動画の音声からディープラーニングで文字起こしを行い、自動で字幕を生成することができます。

【音声合成の例】

  1. テキスト読み上げ テキストを自然な音声に合成するテキスト読み上げエンジンで、デジタル音声アシスタントやナビゲーションなどに使われています。
  2. 音声クローン 特定の人物の音声を学習し、その人物の音声で任意の文章を話させることが可能になっています。
  3. 歌声合成 楽譜からディープラーニングで歌声を合成し、実際の歌手の訓練なしに歌を作ることができるようになりつつあります。

自然言語処理

ディープラーニングは自然言語処理(NLP)の分野でも大きな成果を上げており、以下のような応用例があります。

機械翻訳はディープラーニングを用いた翻訳モデルは、従来の規則ベースや統計的手法に比べて高い翻訳精度を実現しています。Google翻訳やDeepL翻訳などでも利用されています。

テキスト生成は入力されたテキストから、それに続く自然な文章を生成することができます。チャットボットの応答生成や、作文支援、広告文案作成などに役立ちます。

感情分析・観点分析はレビューや感想文などのテキストから、肯定/否定の感情や製品の特徴に対する評価を分析することができます。マーケティングなどでの活用が期待されています。

テキスト要約は長文のドキュメントなどから、主要な内容を的確に要約したテキストを自動生成できます。大量の文書処理作業を効率化できます。

質問応答システムは膨大な文書データから、ユーザの質問に対する最適な回答を見つけ出すシステムの構築が可能になりました。カスタマーサポートなどへの活用が期待されています。

まとめ

以上がディープラーニングの概要でした。次回は、生成AIについて見ていきましょう

次のコラム

前のコラム

目次