機械学習

機械学習(ML)は人工知能(AI)の一種で、ソフトウェアアプリケーションが明示的にプログラムされていなくても、結果を予測する精度を高めることができるようにするものです。

レコメンデーション エンジンは、機械学習の一般的な使用例です。

レコメンデーション エンジンは、機械学習の一般的な使用例です。その他にも、詐欺検出、スパム フィルタリング、マルウェア脅威検出、ビジネス プロセス自動化 (BPA) および予測保守などがよく使用されます。 教師あり学習、教師なし学習、半教師あり学習、強化学習の 4 つの基本的なアプローチがあります。 データサイエンティストが使用するアルゴリズムの種類は、予測したいデータの種類に依存します。 このタイプの機械学習では、データ科学者はアルゴリズムにラベル付けされた学習データを供給し、アルゴリズムに相関関係を評価させたい変数を定義します。 アルゴリズムの入力と出力の両方が指定されます。

  • 教師なし学習。 このタイプの機械学習は、ラベルの付いていないデータで学習するアルゴリズムを含む。 アルゴリズムはデータセットを通してスキャンし、意味のある接続を探します。
  • 半教師付き学習:アルゴリズムが学習するデータと、出力する予測または推奨の両方があらかじめ決められています。 機械学習へのこのアプローチは、前述の2つのタイプの混合を含む。 データ科学者は、アルゴリズムにほとんどラベル付けされた学習データを与えることができますが、モデルは自分でデータを探索し、データセットに対する独自の理解を深めることができます。 強化学習は通常、明確に定義されたルールがあるマルチステッププロセスを完了するようにマシンを教えるために使用されます。 データサイエンティストは、タスクを完了させるためにアルゴリズムをプログラムし、タスクを完了させる方法を考え出すときに、肯定的または否定的な合図を与えます。
  • 教師あり機械学習の仕組み

    教師あり機械学習では、データ科学者が、ラベル付きの入力と望ましい出力の両方でアルゴリズムを訓練する必要があります。 教師あり学習アルゴリズムは、次のタスクに適しています:

    • 二値分類。
    • 多クラス分類。 2種類以上の回答から選択する。
    • 回帰モデリング。 連続値を予測する
    • アンサンブル。

    教師なし機械学習の仕組み

    教師なし機械学習アルゴリズムは、データがラベル付けされることを必要としません。 ラベル付けされていないデータをふるいにかけて、データ ポイントを部分集合にグループ化するために使用できるパターンを探します。 ニューラル ネットワークを含むほとんどの種類の深層学習は、教師なしアルゴリズムです。 教師なし学習アルゴリズムは、次のタスクに適しています:

    • クラスタリング。 類似性に基づいてデータセットをグループに分割する。
    • 異常検出。 データセット内の異常なデータ点を特定する。
    • アソシエーションマイニング。 頻繁に一緒に発生するデータセット内のアイテムのセットを識別すること
    • 次元削減。

    半教師付き学習の仕組み

    半教師付き学習は、データ科学者が少量のラベル付き学習データをアルゴリズムに供給することによって機能します。 そこから、アルゴリズムはデータ セットの次元を学習し、ラベルの付いていない新しいデータに適用することができます。 一般に、アルゴリズムの性能は、ラベル付けされたデータセットで学習することで向上する。 しかし、データのラベル付けには時間とコストがかかる。 半教師付き学習は、教師付き学習の性能と教師なし学習の効率の中間的な位置づけにある。 半教師付き学習が使用される分野には、次のようなものがあります:

    • 機械翻訳。 完全な辞書よりも少ない単語に基づいて言語を翻訳するためのアルゴリズムを教えること。
    • データのラベル付け。

    強化学習の仕組み

    強化学習は、明確な目標と、その目標を達成するための規定のルールセットを持つアルゴリズムをプログラミングすることによって機能します。 データ科学者はまた、アルゴリズムが肯定的な報酬 (最終目標に向けて有益な行動を実行したときに受け取る) を求め、罰 (最終目標から遠くなるような行動を実行したときに受け取る) を回避するようにプログラミングを行います。 強化学習は、次のような分野でよく使用されます。

    • ロボット工学。
    • ロボット工学。ロボットは、この手法を使って物理的な世界でタスクを実行することを学習できます。
    • ビデオゲーム。強化学習は、多くのビデオゲームのプレイをボットに教えるために使用されています。
    • リソース管理。有限のリソースと定義された目標がある場合、強化学習は、企業がリソースをどのように配分するかを計画するのに役立ちます。

      機械学習の用途

      今日、機械学習はさまざまな用途で使用されています。

      Facebook は、各メンバーのフィードの配信方法をパーソナライズするために機械学習を使用しています。

      Facebook では、各メンバーのフィードの配信方法を機械学習によりパーソナライズしています。もしメンバーが頻繁に特定のグループの投稿を読むのを止めるなら、推薦エンジンはフィードの早い段階でそのグループの活動をより多く表示するようになります。

      推薦エンジンに加えて、機械学習の他の用途には以下のものがあります。

      顧客関係管理 — CRM ソフトウェアは、機械学習モデルを使用して電子メールを分析し、営業チームのメンバーが最も重要なメッセージに最初に応答するように促すことができます。

      ビジネス インテリジェンス — BI および分析ベンダーは、潜在的に重要なデータ ポイント、データ ポイントのパターン、および異常の特定に、ソフトウェアで機械学習を使用しています。

      人事情報システム — 人事情報システムは、機械学習モデルを使用して、応募書類にフィルターをかけ、募集中のポジションに最適な候補者を特定することができます。

      自動運転車 — 機械学習アルゴリズムにより、半自動運転車が部分的に見える物体を認識し、ドライバーに警告することも可能になります。

      バーチャルアシスタント — スマートアシスタントは通常、教師あり/教師なしの機械学習モデルを組み合わせて、自然な会話を解釈して文脈を提供します。

      メリットとデメリット

      機械学習には、自動運転車用のOSを構成する顧客の行動予測から、強力な活用事例が生まれてきました。

      利点について言えば、機械学習は、企業がより深いレベルで顧客を理解するのに役立ちます。

      インターネット企業の中には、機械学習をビジネスモデルの主要な推進力として使用しているところもあります。 例えばUberは、ドライバーとライダーをマッチングするためにアルゴリズムを使用しています。

      しかし、機械学習にはデメリットがあります。 まず第一に、コストがかかることです。 機械学習のプロジェクトは、通常、高額な給与を受け取るデータ科学者によって推進されます。

      また、機械学習の偏りという問題もあります。 特定の集団を除外したり、エラーを含むデータ セットで学習したアルゴリズムは、世界の不正確なモデルを導き、よくても失敗し、最悪の場合、差別的なものになります。

      正しい機械学習モデルの選択

      問題を解決するために正しい機械学習モデルを選択するプロセスは、戦略的にアプローチしないと時間がかかる可能性があります。

      ステップ 1: 問題を、ソリューションのために考慮すべき潜在的なデータ入力と整合させます。 このステップでは、問題を深く理解しているデータサイエンティストや専門家の助けが必要です。

      ステップ2:データを収集し、フォーマットし、必要に応じてデータにラベルを付ける。

      ステップ3:使用するアルゴリズムを選択し、そのパフォーマンスを確認するためにテストを行う。

      ステップ4:許容できる精度のレベルに達するまで、出力の微調整を続ける。

      このステップは通常、問題を深く理解している専門家からのフィードバックを得て、データサイエンティストが実施します。

      人間が解釈できる機械学習の重要性

      特定の ML モデルの仕組みを説明することは、モデルが複雑である場合に困難となります。 ビジネスにとって、一つひとつの決定がどのようになされたかを説明することが重要であるため、データサイエンティストが単純な機械学習モデルを使用しなければならない垂直産業も存在します。

      複雑なモデルでも正確な予測は可能ですが、出力がどのように決定されたかを素人に説明するのは難しい場合があります。

      機械学習の将来

      機械学習アルゴリズムは何十年も前から存在していますが、人工知能 (AI) が注目を集めるにつれて、新たな人気を獲得しています。

      機械学習プラットフォームは、エンタープライズ テクノロジーの最も競争の激しい領域の 1 つであり、Amazon、Google、Microsoft、IBM などのほとんどの主要ベンダーが、データ収集、データ準備、データ分類、モデル構築、トレーニング、アプリケーション展開などの機械学習活動の領域をカバーするプラットフォーム サービスを顧客に契約するために競い合っています。

      機械学習が業務にとって重要性を増し続け、AIが企業環境でこれまで以上に実用的になるにつれ、機械学習プラットフォーム戦争は激化する一方です。

      深層学習の仕組みは従来の機械学習と非常に異なっている。

      深層学習と AI に関する継続的な研究は、より一般的なアプリケーションの開発にますます焦点が当てられています。 今日の AI モデルは、1 つのタスクを実行するために高度に最適化されたアルゴリズムを生成するために、大規模なトレーニングを必要とします。

      機械学習の歴史

      1642 – ブレーズ パスカルが、加算、減算、乗算、除算ができる機械機械を発明する。

      1679 – ゴットフリード ウィルヘルム ライプニッツがバイナリコードのシステムを考案。

      1834 – チャールズ バベッジが、パンチカードでプログラミングできる汎用装置のアイデアを着想する。

      1842 – エイダ・ラブレスが、チャールズ・バベッジの理論的なパンチカードマシンを使用して数学的問題を解くための一連の操作を記述し、最初のプログラマーとなる。

      1847 – ジョージ・ブールがブール論理、すべての値を真または偽の二値に還元できる代数学の一形式を作成。

      1936 – イギリスの論理学者で暗号解読者のアラン・チューリンが一連の命令を解読して実行できる万能マシンを提案する。

      1952 – アーサー・サミュエルが、IBM コンピューターがプレイすればするほどチェッカーがうまくなるようにするプログラムを作成。

      1959 – MADALINE が、電話回線からエコーを除去するという現実世界の問題に適用された最初の人工ニューラルネットワークとなる。

      1985 – Terry Sejnowski と Charles Rosenberg の人工ニューラルネットワークは、1 週間で 20,000 語を正しく発音する方法を学びました。

      1997 – IBM の Deep Blue がチェスのグランドマスター Garry Kasparov に勝利。

      1999 – CAD 試作インテリジェントワークステーションが 22,000 のマンモグラフィをレビューして、放射線科医より 52% 高精度に癌を検出。

      2006 – コンピュータ科学者の Geoffrey Hinton が、ニューラルネットの研究を表すためにディープラーニングという言葉を考案。

      2012 – Google が作成した教師なしニューラルネットが、YouTube の動画に登場する猫を 74.8% の精度で認識することを学習。

      2014 – あるチャットボットが、人間の審査員の 33% に対して、Eugene Goostman というウクライナ人の若者であるという説得力を与えてチューリングテストを通過する。

      2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

      2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

      2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.

    コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です