AI×セキュリティ

小澤・阿部・Kim研究室

小澤・Kim研究室では、機械学習や深層学習に代表されるAI技術をセキュリティ分野に応用し、インターネット上のサイバー空間と現実世界の物理空間の安全安心を担保する学習型知的システムの開発を行っています。
現在、JST CREST、NICT委託研究、情報通信研究機構やLINE, Integral Geometry Science社との共同研究で以下のプロジェクトを進めています。

  1. プライバシー保護機械学習エンジンの開発とその社会実装
  2. 機械学習を用いたサイバー攻撃の検知・分類・可視化
  3. 深層学習モデルを用いたコマンドログに基づくユーザなりすまし検知
  4. スーパーセキュリティゲート実現に向けた磁場分布画像解析の深層学習による高度化

1.プライバシー保護機械学習エンジンの開発とその社会実装

CREST『イノベーション創発に資する人工知能基盤技術の創出と統合化』(JST) 【共同研究:産総研、 NICT、東京大学、エルテス】

IoTやAI、クラウドなどの技術的進展に伴い、行政やビジネス、我々の私生活に関わるあらゆる情報がデジタル化され、それが利活用されることで、業務プロセスやビジネスと企業、人の関わり方に変革をもたらすデジタルトランスフォーメーションが注目されています。Society 5.0が目指す、現実世界とサイバー空間がシームレスに「つながる」世界を実現するには、個人情報や営業秘密など保護すべきデータをきちんと保護したうえで、データを安全に分析する手法の確立が欠かせないと考えます。

本研究室では、JST CRESTプロジェクト [代表者:花岡(産総研)]のもとで,NICTサイバーセキュリティ研究所セキュリティ基盤研究室と共同で,データを準同型暗号(図参照)で秘匿し、「暗号データのままで機械学習を行うプライバシー保護機械学習 (Privacy-Preserving Machine Learning, PPML)方式」を開発しています.現在,以下の2つの課題に対し,チームに分かれて開発を行っています。


準同型暗号の概念

(1)プライバシー保護機械学習エンジン (PPML) の開発・改良

準同型暗号などの秘匿計算手法と代理計算モデルを組み合わせ、複数組織(例えば銀行など)が所有するデータを互いに秘匿した上で、学習や予測を行える多入力依頼計算型のニューラルネットワーク、深層学習モデル、アンサンブル決定木モデルを開発し、分類や異常検知、可視化を行うPPMLエンジンとして実装します。

◎事例1「準同型暗号を用いたプライバシー保護3層ニューラルネット」

Ring-LWEベースの準同型暗号を用いて、3層ニューラルネットの積和計算を高速に実行できるPPMLモデルを提案しています.提案モデルでは、入力データを暗号化して、その識別結果を受け取るクライアント、学習済モデルを用いて暗号化された入力に対する識別結果を求めるサーバで構成されます。



プライバシー保護3層ニューラルネットにおける予測手順
(手塚,立華,林,Kim,為井,大森,小澤,“三層ニューラルネットワークにおけるRing-LWEベース準同型暗号を用いた効率的なプライバシー保護推論処理”, 2019年人工知能学会全国大会,2019.)

◎事例2「準同型暗号を用いたプライバシー保護決定木分類」

事前に訓練済みの決定木分類器を保持する「モデル所持者」と入力データを持つ「データ所有者」、計算資源を提供する「外部サーバ」の3者が参加するRing-LWEベース準同型暗号を用いたプライバシー保護決定木 (Privacy-Preserving Decision Tree, PPDT)モデルを提案しています。Ring-LWE ベース準同型暗号を用いた効率的なセキュア大小比較と準同型内積演算を使用することで,データ所有者のデータとモデル提供者の決定木モデルを互いに暗号化した状態で秘匿計算可能なプロトコルを提案しています。


プライバシー保護決定木分類による高速分類プロトコル
(福井,王,林,小澤,“Ring-LWEベース準同型暗号を用いたプライバシー保護決定木分類”, CSS 2019,2019.)
(2)プライバシー保護金融データ解析システムの実装

個人情報保護が障壁となって、複数組織(例えば銀行など)が有するパーソナルデータを分析することは、今でも大変ハードルの高いことです。しかし、プライバシー保護機械学習(PPML)の進展とともに、暗号化などでデータを秘匿化しても機械学習などでデータ解析が可能になることから、PPMLを活用した新しいビジネス展開を模索しています。その一つとして、PPMLエンジンを複数の金融機関が所有する顧客口座取引データに適用し、「不正送金の検知」やオレオレ詐欺などの特殊詐欺に関与した「不正口座の特定」を行う検知・可視化システムを、実際に複数の銀行と連携して構築しています。


プライバシー保護機械学習エンジンを用いた銀行不正送金検知の取り組み

2.機械学習を用いたサイバー攻撃の検知・分類・可視化
(1)AI技術を応用した大規模クローリング機構の開発

NICT委託研究『Web媒介型攻撃対策技術の実用化に向けた研究開発 (WarpDrive)』(情報通信研究機構)【共同研究:KDDI総合研究所,セキュアブレイン,横浜国立大学,構造計画研究所,金沢大学,岡山大学】

近年、Webサイトを改ざんして攻撃サイトを構築し、アクセスしてきた利用者を攻撃する「Web媒介型攻撃」が深刻な問題となっています。Web媒介型攻撃は、脆弱性攻撃手法等の開発や流通、脆弱サイトの探索や攻撃サイトの構築、攻撃サイトへのエンドユーザの誘導と乗っ取りといった一連の不正活動から構成されると考えられます。本研究課題では、表面化しているWeb媒介型攻撃のみならず、一連の不正活動を網羅的に観測、分析することによって、攻撃の構造を正確に把握し、攻撃サイト等を効率的に検出することで利用者を保護する技術を確立することを目的にしています。

本研究室では、 NICT委託研究WarpDriveプロジェクト [代表者:中島(KDDI総合研究所)]のもとで,KDDI総合研究所やセキュアブレイン、横浜国立大と共同して,通常の検索エンジンで検索可能な表層Webおよび匿名通信を利用しなければアクセスできないディープ/ダークWebの双方から、サイバー攻撃などの脅威情報を広範囲かつ効率的に自動収集する大規模クローリング機構を、AI技術を活用して開発しています。また,AI大規模クローリングで得られる収集物(HTML,JavaScript,URLなど)の悪性度を判定する機能を追加し,これで得られた情報をWarpDriveプロジェクトで開発しているエンドユーザ向けの攻撃検知・防御ソフトウェア(タチコマAS)にブラックリストや脅威情報として提供することを目的としています。


WarpDriveプロジェクトの概要


機械学習を用いた悪性JavaScript判定のフロー
(S. Ndichu, S. Kim, S. Ozawa, et al., “A Machine Learning Approach to Detection of JavaScript-based Attacks Using AST Features and Paragraph Vectors,” Applied Soft Computing, vol. 84 (online), 22 August 2019.)
(2)ダークネットセンサーによる攻撃検知・可視化

科研費基盤(B)『サイバー攻撃のリアルタイム検知・分類・可視化のためのオンライン学習方式』【共同研究:情報通信研究機構サイバーセキュリティ研究所】

年々被害が深刻化しつつあるサイバー攻撃に対抗するため、インターネット全体の攻撃状況を実時間で大局的に把握できる監視システムが求められています。本研究では、未使用のIP空間である「ダークネット」に送られる通信トラフィックを特徴ベクトル化し、その時空間パターンからサイバー攻撃をリアルタイムで検知・分類・可視化できる学習型監視システムを開発しています。時々刻々と変異していくサイバー攻撃に追従するため、攻撃の検知を行う外れ値検出と攻撃分類を行う識別器、そして攻撃の可視化やルール抽出を高速にオンライン学習する方式を開発しています。



ダークネットセンサーで観測される通信トラフィック

ダークネット分析で得られたIoTマルウェアの活動変遷

3.深層学習モデルを用いたコマンドログに基づくユーザなりすまし検知

【共同研究:LINE】

近年、正規ユーザになりすましてシステムに不正侵入し、重要情報の取得などを試みるサイバー攻撃が深刻化しています。この不正侵入を内部ユーザの異常行動として検出する仕組みが求められています。従来型のルールベースでの不正侵入検知システムでは、新しいなりすましの手口に対応するのに時間がかかるため、高い検知精度と低い偽陽性を維持したまま、手口の変化に適応できるデータ駆動型の学習システムが望まれています。

本研究では,Character-level CNN に自己注意機構とBiLSTM を導入した深層学習モデルを提案し、これにUNIX 系サーバーで収集された社員のコマンド・ログ情報を与えてオンライン学習しながら、なりすまし手口の変化に適応できる学習システムを開発しています。



ログ解析に基づく深層学習モデルを用いたなりすまし検知システム
(安達、小澤、春木、”深層学習モデルを用いたコマンドログに基づくユーザなりすまし検知”, 情報処理学会研究報告(CSEC), 2020.)

4.スーパーセキュリティゲート実現に向けた磁場分布画像解析の深層学習による高度化

【共同研究:Integral Geometry Science】

近年、交通機関やスポーツ等のイベント会場など多くの人が集まる場所での凶悪事件が顕在化しています。次世代型セキュリティー検査システムとして開発中である「スーパーセキュリティゲート」は、通過した磁性体の磁場分布を画像再構成理論で画像化することができます。本研究では,ゲートで得られた磁場分布画像から高精度に危険物の所持を検出する方法として畳み込みニューラルネットを導入し、スーパーセキュリティゲートの高度化を目指します。


深層学習モデルを用いた危険物検出フロー