研究テーマ

当グループでは大きくわけて3つの研究テーマに取り組んでいます。これらの一部は互いに関連しています。

情報検索・コンテンツ解析 (Information retrieval & Digital content analysis)

  • 情報技術の急速な発展により、人類はかつてないほどの大規模かつ不均質で動的な情報に直面しています。このような情報を適切に管理し、利用者が真に必要とする情報や有用な知識を獲得するための情報検索およびコンテンツ解析と、それらの金融情報学などへの応用について研究しています。
  • たとえば、ソーシャルメディアや、金融・経済サイト評価・評判情報などを対象としたデータ解析の研究を行っています。
  • 最近の研究事例 (発表文献はこちら):
    • マルチタスク教師付きトピックモデルによる企業評価テキストからの収益予測(複数のラベルが付与された企業評価テキストデータからその企業の収益指標などを予測)
    • 時系列ノンパラメトリックベイズモデルによるネット映像データのモデリング (ネット映像データにおける時間的展開と多メディア性に着目したモデル化と応用)
    • 階層的トピックモデルによるマルチモーダルデータの潜在トピック階層の推定(テキスト注釈付き画像データに内在する潜在的な階層構造を推定)
    • マルチモーダルトピックモデルによる多言語データ分析 (潜在トピックモデルにより言語を横断した分析)
    • 確率的言語モデルによる意見の極性に基づいた情報検索 (誹謗中傷情報などの否定意見情報を高精度に検索)

リンクマイニング・ネットワーク解析 (Link mining & Network analysis)

  • 大規模なネットワーク構造から潜在構造を推定する手法、辺や頂点に属性を伴なうネットワークから潜在構造を推定する手法、それらの逐次推定手法などに関する研究を行っています。
  • たとえば、ヒトとヒトとのつながりに関する社会ネットワークや、企業間の依存性に関する金融ネットワーク、生命現象に関する生物学的ネットワークに関して、まとまった部分を検出する問題(コミュニティ発見ネットワーククラスタリング)や、将来的なつながりを予測する問題(リンク予測)、つながりの質的・量的属性を予測する問題(リンク属性予測)、情報が拡散するプロセスを明らかにする問題(情報伝播解析)、ユーザの利用履歴に基づいてアイテムを推薦したりレイティングを予測する問題(情報推薦)などに取り組んでいます。
  • 最近の研究事例 (発表文献はこちら):
    • 深層生成モデルによる金融ネットワークの時間構造の解析 (金融ネットワークを時系列重み付きネットワークとみなしてディープラーニングで学習し、未知の関係とその属性を予測)
    • 教師付きノンパラメトリックベイズモデルによる異種属性付きネットワークの解析 (複数種の属性が付与されたリンクからなるネットワークの潜在構造を教師付き無限次元潜在特徴関係によりモデル化)
    • 時系列ノンパラメトリックベイズモデルによる情報行動履歴のトレンド構造分析 (ユーザの情報行動履歴から柔軟にトレンドを推測)
    • 動的ネットワークの潜在構造推定に基づく逐次的コミュニティ発見とリンク予測 (動的なネットワークの自明でない構造を明らかにしたり将来的なつながりを予測)

機械学習・大規模データ解析 (Machine learning & Large-scale data analysis)

  • 大規模かつ不均質で動的な情報から知識を獲得するための基盤技術となる確率モデル統計的推定深層生成モデルなどについて研究しています。
  • 主に、混合メンバシップモデル潜在トピックモデルノンパラメトリックベイズモデルなどの、データ集合の潜在的構造を抽出するための潜在変数モデルとベイズ推定と、深層生成モデルと呼ばれる確率的ディープラーニング、およびそれらに関連する最適化、スパース化、並列化などについて研究しています。
  • 最近の研究事例 (発表文献はこちら):
    • Symmetric Correspondence Topic Models (互いに異なる複数の言語やメディアで構成されたデータから構成要素間の依存性を重視しつつ潜在構造を推定)
    • 教師付きトピックモデルのマルチタスク変分ベイズ推定 (マージン最大化法とトピックモデルを統合して判別分析や回帰分析を同時に実現)
    • 深層生成モデルにおける時系列プレトレーニング (時系列データに対して、プレトレーニングによる深層生成モデルの効果的な学習を実現)
    • パーティクルフィルタによる混合メンバシップ・ブロックモデルのオンライン推定 (ネットワークの潜在的な構造を逐次的に観測されたデータから学習)
    • 階層ディリクレ過程(HDP)と潜在的ディリクレ配分法(LDA)のための並列分散型推定 (HDPやLDAに基づくデータ解析を並列分散環境を用いて高速化)
    • スパース化行列因子分解に基づく欠損値予測 (応用例として、ユーザがアイテムに対して評価したレイティングを効率的に予測)

キーワード

  • 情報検索、情報推薦、クラスタリング、統計的分類、テキストマイニング、確率的言語モデル、マルチモーダルデータ解析
  • 社会ネットワーク分析、金融ネットワーク分析、Webマイニング、バイオインフォマティクス、リンクマイニング、複雑ネットワーク分析
  • 混合メンバシップモデル、ノンパラメトリックベイズモデル、潜在トピックモデル、確率的行列因子分解、潜在変数モデル
  • ベイズ推定、モンテカルロ推定、オンライン学習、マルチタスク学習、マージン最大化法、統計的機械学習
  • 深層生成モデル、ディープラーニング