2024年度 第38回人工知能学会全国大会(JSAI2024)参加レポート

はじめまして!2024年5月よりInsight EdgeにジョインしたData Scientistの市川です。
まだ入社して間もないですが、オルタナティブデータを活用した案件や、金融市場のオプション等を活用した分析などに携わっております。
今回は、先日人工知能学会(JSAI2024)に行ってきましたので、そのレポートをさせて頂きます。

イベントの概要

人工知能学会 は1986年7月に設立された学術研究団体です。

詳細は上記リンクに譲るのですが、歴史がある学会ではあるものの、かなり広い領域の研究を扱っている認識で、近年LLMへの注目の高まりとともに人が集まっている学会という認識です。

スケジュールは以下の通りでした。

  • 日時:2024年5月28日(火)~31日(金)
  • 会場:アクトシティ浜松(静岡県浜松市)

参加人数は対面とオンラインで3500人超となっているようでして、巨大な学会になっています。2017の名古屋の大会では2000人を初めて超えたという状況を考えると、かなり大きい大会になったなという印象です。また、スポンサーのブースがとても多かった印象で、大学はもとより企業からの注目もかなり高い大会という認識です。

私は今回、29(水)〜30(木)に参加させていただきました。一部ですが、簡単にレポートさせていただきます。
主に、金融分野の研究を見てまいりました。

発表の概要

こちらの研究会はありがたいことに 各発表の概要pdfが公開されています 。 以下、著者の敬称略とさせて頂きます。

[2J1-KS-19] 金融分野における大規模言語モデルの活用

資料は公開されているものとされていないものがあるのですが、このセッションでは、東大の和泉研究室を中心に金融分野におけるLLMの適用についての解説になっていました。

興味深かった話としては、

  • 営業員の練習として、LLMを用いた対話のシミュレーションを検討している
  • RAGを社内に実装することを優先している。社内に散らばっている情報をRAGによって拾えるようにする

といった話が、実務上大変興味深かったです。

[2A2-PS-2] 進化する大規模言語モデル

NIIの 相澤先生 から、LLMについての説明がありました。

特に日本語に特化した取り組みである、

の取り組みの話がありました。

また、

  • Token Crisis:良質かつ大量のテキストが必要だが、オープンデータでは枯渇しつつある
  • トークナイザーの性能:言語間で不平等が生じている
  • LLMの出現によって、使用頻度が増えてきた表現がある

などについても触れられていました。

[2O4-OS-25a] 不動産とAI

[2O4-OS-25a-01] 住宅価格予測モデルの経時的な精度の変化分析

〇寺﨑 海翔1、岡本 一志1、柴田 淳司2 (1. 電気通信大学、2. 東京都立産業技術大学院大学)

住宅価格予測モデルの経時的な精度の変化を分析した研究です。新築戸建住宅と賃貸マンションの価格予測において、学習から予測までの期間を設け、その期間の長さと予測精度の関係を明らかにしています。
新規性は、住宅価格予測モデルが時間経過により劣化する様子を定量的に評価した点です。先行研究では、時間経過によるモデルの劣化に焦点を当てた研究は少ないようです。

LIFULL HOME’Sデータセット を用い、学習から予測までの期間を設けることで、時間経過による精度の劣化をMAPE(Mean Absolute Percentage Error)を用いて評価しています。

  • データ:2015年7月〜2017年6月の新築戸建と賃貸マンションのデータ
  • モデル:Ridge回帰、SVR、LightGBM、kNN

学習データ、検証データ、テストデータを時系列に沿って抽出し、期間を設けて各モデルの精度を評価しました。特に、12ヶ月後の予測精度の劣化を分析し、全てのモデルで劣化が見られることを確認しています。

[2O4-OS-25a-02] 地理空間ネットワークデータと機械学習を用いた説明可能性の高い賃料予測

Bramson Aaron1,2、〇三田 匡能1 (1. 株式会社GA technologies、2. Ghent University)

地理空間ネットワークデータを利用した賃料予測モデルの説明可能性の研究です。

既存のヘドニック価格モデルは単純な分析モデルに頼ることが多く、予測精度が低い傾向にあります。
新規性は、LightGBMを使用して、説明変数のみに依存するハイブリッドアプローチを採用している点です。

使用したデータは、

  • 東京の住宅賃料データ(国道16号の内側)
  • 地理空間データと交通ネットワークデータ
  • 上記のデータなどから算出した、地理空間特徴量(駅、店舗、緑地など)のスコア

モデルはLightGBMで、これらの特徴量が予測精度に与える影響を分析しています。

[2O4-OS-25a-03] 機械学習を用いた物件設備スコアの推定:不動産データを使用したケーススタディ

〇宋 宛丘1、尾𥔎 幸謙2、山内 翔大1、三田 匡能1、福中 公輔1 (1. 株式会社GA technologies、2. 筑波大学)

マンション投資物件の設備状況を評価するための機械学習モデルを開発し、評価結果を数値化して再現することが目的です。
専門家の主観的な設備評価を基に採点表を作成し、その採点表を用いて機械学習モデルを訓練しました。

新規性は、専門家の主観的な評価を数値化して機械学習モデルに反映させる点のようです。
また、設備に関するデータが欠測している場合でも高精度な予測を行える点も特徴的です。

データと前処理については、

  • 専門家へのインタビューを通じて作成した設備スコア採点表
  • 販売図面
  • 物件の構造化データ
  • データが欠測している場合の処理方法として、欠測値を「numpy.nan」や「-1」を代入

モデルはLightGBMです。
350件の物件データを用いてモデルを訓練し、交差検証法(LOOCV)を用いてモデルの性能を評価しています。
評価指標としてRMSE(Root Mean Squared Error)や決定係数(R2)を使用し、複数のモデル間で性能を比較しています。
また、欠測データを生成して、欠測比率が予測精度に与える影響も見ています。

[2O4-OS-25a-04] Stable Diffusionによる部屋間取りを保持したホームステージング画像生成

〇服部 翔1、山崎 俊彦2 (1. アットホームラボ株式会社、2. 東京大学)

元々、ホームステージング画像を生成しようとすると、エアコンが消えてしまったり、間取りが変わったりしてしまっていた状況だったようです。

そこで、Stable diffusionに

  • 家具配置LoRA
  • 間取り保持Centrol Net
  • 建具保持Control Net

を準備し、そのような課題の解決を目指しています。

[2I6-GS-10] AI応用:金融

[2I6-GS-10-01] 会社四季報のセンチメントを用いた株式銘柄選定の試み

〇鈴木 雅弘1,2 (1. 日興アセットマネジメント株式会社、2. 東京大学)

会社四季報(日本の上場企業の動向をまとめたデータブック)のテキストデータからセンチメントスコアを算出し、そのスコアを基に株式銘柄を選定する研究です。
大規模言語モデル(LLMs)や金融極性辞書など、複数の手法を用いてセンチメントを計算し、それが株式の超過リターンに与える影響を分析しています。

四季報のテキストデータを用いてセンチメントスコアを算出する先行研究は少ない状況です。
既存のデータセットを学習したモデルやChatGPTを用いた複数のセンチメント算出手法を比較しており、特に小型銘柄に対して、高いセンチメントスコアが高い超過リターンを示すことを明らかにしています。

センチメントスコアの算出方法は、

  • 金融極性辞書: テキストを形態素に分割し、各形態素のスコアを合計
  • chABSAモデル: 特定の語に対するセンチメントをラベル付けしたデータセットを学習
  • 景気ウォッチャー調査モデル: 景気に敏感な人々のアンケートデータを基に5段階の分類タスクを学習。日本語DeBERTaV2、日本語Llama2を使用。テストデータによる評価のみを行うモデルとしてChatGPT、GPT-4を使用
  • ChatGPT: 直接入力テキストに対してセンチメントスコアを出力する方法

センチメントスコアと株式の超過リターンの関係を見るために、四季報の発行日から次の発行日の前日までの各企業のリターンを計算し、センチメントスコアの高低による超過リターンの違いを比較しています。
結果として、センチメントスコアの高い企業は高い超過リターンを示す傾向が確認されました。

[2I6-GS-10-02] 事業セグメント関連語の拡張による金融文書に対するセグメント別センチメント分析の改善

〇平松 賢士1、伊藤 友貴2 (1. 株式会社アイフィスジャパン、2. 三井物産株式会社)

金融文書に対して「ゼロショットで」事業セグメントごとのセンチメント分析を改善するための手法を提案しています。
LLMを用い、有価証券報告書などの文書から事業セグメント関連の語句を抽出し、既存の手法よりも精度の高いセンチメント分析を実現することが目的です。
新規性は、事業セグメント関連語の拡張することで、サービス名や関係会社名など、従来の手法では見逃されがちな情報も抽出可能になったことや、教師なしでの手法を開発し、新規上場企業や組織改組などの変化に柔軟に対応したことです。

  • 事業セグメント関連語の拡張として、有価証券報告書から事業セグメントの説明記載を抽出し、セグメント関連語を用いて文書内の関連文を検索
  • 抽出された段落に含まれる事業セグメント関連語に基づき、ポジティブ、ネガティブ、ニュートラルのセンチメントを付与。

実際のアナリストレポートを用いて提案手法を検証し、提案手法が既存のベースライン手法やGPTモデルを単独で使用した場合よりも高いF1スコアを達成していることに加え、アナリストレポートと決算短信の両方を用いた検証で、関連語の拡張によるセンチメント分析の精度向上を確認しています。

[2I6-GS-10-03] コーポレート・ガバナンスに関する報告書のテキストマイニングによる人的資本情報開示の分析

紙谷 青1、松岡 深雪1、〇中居 拓海1 (1. 大阪市立大学)

コーポレートガバナンス報告書における人的資本管理に関する情報をテキストマイニングによって分析しています。
2023年3月期の財務諸表における人的資本管理情報の開示が義務付けられたことから、ステークホルダーの関心が高まっていることが背景です。
新規性は、年次有価証券報告書ではなく、コーポレートガバナンス報告書からの人的資本情報の分析をした点です。

  • 階層クラスタ分析:KHCoderを使用して、特定のキーワード間の強い関連を調査
  • 共起ネットワークグラフ:形態素解析はMeCabを用い、共起関係を視覚化
[2I6-GS-10-04] 大規模言語モデルを利用したパンデミック期の事業等のリスクの記述分析

〇梅原 武志2,3、武田 英明1,2 (1. 国立情報学研究所、2. 総合研究大学院大学、3. 株式会社日経リサーチ)

日本の上場企業の有価証券報告書における新型コロナウイルス感染症(COVID-19)のパンデミック前後での感染症リスク記述を、LLMを用いて分析する研究です。

新規性は、

  • 有価証券報告書の「事業等のリスク」に関する定性的な記述情報を、LLMを用いて体系的に分析
  • 特に感染症リスクに焦点を当て、パンデミック前後のリスク認識の変化を時系列で可視化
  • 事前のデータラベルのアノテーションやモデルの追加学習を行わず、公開情報のXBRLファイルと学習済みモデルのみを利用している

手法としては、

  • 2016〜2018年度(コロナ前)と2019〜2021年度(コロナ後)の有価証券報告書のXBRLファイルを使用
  • 有価証券報告書の「事業等のリスク」のセクションから、「可能性があります」を含む記述を抽出
  • 金融BERT(東大和泉研)の学習済モデルを用いて分散表現を作成し、K-means法でクラスタリング
  • Sentence BERTを用いてリスク記述文を再度分散表現化
  • PacMAPを用いて2次元空間上に次元縮約し、コロナ前後のデータ構造の差異を可視化

のプロセスで実施しています。

感染症リスクの記述件数を年度別に集計し、パンデミック前後での変化を確認したことや、次元縮約後のデータをプロットし、コロナ前後の記述内容の変化を視覚的に分析しています。

[2I6-GS-10-05] Graph Based Entropyと領域間相互作用を用いた株式市場の異常検知

〇中田 喜之1、吉野 貴晶1、杉江 利章1、夷藤 翔1、関口 海良2、劉 乃嘉2、大澤 幸生2 (1. ニッセイアセットマネジメント株式会社、2. 東京大学)

株式市場における異常検出を目的とし、Graph Based Entropyと領域間相互作用を使用してリスク指標を計算する方法の研究です。
長期的なビジネスサイクルに関連する株式の売却に偏りがあることを定量化し、これを基にリスク指標を導出ししていることに特徴があります。
TOPIX 500、S&P 500、STOXX Europe 600という3つの株価指数を対象に、既存のリスク指標(ボラティリティ、流動性、相関性)と比較したところ、既存の指標では捉えられないリスクを検出できる可能性が示されています。特に、下方リスクを抽出できているようです。

  • ランダム行列理論とLouvain法を用いて、強い関係を持つ株式群を抽出
  • 構成銘柄を領域分けする
  • 上記2点から、領域間相互作用を計算
  • 上記を週次ごとに計算し、その性質を評価

[3Xin2] ポスターセッション1

[3Xin2-83] LLM-Traders : 大規模言語モデルを用いた金融時系列予測

伊藤 克哉1、〇中川 慧2 (1.三井物産株式会社、2.野村アセットマネジメント株式会社)

金融時系列の分析にLLMを使用する新しいアプローチの研究です。
ノイズの多いデータ、複雑かつ多様なモデル、そして常に変化する市場動向という3つの主要な課題に対処するために、LLMのファインチューニングとプロンプトエンジニアリングを組み合わせた方法を提案しています。

手法として、

  • 時系列データを用いた教師ありfine-tuning:時系列データを文字列データに加工して、few-shot学習を行う
  • 遺伝的アルゴリズムを用いて、ランダムにプロンプトを生成する。良いパフォーマンスだったプロンプトを生存させ、良いプロンプト同士を交雑させつつ、ランダムにプロンプトを発生させ続ける
  • 動的アンサンブル法: 複数のプロンプト応答を組み合わせることで、分析の精度と適応性を向上

データはKaggleの「JPX Tokyo Stock Exchange Prediction」コンペティションのデータです。
LLM-Tradersは他のモデル(例えば、Lasso、LightGBM、RandomForest)と比較して優れたパフォーマンスを示し、特にAccuracy(ACC)やCorrelation(CORR)などの指標で高い評価になったようです。

[3Xin2-36] 大規模言語モデルの金融投資意思決定バイアスに関する評価指標の構築

〇立花 竜一1、中川 慧2、伊藤 友貴3、高野 海斗2 (1.三井情報株式会社、2.野村アセットマネジメント株式会社、3.三井物産株式会社)

LLMが金融教育支援サービスにおいて、投資助言におけるバイアスを持つ可能性を評価するための指標を開発が目的です。
行動経済学の概念を用いて、リスク選好、時間選好、社会的選好に基づいたバイアス評価手法を提案し、実際にGPT-3.5およびPaLM2といったLLMを対象に評価を行っています。

  • 評価メトリクスの開発: リスク選好、時間選好、社会的選好に基づいてLLMのバイアスを評価するメトリクスを開発
  • プロンプト設計: プロフィール情報(年齢、国籍、性別)と選好質問を組み合わせたプロンプトをLLMに入力し、出力を分析
  • 統計分析: 出力結果を統計的に分析することで、LLMが持つバイアスの存在を定量化

GPT-3.5とPaLM2に対して、提案した評価手法を適用し、各種選好(リスク、時間、社会)に基づく出力結果を分析しています。
具体的な質問リストを用い、年齢、国籍、性別ごとに出力結果を比較・統計分析し、各LLMのバイアスの傾向を評価しています。

[3Xin2-68] 衛星画像による雲量を用いた電力需要予測の基礎検討

〇新沢 陸1、浦野 昌一1 (1.明治大学)

衛星画像を用いて電力需要予測を行うための基礎研究です。
衛星画像から雲量データを計算し、電力需要予測の特徴量として使用することで、予測の精度向上と衛星画像の有効性を確認することを目的としています。

従来の電力需要予測は、主に気象データや過去の需要データに依存していましたが、衛星画像という新しいデータソースを取り入れることで、予測精度の向上を図っています。
また、雲量データを具体的に利用することで、天候の変動が電力需要に与える影響をより詳細に把握しようとしています。

衛星画像から計算した雲量データを実際の電力需要予測に適用し、その予測精度を評価しています。

[3A4-PS-3] AIは『鉄腕アトム』の夢をみるか?~生成AIによるコンテンツ制作の可能性と問題

手塚 眞1 (1. 有限会社ネオンテトラ)

NEDOの研究として、慶應大学の栗原教授と共同で プロジェクトを行っている (TEZUKA2020, TEZUKA2023)。

  • 現状のAIの力に限界があることを理解しつつも、積極的に活用しているようでした。粘り強く取り組まれている印象でした。
  • 「AIでは手塚治虫のような作品は作れない」という話に対し「人間でも無理ではないですか?」という質問があったのが印象的でした。

→ ある程度平均的な作品と、将来にインパクトを与える高度なクリエイティブを分けて考える必要があるとの主張でした。

[3D5-GS-2] 機械学習:時系列

[3D5-GS-2-04] 階層型ネットワークの階層構造推定と異常検知への応用 金融時系列データの階層構造分析より金融市場異常検知とその原因分析

〇劉 乃嘉1、大澤 幸生1、関口 海良1、吉野 貴晶2、杉江 利章2、中田 喜之2、夷藤 翔2 (1. 東京大学、2. ニッセイアセットマネジメント株式会社)

金融市場の異常検知に階層型ネットワークモデルを適用する手法を提案です。
確率的ブロックモデル(SBM)を拡張して、階層型確率的ブロックモデル(HSBM)を構築し、市場構造の変化を検出することを目指しています。これにより、リーマンショックやコロナショックのような大規模な市場変動前の構造変化を早期に検出することが可能となります。

既存のLouvain法や単層のSBMに対して、階層型モデルを導入することで、より詳細かつ早期に市場構造の変化を検出できる点が新規性となります。

研究のポイント:

  • 階層型確率的ブロックモデル(HSBM)の構築: 既存のSBMを拡張し、複数の階層を持つモデルを構築
  • 階層構造推定: 下層のブロックを上層のノードと見なし、層ごとの隣接行列を用いて階層構造を推定
  • 異常検知: 構造変化を検出し、その変化の原因を階層構造を通じて分析

S&P100の株式インデックスを対象に、リーマンショック(2008年)とコロナショック(2020年)の前後の構造変化を分析し、Louvain法およびSBMと比較して、HSBMがより早期かつ明確に構造変化を検出できることを示しました。

[3D5-GS-2-05] 主成分等価法による残差リターン抽出

〇今城 健太郎1、中川 慧2、的矢 知樹1、平野 正徳1、青木 雅奈2、今長谷 拓2 (1. 株式会社Preferred Networks、2. 野村アセットマネジメント株式会社)

金融資産リターンの共通ファクターに含まれない残差リターンを抽出する新しい手法の提案です。
この手法は主成分分析(PCA)に基づいており、従来のPCAが持つ問題点を解決するために、リターンを2つのグループに分けて解析します。

従来のPCAは共通ファクターの数を事前に決める必要があり、ファクターの数を多くするとノイズも増えるという問題がありました。
提案手法は、リターンを2つのグループに分け、一方から主成分を抽出し、もう一方から固有値を推定することで、安定的に良質な残差リターンを抽出できるようです。

手法:

  • リターンをランダムに2つのグループに分ける
  • 一方のグループから主成分を抽出し、もう一方のグループから固有値を推定
  • 変換行列を作成し、残差リターンを抽出
  • 複数回の試行で得られる変換行列の平均を使用

人工データおよび実際の市場データを用い検証した結果、

  • 人工データでは、PCA法と比較して固有値の推定がより正確
  • 実データを用いた検証では、提案手法が従来のPCA法よりも良質な残差リターンを抽出可能

という結果になったようです。

雑感

上記で書かせていただいたもの以外にも、大変高名な先生の基調講演があったり、ポスターセッションも素晴らしい発表ばかりでした。
夜は懇親会等にも顔を出させて頂きまして、大変勉強になりました。

企業のスポンサーも多く、webを見ますと96の組織が出展したようでした。企業側の注目度も高い大会だったように思います。