三菱電機グループの研究員の論文3件がNeurIPS2024にて採択

　三菱電機株式会社は、当社開発本部情報技術総合研究所（神奈川県鎌倉市）および米国の現地法人であるMitsubishi Electric Research Laboratories（米国マサチューセッツ州、以下、MERL）の研究員の論文3件が、NeurIPS2024にて採択されましたのでお知らせします。また、本カンファレンスにて1件のワークショップをMERLが主催します。

　NeurIPS（Neural Information Processing Systems）は、AIと機械学習分野で世界最高峰の国際カンファレンスであり、2024年は1万5千件を超える投稿の中から約25％の論文が採択されています。各成果の詳細は、カナダのバンクーバーで12月10日から15日まで開催される同カンファレンスのセッションで発表する予定です。

　当社グループは、今後も持続可能な未来への貢献を目指し、先端技術の研究開発に取り組んでまいります。

■「NeurIPS」採択論文3件とMERL主催ワークショップ1件の概要

＜2024年当社グループのNeurIPS採択論文のタイトル・著者・概要・掲載リンク一覧＞

○タイトル RETR: Multi-View Radar Detection Transformer for Indoor Perception （RETR：レーダーによる屋内パーセプションのための物体検出トランスフォーマー） ○著者谷髙竜馬（三菱電機）、Adriano Cardace（Bologna University）、Pu （Perry） Wang（MERL）、Petros Boufounos（MERL）、髙橋龍平（三菱電機）
○概要レーダーによる屋内パーセプション（※1）は、プライバシーの保護や、火災などの危険な状況下において高い信頼性を持つことから、室内の見守りや監視などにおいて関心が高まる一方で、分解能が低いため高精度に予測することが困難でした。本論文では、レーダーパーセプションの高精度化のためのRadar Detection Transformer（RETR）（※2）を提案しています。RETRは近年の物体検出技術であるDetection Transformer（DETR）をベースとして、複数のレーダーを統合するための特徴相関や、レーダーとカメラ間の座標変換を事前知識とした学習を組み込むことで、従来を大幅に上回る最高水準の精度を示しました。 ○掲載リンク NeurIPS Paper RETR: Multi-View Radar Detection Transformer for Indoor Perception (neurips.cc)

○タイトル

RETR: Multi-View Radar Detection Transformer for Indoor Perception

（RETR：レーダーによる屋内パーセプションのための物体検出トランスフォーマー）

○著者

谷髙竜馬（三菱電機）、Adriano Cardace（Bologna University）、Pu （Perry） Wang（MERL）、Petros Boufounos（MERL）、髙橋龍平（三菱電機）

○概要

レーダーによる屋内パーセプション（※1）は、プライバシーの保護や、火災などの危険な状況下において高い信頼性を持つことから、室内の見守りや監視などにおいて関心が高まる一方で、分解能が低いため高精度に予測することが困難でした。本論文では、レーダーパーセプションの高精度化のためのRadar Detection Transformer（RETR）（※2）を提案しています。RETRは近年の物体検出技術であるDetection Transformer（DETR）をベースとして、複数のレーダーを統合するための特徴相関や、レーダーとカメラ間の座標変換を事前知識とした学習を組み込むことで、従来を大幅に上回る最高水準の精度を示しました。

○掲載リンク

NeurIPS Paper RETR: Multi-View Radar Detection Transformer for Indoor Perception (neurips.cc)

○タイトル Learning to compute Gröbner bases （グレブナー基底計算の学習） ○著者計良宥志（千葉大学）、石原侑樹（日本大学）、神戸祐太（三菱電機）、Tristan Vaccon（University of Limoges）、横山和弘（立教大学）
○概要近年、機械学習モデルに数学問題を学習させることで、高速に解答を求めることが可能となった事例が報告されています。本論文では、グレブナー基底（※3）計算問題と呼ばれるさまざまな分野への応用が可能な数学問題について、世界で初めて（※4）問題から解を与えるモデルの学習を行い、既存手法より高速に計算できる事例を発見しました。 ○掲載リンク NeurIPS Paper Learning to compute Gröbner bases (neurips.cc)

○タイトル

Learning to compute Gröbner bases

（グレブナー基底計算の学習）

○著者

計良宥志（千葉大学）、石原侑樹（日本大学）、神戸祐太（三菱電機）、Tristan Vaccon（University of Limoges）、横山和弘（立教大学）

○概要

近年、機械学習モデルに数学問題を学習させることで、高速に解答を求めることが可能となった事例が報告されています。本論文では、グレブナー基底（※3）計算問題と呼ばれるさまざまな分野への応用が可能な数学問題について、世界で初めて（※4）問題から解を与えるモデルの学習を行い、既存手法より高速に計算できる事例を発見しました。

○掲載リンク

NeurIPS Paper Learning to compute Gröbner bases (neurips.cc)

○タイトル Evaluating Large Vision-and-Language Models on Children’s Mathematical Olympiads （大規模視覚言語モデルを子供向け国際数学コンテストの問題で評価） ○著者 Anoop Cherian（MERL）、Kuan-Chuan Peng（MERL）、Suhas Lohit（MERL）、Joanna Matthiesen（Math Kangaroo USA）、Kevin Smith（Massachusetts Institute of Technology）、Joshua B. Tenenbaum（Massachusetts Institute of Technology）
○概要近年、大規模視覚言語モデル（LVLM）（※5）の汎用的な問題解決能力には顕著な進展が見られますが、現在の科学文献には、視覚情報と言語情報を統合的に処理するAIの能力に関する体系的な分析が欠けています。本論文では、この相関関係を分析するため、米国の1年生から12年生を対象とした国際的な数学コンテストの問題を使用してLVLMを評価しました。その結果、LVLMは高学年向けの問題では比較的高い性能を示しましたが、低学年向けの問題には苦戦することが分かりました。これにより、LVLMと子供では異なる推論能力を持つこと、そしてLVLMは全ての学年で子供の平均正答率を下回ることが明らかになり、その限界が示されました。 ○掲載リンク NeurIPS Paper Evaluating Large Vision-and-Language Models on Children’s Mathematical Olympiads (neurips.cc)

○タイトル

Evaluating Large Vision-and-Language Models on Children’s Mathematical Olympiads

（大規模視覚言語モデルを子供向け国際数学コンテストの問題で評価）

○著者

Anoop Cherian（MERL）、Kuan-Chuan Peng（MERL）、Suhas Lohit（MERL）、Joanna Matthiesen（Math Kangaroo USA）、Kevin Smith（Massachusetts Institute of Technology）、Joshua B. Tenenbaum（Massachusetts Institute of Technology）

○概要

近年、大規模視覚言語モデル（LVLM）（※5）の汎用的な問題解決能力には顕著な進展が見られますが、現在の科学文献には、視覚情報と言語情報を統合的に処理するAIの能力に関する体系的な分析が欠けています。本論文では、この相関関係を分析するため、米国の1年生から12年生を対象とした国際的な数学コンテストの問題を使用してLVLMを評価しました。その結果、LVLMは高学年向けの問題では比較的高い性能を示しましたが、低学年向けの問題には苦戦することが分かりました。これにより、LVLMと子供では異なる推論能力を持つこと、そしてLVLMは全ての学年で子供の平均正答率を下回ることが明らかになり、その限界が示されました。

○掲載リンク

NeurIPS Paper Evaluating Large Vision-and-Language Models on Children’s Mathematical Olympiads (neurips.cc)

＜2024年 MERL主催のNeurIPSワークショップ＞

○タイトル Multimodal Algorithmic Reasoning (MAR) Workshop （マルチモーダルアルゴリズム推論ワークショップ） ○開催者 Anoop Cherian（MERL）、Kuan-Chuan Peng（MERL）、Suhas Lohit（MERL）、Honglu Zhou （Salesforce AI Research）、Kevin Smith（Massachusetts Institute of Technology）、Tim K. Marks（MERL）、Juan Carlos Niebles（Salesforce AI Research）、Petar Veličković（Google DeepMind）
○概要本ワークショップでは、ニューラルアルゴリズム学習（※6）やマルチモーダル推論（※7）、知能の認知モデルに取り組む第一線の研究者を集めて、最先端の研究と最新の課題を議論します。汎用人工知能の実現に向け、AIにおいてこれまでに達成した成果や人間の思考とのギャップを理解するための講演が行われます。〇掲載リンク NeurIPS Workshop – Multimodal Algorithmic Reasoning (MAR)

○タイトル

Multimodal Algorithmic Reasoning (MAR) Workshop

（マルチモーダルアルゴリズム推論ワークショップ）

○開催者

Anoop Cherian（MERL）、Kuan-Chuan Peng（MERL）、Suhas Lohit（MERL）、Honglu Zhou （Salesforce AI Research）、Kevin Smith（Massachusetts Institute of Technology）、Tim K. Marks（MERL）、Juan Carlos Niebles（Salesforce AI Research）、Petar Veličković（Google DeepMind）

○概要

本ワークショップでは、ニューラルアルゴリズム学習（※6）やマルチモーダル推論（※7）、知能の認知モデルに取り組む第一線の研究者を集めて、最先端の研究と最新の課題を議論します。汎用人工知能の実現に向け、AIにおいてこれまでに達成した成果や人間の思考とのギャップを理解するための講演が行われます。

〇掲載リンク

NeurIPS Workshop – Multimodal Algorithmic Reasoning (MAR)

■参考情報

　同カンファレンスのワークショップ（於：カナダ）で、当社グループは9件の論文を発表します。

＜2024年ワークショップに採択された当社グループの論文のタイトル・著者一覧＞

○タイトル Probabilistic Forecasting for Building Energy Systems: Are Time-Series Foundation Models The Answer? ○著者 Young-Jin Park（Massachusetts Institute of Technology）、Jing Liu（MERL）、François G Germain（MERL）、Ye Wang（MERL）、Toshiaki Koike-Akino（MERL）、Gordon Wichern（MERL）、Navid Azizan（Massachusetts Institute of Technology）、Christopher R. Laughman（MERL）、Ankush Chakrabarty（MERL）
○タイトル Forget to Flourish: Leveraging Model-Unlearning on Pretrained Language Models for Privacy Leakage ○著者 Md Rafi Ur Rashid（Penn State University）、Jing Liu （MERL）、Toshiaki Koike-Akino（MERL）、Shagufta Mehnaz（Penn State University）、Ye Wang（MERL）
○タイトル Spatially-Aware Losses for Enhanced Neural Acoustic Fields ○著者 Christopher Ick（New York University）、Gordon Wichern（MERL）、Yoshiki Masuyama（MERL）、François G Germain（MERL）、Jonathan Le Roux（MERL）
○タイトル FV-NeRV: Neural Compression for Free Viewpoint Videos ○著者加藤空知（大阪大学）、藤橋卓也（大阪大学）、Toshiaki Koike-Akino（MERL）、渡邊尚（大阪大学）
○タイトル GPT Sonography: Hand Gesture Decoding from Forearm Ultrasound Images via VLM ○著者 Keshav Bimbraw（Worcester Polytechnic Institute）、Ye Wang（MERL）、Jing Liu（MERL）、 Toshiaki Koike-Akino（MERL）
○タイトル Smoothed Embeddings for Robust Language Models ○著者長谷亮（三菱電機）、Md Rafi Ur Rashid（Penn State University）、Ashley Lewis（The Ohio State University）、Jing Liu（MERL）、Toshiaki Koike-Akino（MERL）、Kieran Parsons（MERL）、 Ye Wang（MERL）
○タイトル Slaying the HyDRA: Parameter-Efficient Hyper Networks with Low-Displacement Rank Adaptation ○著者 Xiangyu Chen（University of Kansas）、Ye Wang（MERL）、Matthew Brand（MERL）、Pu （Perry） Wang （MERL）、Jing Liu（MERL）、Toshiaki Koike-Akino（MERL）
○タイトル Preference-based Multi-Objective Bayesian Optimization with Gradients ○著者 Joshua Hang Sai Ip（University of California Berkeley）、Ankush Chakrabarty（MERL）、Ali Mesbah（University of California Berkeley）、Diego Romeres（MERL）
○タイトル TR-BEACON: Shedding Light on Efficient Behavior Discovery in High-Dimensions with Trust-Region-based Bayesian Novelty Search ○著者 Wei-Ting Tang（The Ohio State University）、Ankush Chakrabarty（MERL）、Joel A. Paulson（The Ohio State University）

○タイトル

Probabilistic Forecasting for Building Energy Systems: Are Time-Series Foundation Models The Answer?

○著者

Young-Jin Park（Massachusetts Institute of Technology）、Jing Liu（MERL）、François G Germain（MERL）、Ye Wang（MERL）、Toshiaki Koike-Akino（MERL）、Gordon Wichern（MERL）、Navid Azizan（Massachusetts Institute of Technology）、Christopher R. Laughman（MERL）、Ankush Chakrabarty（MERL）

○タイトル

Forget to Flourish: Leveraging Model-Unlearning on Pretrained Language Models for Privacy Leakage

○著者

Md Rafi Ur Rashid（Penn State University）、Jing Liu （MERL）、Toshiaki Koike-Akino（MERL）、Shagufta Mehnaz（Penn State University）、Ye Wang（MERL）

○タイトル

Spatially-Aware Losses for Enhanced Neural Acoustic Fields

○著者

Christopher Ick（New York University）、Gordon Wichern（MERL）、Yoshiki Masuyama（MERL）、François G Germain（MERL）、Jonathan Le Roux（MERL）

○タイトル

FV-NeRV: Neural Compression for Free Viewpoint Videos

○著者

加藤空知（大阪大学）、藤橋卓也（大阪大学）、Toshiaki Koike-Akino（MERL）、渡邊尚（大阪大学）

○タイトル

GPT Sonography: Hand Gesture Decoding from Forearm Ultrasound Images via VLM

○著者

Keshav Bimbraw（Worcester Polytechnic Institute）、Ye Wang（MERL）、Jing Liu（MERL）、 Toshiaki Koike-Akino（MERL）

○タイトル

Smoothed Embeddings for Robust Language Models

○著者

長谷亮（三菱電機）、Md Rafi Ur Rashid（Penn State University）、Ashley Lewis（The Ohio State University）、Jing Liu（MERL）、Toshiaki Koike-Akino（MERL）、Kieran Parsons（MERL）、 Ye Wang（MERL）

○タイトル

Slaying the HyDRA: Parameter-Efficient Hyper Networks with Low-Displacement Rank Adaptation

○著者

Xiangyu Chen（University of Kansas）、Ye Wang（MERL）、Matthew Brand（MERL）、Pu （Perry） Wang （MERL）、Jing Liu（MERL）、Toshiaki Koike-Akino（MERL）

○タイトル

Preference-based Multi-Objective Bayesian Optimization with Gradients

○著者

Joshua Hang Sai Ip（University of California Berkeley）、Ankush Chakrabarty（MERL）、Ali Mesbah（University of California Berkeley）、Diego Romeres（MERL）

○タイトル

TR-BEACON: Shedding Light on Efficient Behavior Discovery in High-Dimensions with Trust-Region-based Bayesian Novelty Search

○著者

Wei-Ting Tang（The Ohio State University）、Ankush Chakrabarty（MERL）、Joel A. Paulson（The Ohio State University）

■三菱電機グループについて

　私たち三菱電機グループは、たゆまぬ技術革新と限りない創造力により、活力とゆとりある社会の実現に貢献します。社会・環境を豊かにしながら事業を発展させる「トレード・オン」の活動を加速させ、サステナビリティを実現します。また、デジタル基盤「Serendie」を活用し、お客様から得られたデータをデジタル空間に集約・分析するとともに、グループ内が強くつながり知恵を出し合うことで、新たな価値を生み出し社会課題の解決に貢献する「循環型デジタル・エンジニアリング」を推進しています。1921年の創業以来、100年を超える歴史を有し、社会システム、電力システム、防衛・宇宙システム、FAシステム、自動車機器、ビルシステム、空調・家電、情報システム・サービス、半導体・デバイスといった事業を展開しています。世界に200以上のグループ会社と約15万人の従業員を擁し、2023年度の連結売上高は5兆2,579億円でした。詳細は、www.MitsubishiElectric.co.jpをご覧ください。

※1　レーダーを用いて周囲の環境や物体を検知・認識する技術。レーダーは電波を使って物体の位置や速度、形状などを測定できるため、視界が悪い状況や暗闇でも高い信頼性を持つ

※2　レーダーデータを用いた物体検出のための深層学習モデル

※3　多項式環における特定の多項式の組み合わせで、与えられた多項式集合の代数的性質の解析が可能

※4　2024年12月3日時点、当社調べ

※5　画像や映像などの視覚情報とテキスト（言語）情報を統合的に処理し、理解することで、多様なタスクをこなす生成AIモデル

※6　人間の脳内の神経細胞である「ニューロン」が互いにつながり、情報をやり取りしているかのような、人間の脳の仕組みを模したアルゴリズムであるニューラルネットワークを用いて、特定のタスクを学習し、実行するための手法や手順

※7　異なる種類のデータを統合して推論を行う技術や手法

＜お客様からのお問い合わせ先＞

三菱電機株式会社　情報技術総合研究所

〒247-8501 神奈川県鎌倉市大船五丁目1番1号

https://www.MitsubishiElectric.co.jp/corporate/randd/inquiry/index_it.html

Mitsubishi Electric Research Laboratories

201 Broadway, 8th Floor, Cambridge, MA 02139-1955 U. S. A

FAX +1-617-621-7550

https://www.merl.com/contact

Views