生き生きとしたデジタルヒューマンがリアルタイムで観客と交流。自律システムが複雑なロジスティクスを効率化。そして、AI を活用した言語ツールがコミュニケーションの障壁を即座に打ち破る……。
これは SF ではありません。これが日本のスタートアップシーンです。
AI と世界クラスの学術力および産業力によって活気づけられたこの場所は、世界的なイノベーションのハブとなっています。そして、NVIDIA Inception(https://www.nvidia.com/ja-jp/startups/)プログラムはまさにその中心にあります。
プログラムには 370 社を超える AI ドリブンのスタートアップが参画しています。また、国内では25万人もの開発者がNVIDIAのテクノロジを活用しており、これらのコミュニティを含む日本の AI スタートアップ エコシステムは、大胆であると同時に動きが速いのが特徴です。
今週開催の NVIDIA AI Summit Japan では、これらの成果にスポットライトを当て、この地域の絶え間ないイノベーションの勢いを捉えています。
NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) と、ソフトバンクグループ株式会社 代表取締役 会長兼社長執行役員である孫 正義 氏が、ファイヤーサイド チャットで NVIDIA AI Summit Japan のオープニングを飾りました。冒頭、フアンが成長を続ける日本の AI エコシステムやソブリン AI への取り組みなど、日本のAI の展望について語りました。
セッションには、経済産業省(METI)や東京大学をはじめとする主要機関のリーダーが登壇しました。このイベントの盛り上がりは偶然ではありません。
主要な学術拠点、世界的なテクノロジおよび産業をけん引する大企業、そして新たなテクノロジや流行に敏感な1,400万人の人口を擁する東京が今、グローバルAIハブの基盤となっているのです。
日本のクリエイティブ シーンを活性化
アニメからマンガまで、象徴的な作品は日本のエンターテインメントを再定義しただけでなく、世界の文化に刻み込まれ、大陸、言語、世代を超えてファンを刺激してきました。
現在、日本の活気に満ちたビジュアル ポップ カルチャーが AI に浸透し、観客を驚かせ、観客とつながるための新しい方法を見つけています。
例えば、AiHUB(https://aihub.co.jp/)のデジタル セレブリティ、Sali (サリ)。
Sali は、従来の意味での単なるキャラクターではありません。高い存在感を放つ、デジタル ヒューマンです。生き生きと人と対話し、ある意味ではほぼ人間です。彼女はまばたきをし、微笑み、反応します。
この裏では、AI が静かに変革的なことを行っており、人知れず、人々がメディアと関わる方法を再定義しています。
AI Summit において、AiHUB は同社のデジタル ヒューマン フレームワークのリップシンク モジュールに NVIDIA Avatar Cloud Engine(https://developer.nvidia.com/ace)(ACE) を採用し、Sali に細やかな表現と感情の深みを与えることを発表しました。
ACE は Sali を親しみやすい存在にするだけでなく、画面やページを超越するキャラクターにさせています。
この統合により、開発コストと将来の管理コストが約 50% 削減され、アバターの表現力が向上しました。
動画: sali a2f demo(https://youtu.be/-RQwT8EH7NU)
SDK の採用: ためらいから高速化へ
世界的な技術競争において、成功は必ずしも期待通りのヒーローの活躍にかかっているわけではありません。
AIでの目立たない主役は SDK です。これは、イノベーションにおいて推測という障壁を排除するツール、ライブラリ、ドキュメント群です。そして、急速に進化する日本の AI エコシステムでは、かつては見過ごされていたこれらのソフトウェア開発ツールキットが、大変革を推進しています。
長年、日本のテクノロジ企業は SDK を慎重に扱ってきました。しかし、AI が光速で進歩し、NVIDIA GPU がそのエンジンとして駆動するようになった今、SDK は舞台裏の片隅からステージの中心へと躍り出ました。
例えば、NVIDIA の大規模言語モデル (LLM) 構築プラットフォームである NVIDIA NeMo(https://www.nvidia.com/ja-jp/ai-data-science/products/nemo/)は、リアルタイムで動作する、日本の最新のAI コミュニケーション テクノロジの波を支えるプラットフォームとして急速に定着しつつあります。
最前線に立つ企業のひとつが Kotoba Technologies(https://www.kotoba.tech/)です。同社は NeMo の強力なツールを活用し、リアルタイム音声認識技術を進化させています。
日本政府の生成AI開発力強化プロジェクトの支援対象である Kotoba Technologies の言語ツールは、音声を認識するだけでなく、それをリアルタイムで翻訳します。これは、日本のような非英語圏の国々で人の多言語コミュニケーションを再定義する、計算力と人間の創意工夫の融合です。
同社のツールはさまざまな業界でカスタマー コール センターや会議議事録の自動作成にすでに活用されています。また、NVIDIA AI Summit Japan におけるジェンスン フアンと孫正義氏の対談のライブ文字起こしにも使われました。
そして、LLM が日本の AI を動かすエンジンであるならば、APTO(https://apto.co.jp/)のような企業がそこに燃料を供給しています。
APTO(https://apto.co.jp/)は、あらゆる人が生活/仕事の質を高めることができるように、データにフォーカスして、生成 AI の精度向上に注力しています。2024 年秋頃より、NVIDIA の NeMo Curator を使用して、ベンチマークの作成、および日本語をはじめとしたInstruction Data の作成、さらに Human-in-the-loop を基本とした Instruction Data の評価まで、包括的に LLM の精度向上に着手しています。
現在、APTO は株式会社 RICOH、理化学研究所、ORIX 株式会社など、大手クライアントと様々なデータの品質改善に取り組んでいます。SDK を活用し、特に Word Count Filter (短い文や不自然な文を省く独創的なメカニズム) など、LLM のデータ作成においては、品質とそのパフォーマンスを大幅に向上させています。直近では、APTO が作成した Instruction Data を使用したことで、LLM の精度が向上し、トレーニング時間が約 20% 短縮されたという企業からの報告もあります。
日本各地で、開発者は AI を迅速に導入しようとしており、より速く、より進化するために SDK を採用しているのです。
業界間の相乗効果の力
NVIDIA テクノロジを搭載したインフラストラクチャにより、スタートアップ企業が互いのブレークスルーを基盤として構築できるようになり、日本の AI エコシステムの歯車がますます同期しながら動き出しています。
日本の人口が高齢化するにつれ、こうしたソリューションはセキュリティのニーズだけでなく、深刻化する労働力不足にも対処します。ugo(https://ugo.plus/)と Asilla(https://jp.asilla.com/)は、全国の施設を管理するために自律型セキュリティ システムの開発を通じてこの課題に取り組んでいます。
Asilla の最先端の異常検出ソフトウェアはセキュリティを念頭に置いて開発されましたが、現在では医療や小売業といった分野でも活用されています。NVIDIA DeepStream(https://developer.nvidia.com/deepstream-sdk)および Triton Inference Server SDK(https://developer.nvidia.com/triton-inference-server)を用いて構築された Asilla のテクノロジは、リスクを特定するだけでなく、リスクに対応します。
リスクの高い環境で、NVIDIA Jetson(https://www.nvidia.com/ja-jp/autonomous-machines/embedded-systems/)プラットフォームを搭載した ugo と Asilla のシステムがすでに稼働しており、通常とは異なる行動を検知してリアルタイムの対応を促すことができます。
動画: Easy! Operation DX(https://www.youtube.com/watch?v=DHmeySx9IoY)
NVIDIA のインフラストラクチャは、Kotoba Technologies の言語ツールや AiHUB のリアルなデジタル アバターの中核でもあります。AI バックボーン上で実行されるこれらのさまざまなツールは、メディア、コミュニケーション、そして人間の交流をシームレスに橋渡しします。
東大 IPC と大阪イノベーション ハブ(OIH)
これらのスタートアップはすべて、AI 大国としての日本の台頭を加速させる、より大きなエコシステムの一部です。
先頭に立っているのは、東京大学の 100 パーセント子会社として設立された投資事業会社、東京大学協創プラットフォーム開発株式会社(東大IPC)が運営するフラッグシップアクセラレータープログラム「1stRound」です。
17 大学及び4国立研究機関が共催し、国内アカデミアのイノベーションエコシステムの拡大を目指す同プログラムは、アカデミアと産業が交差する場として機能し、実践的な、リソース、戦略的支援を提供しています。シードステージのディープテックの社会実装を促進することで、日本の AI イノベーション分野を活性化させ、他の企業が追随する模範を示しています。
一方、大阪のイノベーション ハブである OIH は、この勢いを東京以外にも広げ、スタートアップ企業にコワーキング スペースやネットワーキング イベントを提供しています。OIH のStartup Acceleration Program (OSAP) は、初期段階のプロジェクトをより早く市場に投入します。
このような動きの速いハブは日本の AI エコシステムの中核であり、スタートアップ企業に、プロトタイプから完全に商品化された製品へと移行するために必要な指導、資金、リソースを提供します。
そして、日本のスタートアップは NVIDIA のアクセラレーテッド コンピューティング テクノロジと Inception プログラムを通じて、世界中の AI イノベーターと結びついています。
トップの画像提供:ugo
NVIDIAについて
1993年の創業以来、NVIDIA(https://www.nvidia.com/ja-jp/) (NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/