
韓国のAI専門「ACRYL」が開発した医療特化型ファウンデーションモデル「ALLM.H」がこのほど、韓国医師国家試験(KMLE)の過去問に基づく医療AI評価ベンチマーク「KorMedMCQA Doctor Test」で96.78%の正答率を記録し、現存する最高性能(SOTA)を達成した。同社が15日に明らかにした。
メガ・ニュース(MEGA News)のパン・ウンジュ記者の取材によると、これはAnthropicの「Claude Opus4(96.55%)」、OpenAIの「GPT-5.1(90.11%)」、Google Gemini 2.5 Pro(90.8%)をすべて上回る水準という。
オープンソース医療AI分野でも、今回の結果は注目に値する。「ALLM.H」は、ソウル大学病院が開発したオープンソース医療モデル「HARI(89.2%)」を7.58ポイント上回ったと同社は明らかにした。特に、K-Med.aiが実際のKMLEで達成した96.4%に匹敵する水準の性能を、72B(パラメータ数720億個)以上の超大型モデルではなく、31B規模の軽量オープンソースモデルで実現した。モデル規模を拡大する方式ではなく、高品質なデータ構成と精緻な学習・推論パイプライン設計を通じて、特化分野での性能を引き上げたのである。
また「ALLM.H」は、ACRYLが独自に開発した産業特化型ファウンデーションモデル「ファミリーALLM(Acryl LLM)」の最初の成果物でもあり、医療・ヘルスケア分野に特化して開発された。
「ALLM.H」は、Googleの最新オープンソースモデル「Gemma 4(31B)」を基盤に、韓国国内で初めてファインチューニングを経て開発された。2022年から2024年までのKMLE公式過去問435問で構成されたKorMedMCQA Doctor Testで最高水準の性能を出した背景には、ACRYLが保有するデータ精製能力とドメイン特化型学習設計能力がある。ACRYLは「今回の成果を通じて、韓国国内の特化型ファウンデーションモデルが海外ビッグテックの大型商用モデルとも十分に競争できることを立証した」と強調した。
ACRYLは「ALLM.H」を単一モデルにとどめず、診療科別の特性を反映した「ファミリー」構造へと拡張していく計画だ。ALLM.Hをアンカーモデルとし、各専門診療科に最適化されたAIエコシステムを構築し、後続モデルの性能とベンチマーク結果も順次公開する予定である。これを通じて、実際の医療現場で活用可能な専門医療AI体系を段階的に高度化していく方針だ。
「ALLM.H」と「ALLM.Hファミリー」モデルは現在、ACRYLが遂行中の保健福祉省・科学技術情報通信省主管の「Doctor Answer 3.0」および「K-ARPA」事業を基盤として、韓国国内の大規模病院で実証に入る。延世医療院、慶北大学病院などの協力病院を中心に、医療従事者の臨床意思決定支援、医療データ分析、専門診療科相談補助などに活用し、オンプレミス方式で配布して患者データのセキュリティまで確保する。研究室レベルのデモを超え、実際の臨床環境で作動する医療AIとして検証するという。
ACRYLのパク・ウェジン代表は「ALLM.Hは、ACRYLが保有する大規模モデル学習・評価インフラと、当社が開発・確保しているLLM評価プラットフォーム『Jonathan』で蓄積したモデル最適化ノウハウを結合した成果物。31B規模のモデルでClaude Opus 4とGPT-5.1を上回る性能を達成したことは、モデルの大きさよりもデータ戦略と学習パイプライン設計が核心であることを示している」と述べた。
(c)KOREA WAVE