-
4月 07 2026 AIで医療教育は変わるか? 問診評価で指導医の負担軽減の可能性
医師の働き方改革が進む中、医療教育の現場でも効率化と質の担保の両立が課題となっている。AIを活用した仮想患者による問診評価について、指導医による評価と比較した研究が発表された。AIの評価は指導医と高い一致を示し、評価時間は6割以上短縮されたという。研究は、順天堂大学医学部総合診療科の髙橋宏瑞氏らによるもので、詳細は2月17日付の「JMIR Medical Education」に掲載された。
適切な臨床面接は正確な診断と患者との信頼関係構築に不可欠であり、従来は実際の患者や模擬患者との実習と指導医の指導によって習得されてきた。近年は、「何年経験したか」ではなく「何ができるようになったか」で評価する能力基盤型医学教育(CBME)が広がり、評価や記録業務の負担が課題となっている。こうした中、大規模言語モデル(LLM)を用いた生成AIによる仮想患者と自動評価の仕組みが登場しているが、専門家評価との一致や妥当性の検証は十分ではない。本研究では、AIによる臨床面接評価と指導医による評価の一致度を比較し、AIが代替可能かを検証するとともに、評価時間の短縮効果や経験差による影響を検討した。
【治験について相談したい方へ】
治験情報の探し方から参加検討まで、専門スタッフが一緒にサポートします標準化された「脚の脱力」の症例をAIの仮想患者として設定し、医学生2人、研修医3人、指導医2人の計7人がそれぞれ問診を行った。面接内容を書き起こしたテキストを、25項目からなる評価尺度を用いて採点した。評価は3つの方法で比較した。まず、GPT-o1 ProとGPT-5 Proは、同じ条件(同じプロンプト)で各テキストを5回ずつ評価し、ハルシネーションや評価のばらつきを確認した。次に、別の臨床指導医5人が同じ基準で独立に採点した。一致度はPearson相関係数(r)や級内相関係数(ICC)などで評価し、1件あたりの所要時間と時間短縮率も算出した。
平均面接スコアは、AIによる評価と指導医による評価でほぼ同程度だった(GPT-o1 Proを用いたAI評価:平均52.1±6.9点、GPT-5 Proを用いたAI評価:平均53.2±9.2点、人間による評価:平均53.7±6.8点)。
AI評価と人間評価の一致度は高く(r=0.90、Linの一致相関係数=0.88)、評価の偏りも小さかった(GPT-o1 Pro:平均差0.4±2.7点、GPT-5 Pro:平均差1.5±5.2点。Bland–Altman解析の一致限界はそれぞれ-4.9~5.7、-8.6~11.7)。
信頼性を示すCronbachのα係数は、GPT-o1 Proで0.81、GPT-5 Proで0.86、人間評価で0.80といずれも高水準だった。一方、ICC(評価者間の一致度を示す指標)はAI評価で0.77および0.82と良好だったのに対し、人間評価では0.38にとどまった。さらに、評価のばらつきを示す変動係数はAI評価が6.6%で、人間評価(13.9%)の約半分だった。
処理時間は、AIが3~4分程度で完了したのに対し、医師は約10分を要し、最大で約68%の時間短縮に相当した。
著者らは、GPT-o1 ProおよびGPT-5 Proによる評価が指導医と同等の精度とより高い一貫性を示し、評価時間も大幅に短縮できたと報告している。その上で、「AIは人間評価者を補完または一部代替し得る可能性があるとしつつ、教育現場での活用には慎重な設計と継続的な人間の監督が不可欠だ」と強調している。
なお、本研究は単一の模擬症例を対象とした小規模な検討にとどまる。著者らは、より多様な症例での検証や学習効果・費用対効果の評価に加え、実際の診療能力との関連を検証する必要があると指摘する。また、高い一致度が直ちに公平性を保証するわけではなく、性別や文化的背景などに関する潜在的なバイアスへの検証も不可欠だとしている。
治験に関する詳しい解説はこちら
治験・臨床試験は新しいお薬の開発に欠かせません。治験や疾患啓発の活動を通じてより多くの方に治験の理解を深めて頂く事を目指しています。治験について知る事で治験がより身近なものになるはずです。
-
4月 06 2026 縦隔腫瘍・重症筋無力症の手術、主流は「低侵襲」へ――全国データ解析
胸の中央の空間である縦隔に生じる腫瘍(縦隔腫瘍)の手術は、従来は胸を大きく開く開胸手術が主流だった。近年は胸腔鏡やロボットを用いた低侵襲手術の導入が進んでいるが、日本全体での実態は十分に明らかでなかった。今回、全国の医療保険データを解析した研究で、縦隔手術の多くが胸腔鏡で行われ、ロボット手術も増加していることが示された。研究は、稲毛病院整形外科の城戸優充氏、京都府立医科大学呼吸器外科学の岡田悟氏らによるもので、詳細は2月20日付で「International Journal of Clinical Oncology」に掲載された。
胸腺上皮性腫瘍は発生頻度が低いものの、前縦隔に生じる腫瘍の中で最も多い。標準治療は外科切除であり、近年は胸腔鏡やロボット支援手術など低侵襲手術の導入が進んでいる。また、胸腺摘出術が行われる代表的疾患である重症筋無力症(MG)でも同様の手術手技の変化が報告されている。しかし、日本では縦隔手術の全国的な動向は十分に明らかでない。そこで本研究は、全国の医療保険データベースを用いて過去10年間の縦隔腫瘍手術の推移を解析した。
【治験について相談したい方へ】
治験情報の探し方から参加検討まで、専門スタッフが一緒にサポートします本研究では、日本の保険診療におけるレセプトデータの95%以上を網羅する厚生労働省の匿名医療保険等関連情報データベース(National Database of Health Insurance Claims and Specific Health Checkups:NDB)の公開集計データを用い、2014~2023年に行われた縦隔手術を解析した。手術は疾患区分(良性腫瘍、悪性腫瘍、MG)と手術アプローチ(開胸、胸腔鏡、ロボット支援手術)で分類し、10万人年当たりの手術率を算出した。10年間の経年推移については、手術件数を線形回帰分析、手術率をポアソン回帰分析で評価した。手術率は男性・女性・男女全体に加えて、10歳ごとの各年代についての解析も実施した。年齢調整は2015年標準人口を用いて行った。
2023年に日本で行われた縦隔手術は全6,214件で、内訳は良性腫瘍54.4%、悪性腫瘍41.6%、MG 4.0%だった。手術アプローチでは、胸腔鏡手術が全体の76.4%を占め、ロボット支援手術は全体の29.4%だった。これは胸腔鏡手術の約4割がロボット支援下で行われていた計算になる。一方で、開胸手術は23.6%にとどまった。手術患者の45.1%は65歳以上だった。
過去10年間で、全縦隔腫瘍手術の件数は有意に増加した(P=0.0001)。この増加は、悪性腫瘍手術、胸腔鏡手術、ロボット支援手術件数の増加によるもので、いずれも有意な上昇を示した(いずれもP<0.0001)。一方、MGに対する拡大胸腺摘出術と開胸手術件数は有意に減少していた(それぞれP=0.0019、P<0.0001)。良性腫瘍手術件数には有意な増減を認めなかった。
手術率では、特に悪性縦隔腫瘍に対する手術率が男女ともに増加しており、相対リスクは男性1.051、女性1.065、全体で1.058だった(いずれもP<0.0001)。年代別の解析では、40歳以上の男女で有意に増加していた(P<0.0024)。
著者らは、「日本では過去10年間で悪性縦隔腫瘍に対する手術が増加しており、手術アプローチは開胸から胸腔鏡やロボットなどの低侵襲手術へと大きく移行している」とまとめている。こうした結果は、今後の医療資源配分や外科医育成などを検討する上で参考となる。
なお、本研究は保険請求データに基づく解析であり、腫瘍の組織型や病期などの臨床情報は把握できず、非手術症例も含まれない。また、MGに対する拡大胸腺摘出術の件数が過小評価されている可能性もある。
治験に関する詳しい解説はこちら
治験・臨床試験は新しいお薬の開発に欠かせません。治験や疾患啓発の活動を通じてより多くの方に治験の理解を深めて頂く事を目指しています。治験について知る事で治験がより身近なものになるはずです。
HOME>4月 2026