研究で使う前に
新しいツールを増やすことではなく、根拠を追跡できる状態のまま研究時間を短縮することを重視します。
向いている人
Python で医学 AI、臨床予測モデル、バイオインフォマティクス解析を行う研究者。
最初の一歩
アウトカム、特徴量、学習・検証データ、評価指標を先に表にします。
安全に使う流れ
- 1前処理、欠測値処理、標準化を Pipeline にまとめます。
- 2学習データと評価データを明確に分けます。
- 3分類では AUC、感度、特異度、校正を確認します。
- 4コード、乱数 seed、パッケージ版を保存します。
注意点
- 前処理を分割前に行うとデータリークが起きます。
- クラス不均衡では accuracy だけで判断しないでください。
- 外部検証なしの高精度は過大評価の可能性があります。
根拠チェック
- データリークを避ける Pipeline になっていますか?
- 評価指標は臨床的な用途に合っていますか?
- 外部検証または感度分析を検討しましたか?
さらに確認したい場合
元の詳しいページを開く
このページでは研究判断に必要な要点を整理しています。詳細な背景や関連情報は元のページで確認できます。
元の詳しいページを開く