CLI 与 Config 使用路径

文档状态：Stable

这个项目现在有三条不同层级的使用路径。如果不先讲清楚，很容易出现“看起来有 CLI，但又不知道该喂哪个 YAML”的问题。

如果你是第一次进入仓库，推荐先跑：

bash

uv run medfusion start

它会先把你带到 Getting Started 和 Quickstart Run，把第一条推荐 quickstart、主线阶段和预期产物讲清楚；真正长期跑实验时，再回到下面这条 YAML + CLI 主线。

如果你是来“新建模型 YAML”的，先做这个判断：

想把自己的任务跑在当前主链上：复制一份最接近的主链 YAML 模板
想做研究型原型或结构实验：走 Builder / 代码路径
想要当前 runtime 里根本没有的新能力：先扩 runtime，再把它暴露给 YAML

完整说明见：如何新建模型与 YAML

一、最稳定的主链

这是当前最适合新用户和对外演示的路径。如果你还没有自己的数据，先去公开数据集快速验证清单。

bash

uv run medfusion run --config configs/starter/quickstart.yaml

它默认执行：

validate-config -> train -> build-results

这条链使用的是当前 dataclass 驱动的训练配置，适合：

跑 mock 数据
跑公开数据集 quick validation
接 Web UI / artifact / validation / 报告

如果你需要拆开排查问题，仍然可以直接执行：

bash

uv run medfusion validate-config --config configs/starter/quickstart.yaml
uv run medfusion train --config configs/starter/quickstart.yaml
uv run medfusion build-results \
  --config configs/starter/quickstart.yaml \
  --checkpoint outputs/quickstart/checkpoints/best.pth

其中三个底层命令分别解决三件事：

validate-config
- 在训练前检查 YAML、CSV 列、图像路径、样本规模和 split 是否明显有坑
- 现在还会直接打印当前 YAML 的 mainline contract，包括：
  - model_type
  - vision_backbone
  - fusion_type
  - output_dir
  - 关键 artifact 路径与下一步推荐命令
train
- 真正产出 checkpoint 和训练历史日志
build-results
- 把 checkpoint 补成结果页可直接消费的 metrics/metrics.json / metrics/validation.json / reports/summary.json / reports/report.md / artifacts/*

对应配置目录：

configs/starter/
configs/public_datasets/
configs/testing/

用户视角流程图（主链）

下面这张图只保留“用户如何使用框架”的关键路径，方便第一次接触时快速建立心智模型。

mermaid

flowchart TB
  subgraph U[用户动作]
    U1[选一个训练配置]
    U2[运行配置体检]
    U3[启动训练]
    U4[生成结果产物]
    U5[查看结果页]
  end

  subgraph S[系统反馈]
    S1[通过或给出配置问题]
    S2[输出 checkpoint 和 history]
    S3[输出 metrics validation summary report artifacts]
  end

  subgraph C[配置选择]
    C1[starter 或 public_datasets]
    C2[builder 仅结构实验]
  end

  subgraph R[交付结果]
    R1[可复盘]
    R2[可汇报]
    R3[可对接]
  end

  U1 --> C1
  U1 -.研究原型.-> C2
  C1 --> U2 --> S1
  S1 -->|通过| U3 --> S2 --> U4 --> S3 --> U5
  S3 --> R1
  S3 --> R2
  S3 --> R3

小提示：第一次使用建议优先走 starter/public_datasets -> medfusion run --config ... 这条闭环主链；需要诊断问题时，再拆回 validate-config -> train -> build-results。

二、Builder / 结构实验链

这条链更适合研究型模型拼装，不是当前 CLI 训练主链的同一种配置 schema。

典型入口：

MultiModalModelBuilder
build_model_from_config()

对应配置目录：

configs/builder/

这类 YAML 更接近“描述模型结构”，不一定能直接丢给：

bash

medfusion train --config ...

所以如果你只是想先跑通训练和结果页，不要从 configs/builder/ 开始。

更直接一点说：

主链用户：复制 configs/starter/ 或 configs/public_datasets/
研究用户：Builder / 代码路径
新能力开发：先扩 runtime，再扩 YAML

三、Web UI 链

Web UI 现在的职责更准确地说是：

onboarding
推荐首跑链路解释
训练 handoff
结果 artifact / validation / 报告理解

启动方式：

bash

uv run medfusion start

这里的 start 是现在推荐的新入口：

先进入 Getting Started
再进入 Quickstart Run
然后 handoff 到训练监控和结果入口
Workbench 现在更像运行后的 overview，而不是第一次进入时的首页
medfusion web 仍然保留，但更适合作为兼容入口或高级入口理解

当前推荐顺序

新用户

先跑 uv run medfusion start 看推荐路径
再回到 configs/starter/quickstart.yaml 或 configs/public_datasets/*
优先跑 medfusion run --config ...
如果 run 失败，再先单独跑 medfusion validate-config
确认它打印出来的 contract 和输出目录符合预期
必要时再拆开执行 medfusion train 和 medfusion build-results
最后回到 Web 看结果页或 workbench overview

做研究原型的人

MultiModalModelBuilder
configs/builder/
自己决定是否回接到训练主链

一句话判断该用哪类 YAML

想直接训练：看 configs/starter/、configs/public_datasets/、configs/testing/
想表达模型结构：看 configs/builder/
想翻旧模板：看 configs/legacy/

CLI 与 Config 使用路径 ​

一、最稳定的主链 ​

用户视角流程图（主链） ​

二、Builder / 结构实验链 ​

三、Web UI 链 ​

当前推荐顺序 ​

新用户 ​

做研究原型的人 ​

一句话判断该用哪类 YAML ​

CLI 与 Config 使用路径

一、最稳定的主链

用户视角流程图（主链）

二、Builder / 结构实验链

三、Web UI 链

当前推荐顺序

新用户

做研究原型的人

一句话判断该用哪类 YAML