返回工程骨架说明

VLA 校验脚本说明

`validate_vla_episode.py` 用于在训练前先检查一条 VLA episode JSON 是否满足最基本的数据格式和安全字段要求,避免坏数据直接进入训练集。

运行命令

python3 scripts/validate_vla_episode.py \
  vla_dataset/sample_episode.json

会检查什么

  • 顶层键是否齐全:`episode_id`、`task_instruction`、`observations`、`actions`、`labels`、`safety`。
  • 观测是否包含 RGB、深度、本体状态。
  • 动作空间是否为 `delta_pose_plus_gripper`。
  • 安全字段是否明确写出。

适用场景

适合遥操作数据整理、VLA 数据集质检、训练前 schema 快速验收。

核心逻辑摘要

REQUIRED_TOP_LEVEL = [...]
REQUIRED_OBSERVATIONS = ["rgb_paths", "depth_paths", "proprioception"]
REQUIRED_SAFETY = ["workspace_checked", "speed_limited", "estop_available"]

if actions.space != "delta_pose_plus_gripper":
    error(...)
if failed episode and no failure_reason:
    error(...)