跳到主要内容

完成第一次运行

创建主运行

在EvalsOne,你只需几个简单步骤,你就可以创建并完成一次评估运行。

在开始之前,需要做好以下的准备:

  • 准备好待评估的样本
  • 配置好用于生成和评估的模型
  • 如果是自动评估,还需要设定好评估所使用的指标

不过,不用担心,我们为每一位新用户提供了一个快速测试样本集,并提供了共享模型和预置评估指标,以及3美元的初始额度,你可以利用它们轻松上手。

创建运行

Fork运行

在已有运行基础上,点击“Fork”按钮,即可通过Fork功能快速迭代评估。Fork迭代时可以保持现有配置,也可以切换模版版本、生成模型、评估指标等单项设置,适用于持续改进、全面考量、比较分析和优化。

创建fork运行

到这里,你已经了解了在EvalsOne上创建运行的基本方式。但是,每个AI应用程序的评估需求千差万别,实际使用时,需要根据自己的需求场景准备样本、模型和评估指标。

下面,你可以深入了解样本、模型和评估指标的具体功能,一步步成为在EvalsOne上进行提示语评估的专家!