在 AI 工具日益渗透工作与生活的今天,“如何让 AI 更懂你的需求”成为新的痛点:明明描述了需求,生成结果却总是偏离预期;反复修改提示词,却陷入“词不达意”的循环。所以,掌握高效的提示词(Prompt)设计已成为解锁智能生产力的关键密钥。
前几天多啦导航分享了 PromptPilot,作为一款专注于提示词优化与生成的工具,它能帮你精准拆解需求、补充细节、校准方向,通过可视化界面、智能建议与实时调试功能,助你突破传统试错模式的局限,轻松驾驭AI模型的潜能。无论你是刚入门的新手,还是资深用户希望提升效率,,这份教程都将带你解锁 PromptPilot 的核心功能,让每一次与 AI 的对话都更高效、更精准。
Prompt 生成
支持将简短的「任务描述」拓展为结构相对完整的「初始Prompt」。
使用教程:
具体步骤如下:
- 任务设置:选择单轮对话/文本理解、视觉理解、多轮对话任务。可使用示例任务,或简要描述任务。
- 知识库设置:可选择是否启用知识库(目前适用于文本理解/单轮对话任务),全方位助力Prompt优化。
- 模型设置:用户可选择豆包、DeepSeek等模型。
- Prompt生成:点击「生成Prompt」按钮,将流式展示生成的初始Prompt。
- Prompt调优
- 快速优化:若需快速优化当前「初始 Prompt」,点击「优化你的 Prompt」按钮并提供反馈。
- 深入调试:若需利用批量数据对当前「初始Prompt」做更深入验证与调试,点击「继续调试Prompt」,选择合适的调优模式,即可进入「Prompt调优」功能模块。

Prompt 调优
在 Prompt 调优阶段,用户将跟进一个调优任务。通过「调试」「批量」「智能优化」三个环节,完成 Prompt 的版本迭代。
1.调试
「调试」流程中,用户可结合模型回答,初步调试优化 Prompt,并将生成的种子样本(提问、回答、评分)加入评测集。
1.1 构建提问
不同任务场景中,「提问」的构成要素各异。
文本理解/单轮对话任务:
文本理解/单轮对话任务的提问包含「Prompt」及其「变量(文本)」。变量在Prompt中的占位符为{{变量名}},支持「用户手动输入」或「AI联网生成变量」。开启联网功能后,能辅助AI生成更多样化的变量内容,但可能会产生额外 tokens 消耗和时长。

多轮对话任务:
多轮对话的提问包括「系统Prompt」和「用户内容」。「用户内容」支持「手动输入」与「文件上传」。
视觉理解任务:
视觉理解任务的提问包含「Prompt」及其「变量(文本、图像)」。变量在Prompt中的占位符为{{变量名}},支持「文本手动输入」与「图片本地、TOS、URL上传」。
1.2 生成回答
文本理解/单轮对话任务:
- 模型回答:点击「生成模型回答」按钮,模型回答会在输出框中流式展示。
- 理想回答/参照回答:
- 在「评分模式」中需添加「理想回答」。用户没有明确的理想回答时,可参考AI生成内容,或进一步提供用户反馈、修改AI思考步骤以优化AI生成结果。
- 在「GSB比较模式」中需通过AI生成方式或手动修改方式,来添加「参照回答」。
多轮对话任务:
- 助手回答:在多轮对话中,点击「生成/发送」按钮,或通过手动编辑、文件上传方式输入「助手回答」。
- 理想回答/参照回答:
- 选择「评分模式」的「多轮对话」任务无需添加「理想回答」。
- 选择「GSB比较模式」的「多轮对话」任务需通过AI生成、文件上传、手动编辑等方式添加「参照回答」。
视觉理解任务:
- 模型回答:点击「生成模型回答」按钮,模型回答会在输出框中流式展示。
- 理想回答/参照回答:
- 在「评分模式」中需添加「理想回答」。用户没有明确的理想回答时,可参考AI生成内容,或进一步提供用户反馈、修改AI思考步骤以优化AI生成结果。
- 「视觉理解」任务当前不支持「GSB比较模式」,无需添加「参照回答」。
1.3 完成评分
不同调优模式下采取不同的评分标准。
- 「评分模式」:依据「模型回答」,按 1-5 分进行评分。
- 「GSB比较模式」:对比「模型回答」与「参照回答」,判断“Good更好/Same等同/Bad更差”。可选择是否给出「评分原因」。
1.4 添加至评测集
点击「添加至评测集」按钮,此条数据将会被添加至评测集,在下一流程「批量」中显示。
1.5 Prompt快速优化
在「调试」流程中,用户可随时手动修改Prompt,或使用AI优化。
支持**「一键改写」与「基于反馈的调整」**两种AI优化方式。
- 一键改写:若对当前Prompt整体不满意,点击魔法棒图标「一键改写Prompt」。
- 基于反馈的调整:若对Prompt局部不满意,点击「优化你的Prompt」后输入用户优化建议(文本理解/单轮对话、视觉理解任务),或点击「应用反馈优化Prompt」(多轮对话任务)。
2.批量
「批量」流程用于处理和准备用于Prompt「智能优化」的评测集。批量增加样本的提问、回答和评分。若用户想对单条样本进行精细化调试,可点击样本后的「方框」图标,进入「调试模式」。

2.1 批量构建提问
支持添加行后手动输入、AI生成、文件上传多种方式批量构建提问。
在「文本理解/单轮对话」任务中,支持「AI批量生成变量」。点击上方「AI生成变量」按键,填入新生成的行数。如需修改变量生成规则,则点击按键侧边下拉菜单「变量生成规则」即可跳转。

2.2 批量生成回答
回答包括「模型/助手回答」和「理想/参照回答」。「模型/助手回答」点击对应按钮生成。「理想/参照回答」支持手动输入、AI生成、文件上传等方式。
2.3 批量完成评分
支持「用户打分」与「AI智能评分」。在「AI智能评分」中,首先需明确「评分标准」。支持「用户输入评分标准」与「AI生成评分标准」两种方式。
- 用户输入评分标准:根据提示输入,支持一种「领域特定语言 (DSL) 」来满足复杂评分需求,具体参考评分DSL。
- AI生成评分标准:当用户至少为3条样本打分后,AI将学习用户的评分标准。启用后支持用户进一步编辑。
注意:AI自动生成的评分理由及结果仅供参考,建议人工仔细复查与修正。若评分结果有偏差,可能影响后续Prompt优化方向与效果。一旦确认对所有回答重新评分,新AI评分将覆盖原记录,且原数据无法恢复,请谨慎操作。

2.4 导出评测集
点击上方「…」折叠按钮和「导出为XLSX」,实现评测集导出。

2.5 Prompt 版本比对
在使用「评分模式」的「文本理解/单轮对话」或「视觉理解」任务中的,点击评测表格操作列的「+」符号,选择对比版本后,数据集将新增「被选版本 Prompt 的模型回答」和「评分」,以便对比不同版本 Prompt 的效果。

3.智能优化
「智能优化」流程会基于「批量」流程中所构建的评测集,以提高样本整体评分为目标,对Prompt进行优化,从而生成优化报告、新版本的Prompt和评测集。用户需完成以下步骤:
- 数据准备:根据平台提示,确认相关数据准备完善。
- 效果和成本配置:平衡智能优化过程的 Tokens 消耗和 Prompt 优化效果。
- 免费智能精调:在选择「评分模式」的「文本理解/单轮对话」任务中,可以选择开启「免费智能精调」。生成优化结果后,平台将智能判断是否自动进入精调继续提升优化效果,若有精调结果将更新报告,当前精调方法为 SFT精调,用理想回答作为训练目标。
完成数据准备与配置后,点击「已准备好数据,开始智能优化」。优化过程中,会实时展示优化结果,可点击「下载为Excel」。注意:中间结果会实时更新为当前最佳的Prompt。若未进行下载操作,被后续结果覆盖的历史中间优化结果将无法找回。
4.工具调用(可选)
在使用「评分模式」的「文本理解/单轮对话」任务中,可开启「工具调用」。
说明:「调试」、「批量」、「智能优化 」三个模块均支持开启工具调用。推荐在「调试」时开启,方便直接观测工具调用效果。
点击顶部菜单栏「工具」图标左滑出现创建工具页面,输入或上传工具代码。当用户输入与工具匹配时,模型将自动基于工具规则进行回答。
5.报告
「智能优化」流程结束后,点击「查看优化报告」,即可跳转查看优化前后两个版本的比对结果。报告包括「Prompt 文本」「评分整体比较、具体分布」「详细评测集」的新旧版本结果对比。支持优化后版本与父版本或任意祖先版本进行对比。
Prompt 批量
在 PromptPilot 独立站版本中,若用户已有批量数据集,可从「Prompt 批量」模块进入,直接上传数据集。用户将跳过「调试」环节,直接进入「批量」流程开展 Prompt 优化迭代。调试、批量、智能优化不同流程的操作方式与 Prompt 调优 一致。
视觉理解 Solution
适用于需要理解图片信息的复杂任务,平台依托大模型能力自动探索多步骤、工具的任务Solution,并支持代码轻松部署。
使用流程
- 任务设置:上传需处理的图片文件,描述任务需求,完成后点击「开始任务」 。平台提供预置示例,方便用户快速试用。
- Solution 自动探索:平台依托模型能力理解任务,探索任务的解决方案。探索完成后,将展示分析结果、分析步骤以及 Solution 代码。
- 服务快速部署:点击「部署」按钮。部署完成后,可以调用服务批量解决此类视觉理解任务。
结语:
掌握 PromptPilot 的使用,本质上是学会 “用更聪明的方式与 AI 对话”。它不是简单的工具,而是帮你梳理思路、提炼需求的 “思维伙伴”—— 从模糊的想法到清晰的指令,从单一需求到多维拓展,它让 AI 的能力真正为你所用。当你熟练运用这些技巧后会发现,无论是职场中的报告撰写、创意领域的灵感挖掘,还是日常的信息处理,都能借助 AI 实现效率跃升。现在,不妨打开 PromptPilot,用学到的方法发起你的第一个优化指令,让每一次交互都成为能力进阶的开始。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...