AI 应用开发与 Agent 面试总览

这个模块用于建立整体面试地图。视频中反复出现的主题不是“会不会用某个工具”，而是候选人是否能把大模型能力工程化：从需求识别、数据接入、Prompt 和工具编排，到评测、上线、成本控制和异常兜底。

#面试官真正想判断什么

判断点	低质量回答	高质量回答
大模型应用理解	我会调 API、写 Prompt	我知道模型只是链路中的推理组件，系统还包括数据、权限、状态、工具、评测、监控和成本控制
项目真实性	做过一个智能客服/RAG/Agent	能讲出数据来源、切片策略、召回指标、失败样例、上线边界和业务收益
工程能力	会 LangChain、会 OpenAI API	能独立设计接口、异步任务、缓存、限流、权限、灰度、日志和回滚
成长路径	我想转 AI	能说明自己从原岗位能力迁移到 AI 应用的路径，例如前端体验、后端服务、数据处理或测试评测

#推荐复习顺序

先补大模型应用工程基础：模型调用、Prompt、Function Calling、结构化输出、流式响应、重试与降级。
再学 RAG：文档解析、切片、Embedding、向量库、召回、重排、引用、评测。
再学 Agent：任务规划、工具调用、状态管理、记忆、权限、审批、多 Agent 协作。
最后准备项目表达：用 STAR 和架构图把项目讲成“业务问题到工程闭环”，而不是工具堆叠。

#典型面试主线

#一分钟自我介绍模板

我过去主要做的是【原方向】，最近把能力迁移到 AI 应用开发，重点做过【项目名称】。项目目标是解决【业务问题】，核心链路包括【数据/模型/工具/评测】，我负责【具体模块】。上线或实验后，我们用【指标】评估效果，例如【召回率、准确率、处理时长、成本、人工通过率】。我对 RAG、Agent、Prompt 工程、模型服务和工程化部署都有系统实践。

#三分钟项目介绍模板

先讲业务背景，再讲系统架构，最后讲指标和问题。不要一上来讲框架名。一个好项目回答应该包含：用户是谁、输入是什么、输出是什么、模型负责什么、不确定性如何处理、失败时怎么兜底、人工如何介入、怎么验证结果、怎么控制成本。

#高频问题与回答骨架

#你理解的 AI 应用开发和传统软件开发有什么不同？

AI 应用开发不是把确定性逻辑替换成模型，而是在确定性系统中引入概率型推理能力。传统软件更强调规则、事务和接口契约；AI 应用还要处理输出不稳定、上下文窗口限制、Token 成本、提示词漂移、幻觉、评测样例集和人工审核。成熟方案通常是“传统工程骨架 + 模型能力 + 评测闭环”。

#你觉得 Agent 和普通工作流的区别是什么？

普通工作流一般是预定义节点和固定路径，适合稳定流程。Agent 允许模型根据目标、状态和工具反馈动态决定下一步，更适合开放任务。但 Agent 的风险也更高，需要限制工具权限、记录步骤、设置最大轮次、加入审批点，并设计失败恢复。

#你如何证明自己不是只会调包？

要用项目细节证明：我如何选择切片长度、怎么处理 OCR 噪声、为什么加重排、如何做 Prompt 版本管理、如何记录每次模型调用、遇到超时怎么重试、如何做成本预算、如何设计评测集。这些问题回答得出来，才像真正做过。

#岗位方向速查

方向	适合背景	核心能力	面试重点
AI 应用开发	前端、后端、全栈、产品工程	API、业务流程、RAG、Prompt、部署	项目落地、工程闭环、业务指标
Agent 开发	后端、自动化、平台工程	工具调用、状态、权限、任务编排	任务分解、多轮执行、异常恢复
RAG/知识库工程	后端、数据、搜索	文档处理、向量检索、评测	切片、召回、重排、权限过滤
模型服务/推理平台	后端、运维、算法工程	GPU、推理框架、监控、成本	吞吐、延迟、资源调度
AI 产品工程	产品、运营、低代码背景	场景拆解、原型、评测、交付	业务理解、工具选择、效果验证

#面试准备全景图

把 AI 面试拆成四层会更稳。第一层是业务场景，说明为什么需要模型，用户是谁，输入输出是什么，成功标准是什么。第二层是能力链路，说明用了 RAG、Agent、Prompt、工具调用还是模型微调。第三层是工程系统，说明接口、任务队列、缓存、权限、日志、监控、灰度和回滚。第四层是质量闭环，说明评测集、人工审核、线上反馈和成本指标。

如果面试官问“你做过 AI 应用吗”，不要按工具名回答。可以按这条线展开：我做的是一个解决具体业务问题的系统；模型在其中承担理解、生成或决策能力；确定性部分由传统工程保证；不确定性部分通过评测、引用、审核、降级和监控控制。

#项目讲述的 5 个层级

层级	应该讲什么	容易被追问
背景	业务痛点、用户角色、原流程成本	这个问题为什么值得做
输入	文档、对话、表格、网页、业务数据	数据质量、权限、更新频率
处理	RAG、Agent、Prompt、工具调用、后处理	技术选择原因和替代方案
输出	答案、报告、动作、工单、代码、PPT	格式校验、引用、人工确认
指标	准确率、采纳率、延迟、成本、节省时间	指标如何采集，是否可信

#不同轮次的回答策略

#一面：证明你真的做过

一面通常追细节。准备好数据从哪里来、接口怎么设计、Prompt 怎么管理、向量库怎么选、错误日志怎么看、上线后遇到什么问题。回答要落到具体参数和取舍，不要停在概念。

#二面：证明你能做系统

二面更关注架构和边界。要讲清服务拆分、异步任务、权限模型、限流、缓存、灰度、监控、告警和回滚。面试官会判断你是不是只能做 Demo，还是能把功能放进生产系统。

#HR 或业务面：证明你能创造价值

这轮少讲模型细节，多讲业务收益、协作方式、交付周期、风险意识和学习能力。可以准备一个 30 秒版本：我把原来需要人工处理的某个流程，改造成半自动或自动化流程，用指标证明它确实提升了效率。

#常见扣分点

只说“调用大模型 API”，没有业务流程和工程闭环。
只说“用了 LangChain/Coze/OpenClaw”，讲不出为什么选它。
没有评测指标，回答质量全靠主观感觉。
没有失败案例，像教程项目而不是真实项目。
不知道 Token 成本、上下文窗口、重试、超时和限流。
把 Agent 描述成完全自主，忽略权限、审批和审计。

#生产级 AI 应用架构地图

面试时可以把任何 AI 应用放进一张通用架构图里讲：入口层负责 Web、飞书、插件或 API 请求；编排层负责任务分类、Prompt 版本、模型路由、工具调用和状态流转；能力层包含 RAG、Agent、结构化输出、代码执行、文档解析和外部系统 API；治理层包含评测、日志、权限、成本、安全和人工审核。

架构层	典型组件	面试可讲重点
入口层	Web、IM Bot、浏览器插件、OpenAPI	鉴权、限流、用户上下文
编排层	路由器、工作流、Agent Runtime、任务队列	什么时候固定流程，什么时候让模型决策
数据层	文档库、向量库、业务库、缓存	权限继承、索引版本、数据新鲜度
模型层	模型网关、Embedding、重排、生成模型	模型选择、结构化输出、超时重试
工具层	MCP、内部 API、文件系统、办公系统	Schema、最小权限、审批和审计
评测层	离线评测、线上抽检、A/B、用户反馈	指标、回归、失败样例沉淀
治理层	安全、隐私、成本、合规、监控	Prompt Injection、敏感信息、预算告警

#最佳实践答题框架

当前主流实践都强调一个共同点：先做可评测的简单系统，再增加复杂 Agent。回答时可以用“四个先后”：

先用确定性流程解决可预测部分，再把模型放在理解、生成、判断这些不确定环节。
先做离线评测集，再调 Prompt、模型、切片或工具。
先用工作流和人工确认控制风险，再逐步开放 Agent 自主能力。
先建立日志、Trace、Token 和成本账本，再谈规模化上线。

#面试中的架构图口述模板

用户请求进入 API 网关后，系统先做鉴权和限流，再由任务路由器判断是普通问答、RAG 查询、Agent 任务还是内容生成。RAG 任务进入检索链路，Agent 任务进入状态机或图执行器。所有模型调用走统一模型网关，记录 Prompt 版本、模型、Token、延迟和错误。高风险工具调用进入人工审批，最终结果通过结构化校验、敏感信息检查和引用检查后返回用户。线上通过评测集、人工抽检和反馈闭环持续优化。

#候选人自检清单

能否在 2 分钟内讲清楚这个模块解决什么业务问题、为什么不是简单调用模型 API。
能否说清输入、处理、模型调用、后处理、评测、监控、回滚的完整链路。
能否给出至少一个真实项目指标，例如召回率、命中率、延迟、Token 成本、人工复核通过率或线上失败率。
能否解释一个失败案例：问题如何发现、如何定位、怎么修复、修复后用什么指标验证。
能否区分“学习过概念”和“真正落地过系统”，面试回答要用具体约束、权衡和数据支撑。