AI 面试模块

AI 应用开发与 Agent 面试总览

把 55 条视频中的 AI 面试、岗位选择、学习路线和项目表达整理成一套可复习的面试地图。

阅读时间 4 分钟

  • AI 面试
  • 学习路线
  • 项目表达
  • 岗位选择

这个模块用于建立整体面试地图。视频中反复出现的主题不是“会不会用某个工具”,而是候选人是否能把大模型能力工程化:从需求识别、数据接入、Prompt 和工具编排,到评测、上线、成本控制和异常兜底。

#面试官真正想判断什么

判断点 低质量回答 高质量回答
大模型应用理解 我会调 API、写 Prompt 我知道模型只是链路中的推理组件,系统还包括数据、权限、状态、工具、评测、监控和成本控制
项目真实性 做过一个智能客服/RAG/Agent 能讲出数据来源、切片策略、召回指标、失败样例、上线边界和业务收益
工程能力 会 LangChain、会 OpenAI API 能独立设计接口、异步任务、缓存、限流、权限、灰度、日志和回滚
成长路径 我想转 AI 能说明自己从原岗位能力迁移到 AI 应用的路径,例如前端体验、后端服务、数据处理或测试评测

#推荐复习顺序

  1. 先补大模型应用工程基础:模型调用、Prompt、Function Calling、结构化输出、流式响应、重试与降级。
  2. 再学 RAG:文档解析、切片、Embedding、向量库、召回、重排、引用、评测。
  3. 再学 Agent:任务规划、工具调用、状态管理、记忆、权限、审批、多 Agent 协作。
  4. 最后准备项目表达:用 STAR 和架构图把项目讲成“业务问题到工程闭环”,而不是工具堆叠。

#典型面试主线

#一分钟自我介绍模板

我过去主要做的是【原方向】,最近把能力迁移到 AI 应用开发,重点做过【项目名称】。项目目标是解决【业务问题】,核心链路包括【数据/模型/工具/评测】,我负责【具体模块】。上线或实验后,我们用【指标】评估效果,例如【召回率、准确率、处理时长、成本、人工通过率】。我对 RAG、Agent、Prompt 工程、模型服务和工程化部署都有系统实践。

#三分钟项目介绍模板

先讲业务背景,再讲系统架构,最后讲指标和问题。不要一上来讲框架名。一个好项目回答应该包含:用户是谁、输入是什么、输出是什么、模型负责什么、不确定性如何处理、失败时怎么兜底、人工如何介入、怎么验证结果、怎么控制成本。

#高频问题与回答骨架

#你理解的 AI 应用开发和传统软件开发有什么不同?

AI 应用开发不是把确定性逻辑替换成模型,而是在确定性系统中引入概率型推理能力。传统软件更强调规则、事务和接口契约;AI 应用还要处理输出不稳定、上下文窗口限制、Token 成本、提示词漂移、幻觉、评测样例集和人工审核。成熟方案通常是“传统工程骨架 + 模型能力 + 评测闭环”。

#你觉得 Agent 和普通工作流的区别是什么?

普通工作流一般是预定义节点和固定路径,适合稳定流程。Agent 允许模型根据目标、状态和工具反馈动态决定下一步,更适合开放任务。但 Agent 的风险也更高,需要限制工具权限、记录步骤、设置最大轮次、加入审批点,并设计失败恢复。

#你如何证明自己不是只会调包?

要用项目细节证明:我如何选择切片长度、怎么处理 OCR 噪声、为什么加重排、如何做 Prompt 版本管理、如何记录每次模型调用、遇到超时怎么重试、如何做成本预算、如何设计评测集。这些问题回答得出来,才像真正做过。

#岗位方向速查

方向 适合背景 核心能力 面试重点
AI 应用开发 前端、后端、全栈、产品工程 API、业务流程、RAG、Prompt、部署 项目落地、工程闭环、业务指标
Agent 开发 后端、自动化、平台工程 工具调用、状态、权限、任务编排 任务分解、多轮执行、异常恢复
RAG/知识库工程 后端、数据、搜索 文档处理、向量检索、评测 切片、召回、重排、权限过滤
模型服务/推理平台 后端、运维、算法工程 GPU、推理框架、监控、成本 吞吐、延迟、资源调度
AI 产品工程 产品、运营、低代码背景 场景拆解、原型、评测、交付 业务理解、工具选择、效果验证

#面试准备全景图

把 AI 面试拆成四层会更稳。第一层是业务场景,说明为什么需要模型,用户是谁,输入输出是什么,成功标准是什么。第二层是能力链路,说明用了 RAG、Agent、Prompt、工具调用还是模型微调。第三层是工程系统,说明接口、任务队列、缓存、权限、日志、监控、灰度和回滚。第四层是质量闭环,说明评测集、人工审核、线上反馈和成本指标。

如果面试官问“你做过 AI 应用吗”,不要按工具名回答。可以按这条线展开:我做的是一个解决具体业务问题的系统;模型在其中承担理解、生成或决策能力;确定性部分由传统工程保证;不确定性部分通过评测、引用、审核、降级和监控控制。

#项目讲述的 5 个层级

层级 应该讲什么 容易被追问
背景 业务痛点、用户角色、原流程成本 这个问题为什么值得做
输入 文档、对话、表格、网页、业务数据 数据质量、权限、更新频率
处理 RAG、Agent、Prompt、工具调用、后处理 技术选择原因和替代方案
输出 答案、报告、动作、工单、代码、PPT 格式校验、引用、人工确认
指标 准确率、采纳率、延迟、成本、节省时间 指标如何采集,是否可信

#不同轮次的回答策略

#一面:证明你真的做过

一面通常追细节。准备好数据从哪里来、接口怎么设计、Prompt 怎么管理、向量库怎么选、错误日志怎么看、上线后遇到什么问题。回答要落到具体参数和取舍,不要停在概念。

#二面:证明你能做系统

二面更关注架构和边界。要讲清服务拆分、异步任务、权限模型、限流、缓存、灰度、监控、告警和回滚。面试官会判断你是不是只能做 Demo,还是能把功能放进生产系统。

#HR 或业务面:证明你能创造价值

这轮少讲模型细节,多讲业务收益、协作方式、交付周期、风险意识和学习能力。可以准备一个 30 秒版本:我把原来需要人工处理的某个流程,改造成半自动或自动化流程,用指标证明它确实提升了效率。

#常见扣分点

  • 只说“调用大模型 API”,没有业务流程和工程闭环。
  • 只说“用了 LangChain/Coze/OpenClaw”,讲不出为什么选它。
  • 没有评测指标,回答质量全靠主观感觉。
  • 没有失败案例,像教程项目而不是真实项目。
  • 不知道 Token 成本、上下文窗口、重试、超时和限流。
  • 把 Agent 描述成完全自主,忽略权限、审批和审计。

#生产级 AI 应用架构地图

面试时可以把任何 AI 应用放进一张通用架构图里讲:入口层负责 Web、飞书、插件或 API 请求;编排层负责任务分类、Prompt 版本、模型路由、工具调用和状态流转;能力层包含 RAG、Agent、结构化输出、代码执行、文档解析和外部系统 API;治理层包含评测、日志、权限、成本、安全和人工审核。

架构层 典型组件 面试可讲重点
入口层 Web、IM Bot、浏览器插件、OpenAPI 鉴权、限流、用户上下文
编排层 路由器、工作流、Agent Runtime、任务队列 什么时候固定流程,什么时候让模型决策
数据层 文档库、向量库、业务库、缓存 权限继承、索引版本、数据新鲜度
模型层 模型网关、Embedding、重排、生成模型 模型选择、结构化输出、超时重试
工具层 MCP、内部 API、文件系统、办公系统 Schema、最小权限、审批和审计
评测层 离线评测、线上抽检、A/B、用户反馈 指标、回归、失败样例沉淀
治理层 安全、隐私、成本、合规、监控 Prompt Injection、敏感信息、预算告警

#最佳实践答题框架

当前主流实践都强调一个共同点:先做可评测的简单系统,再增加复杂 Agent。回答时可以用“四个先后”:

  1. 先用确定性流程解决可预测部分,再把模型放在理解、生成、判断这些不确定环节。
  2. 先做离线评测集,再调 Prompt、模型、切片或工具。
  3. 先用工作流和人工确认控制风险,再逐步开放 Agent 自主能力。
  4. 先建立日志、Trace、Token 和成本账本,再谈规模化上线。

#面试中的架构图口述模板

用户请求进入 API 网关后,系统先做鉴权和限流,再由任务路由器判断是普通问答、RAG 查询、Agent 任务还是内容生成。RAG 任务进入检索链路,Agent 任务进入状态机或图执行器。所有模型调用走统一模型网关,记录 Prompt 版本、模型、Token、延迟和错误。高风险工具调用进入人工审批,最终结果通过结构化校验、敏感信息检查和引用检查后返回用户。线上通过评测集、人工抽检和反馈闭环持续优化。

#候选人自检清单

  • 能否在 2 分钟内讲清楚这个模块解决什么业务问题、为什么不是简单调用模型 API。
  • 能否说清输入、处理、模型调用、后处理、评测、监控、回滚的完整链路。
  • 能否给出至少一个真实项目指标,例如召回率、命中率、延迟、Token 成本、人工复核通过率或线上失败率。
  • 能否解释一个失败案例:问题如何发现、如何定位、怎么修复、修复后用什么指标验证。
  • 能否区分“学习过概念”和“真正落地过系统”,面试回答要用具体约束、权衡和数据支撑。

相关模块

返回 AI 面试模块