AI 全栈高频 100 问
这页不是长篇解释,而是给面试前快速过题用的高频问答清单。
使用方式:
- 先顺着看一遍,确认哪些问题你能独立答出来。
- 答不顺的题,再跳回对应专题页补知识。
- 面试前一天只过这页和你自己的薄弱项。
面试前 30 分钟速看版
如果时间已经很紧,只看下面这些题。
前端与基础
- HTTP 和 WebSocket 的区别是什么?
- SSE 和 WebSocket 怎么选?
- Promise、async/await、事件循环之间的关系是什么?
Node.js 后端
- RESTful API 应该怎么设计?
- JWT 和 Session 的区别是什么?
- Redis 在 Node 服务里的典型用途有哪些?
- MySQL 索引为什么重要?
- 事件循环有哪些阶段?
Java 后端
- Spring 和 Spring Boot 的区别是什么?
- Spring 事务是怎么实现的?
@Transactional为什么会失效?- B+ 树为什么适合数据库索引?
- Redis 为什么快?
AI 工程
- 什么是 RAG?
- 什么是 Function Calling?
- Agent 和 workflow 的区别是什么?
- 流式输出为什么体验更好?
- 如何做模型路由和降级?
系统设计与项目
- 设计一个企业知识库问答系统,需要哪些模块?
- 设计一个支持流式输出的聊天系统。
- 设计一个模型调用网关。
- 如何讲清楚一个 AI 项目的业务价值?
学习顺序
- 第一步:AI 全栈岗位路线图
- 第二步:AI 全栈开发工程师面试
- 第三步:Node / Java / AI 工程专题
- 第四步:AI 系统设计题
1. 前端与基础 15 问
答题关键词:
- 浏览器 / 网络 / 状态管理 / 渲染性能 / 流式交互 / 错误兜底
- 一面最常见的前端基础考点有哪些?
- HTTP 和 WebSocket 的区别是什么?
- SSE 和 WebSocket 怎么选?
- Promise、async/await、事件循环之间的关系是什么?
- TypeScript 在 AI 全栈项目里最大的价值是什么?
- 为什么 AI 全栈岗位仍然会考算法?
- React / Vue 在 AI 聊天产品里最常见的难点是什么?
- 大列表聊天记录如何优化性能?
- 如何设计聊天消息的数据结构?
- 如何处理 Markdown 渲染和代码高亮?
- 为什么流式输出特别依赖前端渲染能力?
- 为什么 AI 对话产品要重视错误边界和兜底态?
- 如何设计消息重试和失败提示?
- 为什么前端转全栈还需要懂浏览器缓存?
- 为什么前端仍然是 AI 产品体验差异化的关键?
2. Node.js 后端 20 问
答题关键词:
- 事件循环 / I-O 密集 / 中间件 / JWT / Redis / MySQL / SSE / API 设计
- RESTful API 应该怎么设计?
- JWT 和 Session 的区别是什么?
- Redis 在 Node 服务里的典型用途有哪些?
- MySQL 索引为什么重要?
- 缓存穿透、击穿、雪崩分别是什么?
- Node.js 为什么适合前端转全栈?
- Node.js 为什么适合 I/O 密集型场景?
- Node.js 为什么不适合 CPU 密集型任务?
- 事件循环有哪些阶段?
process.nextTick和 Promise 谁先执行?- Express 中间件机制是什么?
- Koa 洋葱模型是什么?
- Koa 和 Express 的区别是什么?
- NestJS 为什么适合中大型项目?
- RBAC 权限模型是什么?
- 什么时候用 SSE?什么时候用 WebSocket?
- 如何设计一个 AI 对话接口?
- 如何设计一个知识库问答接口?
- Node 如何处理 CPU 密集型任务?
setImmediate和setTimeout(fn, 0)有什么区别?
对应内容:
3. Java 后端 20 问
答题关键词:
- JVM / GC / 线程池 / Spring / 事务 / MySQL / Redis / MQ / 网关
- Spring 和 Spring Boot 的区别是什么?
- Spring 事务是怎么实现的?
@Transactional为什么会失效?- B+ 树为什么适合数据库索引?
- Redis 为什么快?
- MQ 解决什么问题?
- Java 为什么适合企业级后端?
- JVM 内存结构有哪些?
- 堆和栈有什么区别?
- Full GC 频繁说明什么?
- 如何判断对象是否可回收?
- 常见 GC 算法有哪些?
- 为什么要分代回收?
- 线程池为什么比频繁创建线程更好?
- 线程池核心参数有哪些?
- synchronized 和 ReentrantLock 区别是什么?
- 什么是 CAS?
- 什么是 IoC?
- 什么是 AOP?
- 如何设计一个模型调用网关?
对应内容:
4. AI 工程 25 问
答题关键词:
- Prompt / RAG / embedding / rerank / Agent / workflow / 上下文 / 成本 / 安全
- 什么是 RAG?
- RAG 主要解决什么问题?
- 什么是 Function Calling?
- 工具调用链路是什么?
- Agent 和 workflow 的区别是什么?
- 什么场景不适合 Agent?
- 什么是 Prompt Engineering?
- Prompt 为什么不能无限变长?
- 切片为什么重要?
- Embedding 是什么?
- 向量库是做什么的?
- rerank 是做什么的?
- 流式输出为什么体验更好?
- SSE 和 WebSocket 有什么区别?
- 如何保存完整回答?
- 多轮上下文如何截断?
- 如何做历史摘要?
- 模型幻觉怎么缓解?
- 如何做敏感内容拦截?
- 如何限制工具权限?
- 什么是 Prompt Injection?
- 如何做模型路由?
- 如何做降级?
- 如何控制 token 成本?
- 为什么热点问答适合缓存?
对应内容:
5. 系统设计与项目 20 问
答题关键词:
- 模块拆分 / 数据流 / 权限 / 限流 / 日志 / 监控 / 降级 / 成本 / 可扩展性
- 设计一个企业知识库问答系统,需要哪些模块?
- 知识库系统的在线问答链路是什么?
- 知识库系统的离线链路是什么?
- 为什么知识库要返回引用来源?
- 设计一个支持流式输出的聊天系统。
- 上下文过长怎么办?
- 如何保存聊天历史?
- 如何记录 token 和耗时?
- 设计一个模型调用网关。
- 模型如何做路由和降级?
- 如何做限流和配额?
- 如何做成本统计?
- 设计一个 Agent 工具调用平台。
- 为什么不能让模型自由调用所有工具?
- 工具参数如何校验?
- 工具调用失败如何处理?
- 如何做多租户隔离?
- AI 项目中最容易忽略的工程问题有哪些?
- 如何讲清楚一个 AI 项目的业务价值?
- 如何把“调用模型 API”讲成“线上系统能力”?
对应内容:
面试前一天怎么用这页?
建议只做三件事:
- 把这 100 问快速过一遍。
- 标记你答不流畅的 10 到 20 问。
- 回到对应专题页补短板,不要再无目的乱看。