AI 全栈高频 100 问

这页不是长篇解释，而是给面试前快速过题用的高频问答清单。

使用方式：

先顺着看一遍，确认哪些问题你能独立答出来。
答不顺的题，再跳回对应专题页补知识。
面试前一天只过这页和你自己的薄弱项。

面试前 30 分钟速看版

如果时间已经很紧，只看下面这些题。

前端与基础

HTTP 和 WebSocket 的区别是什么？
SSE 和 WebSocket 怎么选？
Promise、async/await、事件循环之间的关系是什么？

Node.js 后端

RESTful API 应该怎么设计？
JWT 和 Session 的区别是什么？
Redis 在 Node 服务里的典型用途有哪些？
MySQL 索引为什么重要？
事件循环有哪些阶段？

Java 后端

Spring 和 Spring Boot 的区别是什么？
Spring 事务是怎么实现的？
@Transactional 为什么会失效？
B+ 树为什么适合数据库索引？
Redis 为什么快？

AI 工程

什么是 RAG？
什么是 Function Calling？
Agent 和 workflow 的区别是什么？
流式输出为什么体验更好？
如何做模型路由和降级？

系统设计与项目

设计一个企业知识库问答系统，需要哪些模块？
设计一个支持流式输出的聊天系统。
设计一个模型调用网关。
如何讲清楚一个 AI 项目的业务价值？

学习顺序

第一步：AI 全栈岗位路线图
第二步：AI 全栈开发工程师面试
第三步：Node / Java / AI 工程专题
第四步：AI 系统设计题

1. 前端与基础 `15 问`

答题关键词：

浏览器 / 网络 / 状态管理 / 渲染性能 / 流式交互 / 错误兜底

一面最常见的前端基础考点有哪些？
HTTP 和 WebSocket 的区别是什么？
SSE 和 WebSocket 怎么选？
Promise、async/await、事件循环之间的关系是什么？
TypeScript 在 AI 全栈项目里最大的价值是什么？
为什么 AI 全栈岗位仍然会考算法？
React / Vue 在 AI 聊天产品里最常见的难点是什么？
大列表聊天记录如何优化性能？
如何设计聊天消息的数据结构？
如何处理 Markdown 渲染和代码高亮？
为什么流式输出特别依赖前端渲染能力？
为什么 AI 对话产品要重视错误边界和兜底态？
如何设计消息重试和失败提示？
为什么前端转全栈还需要懂浏览器缓存？
为什么前端仍然是 AI 产品体验差异化的关键？

2. Node.js 后端 `20 问`

答题关键词：

事件循环 / I-O 密集 / 中间件 / JWT / Redis / MySQL / SSE / API 设计

RESTful API 应该怎么设计？
JWT 和 Session 的区别是什么？
Redis 在 Node 服务里的典型用途有哪些？
MySQL 索引为什么重要？
缓存穿透、击穿、雪崩分别是什么？
Node.js 为什么适合前端转全栈？
Node.js 为什么适合 I/O 密集型场景？
Node.js 为什么不适合 CPU 密集型任务？
事件循环有哪些阶段？
process.nextTick 和 Promise 谁先执行？
Express 中间件机制是什么？
Koa 洋葱模型是什么？
Koa 和 Express 的区别是什么？
NestJS 为什么适合中大型项目？
RBAC 权限模型是什么？
什么时候用 SSE？什么时候用 WebSocket？
如何设计一个 AI 对话接口？
如何设计一个知识库问答接口？
Node 如何处理 CPU 密集型任务？
setImmediate 和 setTimeout(fn, 0) 有什么区别？

对应内容：

Node.js 后端面试题

3. Java 后端 `20 问`

答题关键词：

JVM / GC / 线程池 / Spring / 事务 / MySQL / Redis / MQ / 网关

Spring 和 Spring Boot 的区别是什么？
Spring 事务是怎么实现的？
@Transactional 为什么会失效？
B+ 树为什么适合数据库索引？
Redis 为什么快？
MQ 解决什么问题？
Java 为什么适合企业级后端？
JVM 内存结构有哪些？
堆和栈有什么区别？
Full GC 频繁说明什么？
如何判断对象是否可回收？
常见 GC 算法有哪些？
为什么要分代回收？
线程池为什么比频繁创建线程更好？
线程池核心参数有哪些？
synchronized 和 ReentrantLock 区别是什么？
什么是 CAS？
什么是 IoC？
什么是 AOP？
如何设计一个模型调用网关？

对应内容：

Java 后端面试题

4. AI 工程 `25 问`

答题关键词：

Prompt / RAG / embedding / rerank / Agent / workflow / 上下文 / 成本 / 安全

什么是 RAG？
RAG 主要解决什么问题？
什么是 Function Calling？
工具调用链路是什么？
Agent 和 workflow 的区别是什么？
什么场景不适合 Agent？
什么是 Prompt Engineering？
Prompt 为什么不能无限变长？
切片为什么重要？
Embedding 是什么？
向量库是做什么的？
rerank 是做什么的？
流式输出为什么体验更好？
SSE 和 WebSocket 有什么区别？
如何保存完整回答？
多轮上下文如何截断？
如何做历史摘要？
模型幻觉怎么缓解？
如何做敏感内容拦截？
如何限制工具权限？
什么是 Prompt Injection？
如何做模型路由？
如何做降级？
如何控制 token 成本？
为什么热点问答适合缓存？

对应内容：

AI 工程面试题

5. 系统设计与项目 `20 问`

答题关键词：

模块拆分 / 数据流 / 权限 / 限流 / 日志 / 监控 / 降级 / 成本 / 可扩展性

设计一个企业知识库问答系统，需要哪些模块？
知识库系统的在线问答链路是什么？
知识库系统的离线链路是什么？
为什么知识库要返回引用来源？
设计一个支持流式输出的聊天系统。
上下文过长怎么办？
如何保存聊天历史？
如何记录 token 和耗时？
设计一个模型调用网关。
模型如何做路由和降级？
如何做限流和配额？
如何做成本统计？
设计一个 Agent 工具调用平台。
为什么不能让模型自由调用所有工具？
工具参数如何校验？
工具调用失败如何处理？
如何做多租户隔离？
AI 项目中最容易忽略的工程问题有哪些？
如何讲清楚一个 AI 项目的业务价值？
如何把“调用模型 API”讲成“线上系统能力”？

对应内容：

面试前一天怎么用这页？

建议只做三件事：

把这 100 问快速过一遍。
标记你答不流畅的 10 到 20 问。
回到对应专题页补短板，不要再无目的乱看。