免费接口守护平台(API开放平台{API Harmony Hub})项目整理
项目部署
数据库建表的SQL代码
数据库创建表的SQL代码(待优化更改)
1 | -- 创建库 |
前端 Ant Design Pro 使用 Nginx 部署
nginx.conf
1 | #user nobody; |
后端打包后使用 Docker-jdk11 部署
除了jar包外还有, mysql, redis, nacos
打包注意点
- 先install SDK代码
- 再打包主项目(父子项目打包要注意)
- 先注释掉父项目pom中
<modules></modules>
标签包含的子模块,install父pom - 再取消注释掉
<modules></modules>
标签包含的子模块,即可统一打包子模块
- 先注释掉父项目pom中
Dockerfile 编写
1 | FROM openjdk:11-oracle |
自我介绍(整理)
- 你好,我是XXX,是XXXX大学的 本科/研究 生,我主要使用Java语言开发,对SSM框架、MySQL和Redis数据库、计算机基础知识有所了解。自己做了一个收集免费接口服务并监控接口状态的平台,当接口状态状态改变时这个平台会发邮件通知订阅了的用户。并解决了项目中出现的一些问题,像常规分页导致数据重复、爬虫时网站使用字体加密反爬等。
- 在校期间,我过了英语六级,还获得了“互联网+”和算法比赛的奖项。
项目真实性
你讲讲整个业务的流程,模块间的关系?
- 为保证接口服务的可用性和稳定性,接口服务被独立部署在一台机器上。为了隐藏接口服务的真实地址和端口,避免接口服务被恶意攻击,前端请求先发送给网关,网关鉴权后再路由转发给接口服务处理;
- 为了避免在网关中引入数据库操作,提高服务的可维护性,用Dubbo RPC实现服务间的方法远程调用;
自己的流程
- 用户订阅接口,定时任务监控接口状态,接口状态变化时通知用户,邮箱激活链接使用JWT、用户登录使用Spring Session + Redis实现分布式会话
项目是你自己做的吗?你为什么做这样的一个项目?你做这个项目的背景(初衷)是什么?
- 可以考虑引入消息队列(一般来说,消息队列的意义主要是削峰填谷、异步解耦。)对本项目而言,引入消息队列有以下好处:
- 将任务调度和任务执行解耦(调度服务并不需要关心任务执行结果);
- 异步化,保证调度服务的高效执行,调度服务的执行是以 ms 为单位;
- 借助消息队列实现任务的可靠消费( At least once );
- 将瞬时高并发的任务量打散执行,达到削峰的作用。
- 实现用户级别的可靠性,即要保证所有订阅用户都被至少推送一次(At least once)。At least once推送如何实现?
- 前提是当把用户 uin 从订阅列表中取出进行推送后,在推送结果返回之前,必须保证用户 uin 被妥善保存,以防止推送失败后没有机会再推送。由于 Redis 没有提供从一个 set 中批量 move 数据到另一个set中,这里采取的做法是通过 redis lua 脚本来保证这个操作的原子性,具体 lua 代码如下(近似):
- 自己做个人主页的时候用了一些别人提供的免费API,想着自己收集一下实用的免费API
- 免费API分享一般就是在GitHub上维护了一个文档不好调试,分享免费API的网站不提供消息提醒功能
- 调研类似此项目免费API分享平台:夏柔 -
免费API
- 重点功能(还没有人做,一般需要自己写代码实现):发现有接口自动检测接口能否调通的功能但没有实现接口订阅功能,接口出错不可调通或接口恢复正常时无法通知用户,不能让用户及时了解到自己调用的免费接口有没有挂掉,以便用户及时切换提供服务的接口,或自己想用的免费接口服务有没有恢复上线
- 发现没有提供统一的SDK,但可以用户自己上传接口(需人工审核){,我的项目用户不能自己上传接口}
- 除了收集别人免费公开的API接口,我还提供了一些自己实现服务的API接口
- 待实现,让用户能自己上传API接口,并打标签
- 平台汇集了众多网络上的免费接口服务,包括我自行开发的实用接口服务,能自动检测并监控接口状态,一旦用户订阅的接口出现故障,系统会通过邮件通知用户,让用户能及时去检查他调用免费接口的项目是否出错(例如,他个人主页调用的天气接口失效,他接到通知后就能及时更换成其他能用的)并解决。还对于不好访问的接口实现了代理,让用户能够用我提供的SDK简化接口调用的过程,便于开发者集成和使用这些接口服务,通过对接口代理还能让用户访问到像ChatGPT这样国内不好访问的接口。平台还实现了在线接口测试、统计接口查看次数等功能。
- 实现自动检测接口是否可调通(不检测返回是否正确,按要求请求,有返回则认为正常),若发现接口不可调通(失败多次才认为接口出错)或参数发生变更时向所有订阅了此接口状态的人发送邮件提醒
- 本来想做一个自己用的API接口整合项目收集免费的API,比如天气服务(目前使用高德的免费API,如果哪天要收费了就用Python爬虫自己实现一个接口)、用Docker部署的网易云音乐API、随机头像、一言…… 只做前端展示 ( 自己使用最重要的其实就是前端展示并且能在线调试,自己调用可以不走网关直接用真正的接口地址省的被限流{自己内部使用,不分享给他人时直接用接口的真实地址},当然走网关也行{例如:个人主页请求天气服务、一言、网易云音乐…… 要给别人展示使用的,肯定得走网关,防止接口真实地址被抓包获得})
- 为什么要自己部署API?有的对我来说实用的API别人没有实现,比如生成bilibili视频文章的短链接(不想打开手机去生成,要在电脑上直接出){之前还能生成跳转到外部网址的bilibili短链接,bug},我个人主页上常用网易云音乐的免费API接口的作者说他服务器压力大,我就不白嫖自己搭建了
- 后来准备分享出去,为了保护自己的接口不被滥用,
就用网关用Spring的AOP拦截请求(进行签名验证,请求头传递签名sign和access_key和其他字段{例如时间戳timestamp…… },签名sign要能验证secret_key也要能保证请求头没被篡改) 隐藏真正的接口的地址(网关保护接口,防止接口地址暴露,前端在线调试的请求地址也得改成网关,防止被抓包查出接口真实地址),并做了用户系统限制使用次数,统计API接口使用次数,后来慢慢扩展成这样的,算是个练手项目 - 现在字节的Coze提供免费的ChatGPT4可带promots的机器人,就是要科学上网 ; 我用自己的服务器把Coze的机器人包装成类似ChatGPT4的API供人免翻墙调用就能收费了
- ChatGPT要科学上网,我提供用自己服务器包装的免翻墙的ChatGPT的API调用也可以收费了,或者让用户自己提供ChatGPT的api-key我服务器只提供转发免翻墙
- 对我来说项目最重要的地方在于前端展示,对上线的项目来说最重要的地方在于用户注册与调用api接口时在网关的鉴权
- 前端本来想用低代码平台做的,但最后还是找了个成熟的ui套件改改用了
- 流量小,没做SEO也没宣传,要先换个 .com 的域名
- Chorme内核最新版(2024.3.19)已经变成默认按https请求了,准备申请证书改为https访问
- 防止ip泄漏可以套一层CF
注:因为我个人已经将项目上线,并能够提供一些真实的接口服务。有条件的同学尽量将项目上线。此外有两场的面试官想要查看数据库,我开了屏幕共享给他们看,所以要对数据库的表结构和设计有一定的了解。
项目的架构你是怎么设计的?
采用前后端分离的架构,后端使用SSM框架开发,数据库用的是MySQL,缓存用Redis
你的开发流程是什么?先实现还是先技术选型?
- 这里可以参考鱼皮大佬直播开发时对企业中做项目流程的讲解
- 调研类似此项目免费API分享平台:夏柔 - 免费API
- 我先参考了一些已有的产品,根据这些产品,总结出来比较好的功能点,再结合自己想要实现的一些功能特色,去做了一个项目整体设计,有了产品原型后再进行技术选型。使用什么样的技术去解决什么样的业务问题。
- 看了别人实现高可用订阅推送的方法设计,结合自己的数据量仿造了一个简化的,别人都是百万用户多订阅推送
总而言之,面试官会从各个角度去深挖项目的细节,考量你是不是真的自己做的,是不是真的理解?所以要做到对项目的所有细节都非常的熟悉。当完全理解项目之后,就能够提前预测到面试官会怎么问,并在面试过程中说出一些技术名词引导面试官,然后对这些问题,和延伸的知识点能够完全掌握后,相信一定可以征服面试官。
你怎么做的技术选型?为什么要用这些技术?
答:使用 SpringBoot 是因为通过自动装配能够提高项目的开发效率,还能够很好的整合其他服务。
使用 MySQL 的原因是因为考虑到未来有用户充值交易,限制调用次数等场景需要用事务保证数据的完整性和一致性。
使用 Redis 的原因是因为可以用来实现分布式 session、锁、缓存等功能。因为 Redis 是一个单独的中间件,不同客户端可以往同一个 Redis 或者集群中存放session/加锁,这样就能保证资源能够在分布式服务下都可见。
并且由于Redis 也是单线程的,同时也支持 lua 脚本,可以保证并发安全的问题,所以可以很简单的实现分布式锁的功能。
注:被面试官追问自动装配的原理你了解过吗?自动装配是怎么实现的?分布式 session 的原理?
数据库的表结构是怎么设计的?
各个表设计了冗余字段方便查询(冗余常需的字段,免的查询两次)
Mysql建表你一般会遵守什么原则或者规范,哪些通用字段,主键一般用啥
- 一般有四个通用字段,
id
、status
、addTime
、updateTime
,其中id
一般用int
或bigint
自增,status
一般用tinyint
,addTime
一般用timestamp
,updateTime
一般用timestamp
(datetime
类型人易直接读,但占用空间大,timestamp
类型占用空间小但人不易直接读) {流水表(例如,物流表……)不更新所以不用加updateTime
字段} - 优先级高(与业务相关)的字段放上面
- 一般认为 0 为异常值
- 一般使用逻辑删除,改变
status
字段的值,而非真正删除;如果用户投诉可以恢复数据查看具体问题证据,每隔一段时间再统一清理(例如180天) status
可以设定为 0 表示被删除, 1 表示正常, 2 表示禁用, 3 表示审核中, 4 表示审核失败,无需多加一个isDelete
字段,
- 一般有四个通用字段,
lowo_api_platform.user
表中-
- 目前前端通过
loginUser.userRole
的函数获取数据库中userRole
字段的值来判断渲染 user/admin 权限对应的界面(没权限的不渲染,隐藏) - 所以修改
userRole
字段类型为tinyint
的话,前端通过loginUser.userRole
的函数获取到的值就是tinyint
类型的,前端判断权限的语句得改
- 目前前端通过
- 给
email
和userAccount
添加唯⼀约束(会自动的创建唯一索引),加快用户创建账号时查表的速度- 在MySQL中,唯一约束和唯一索引都可以实现列数据的唯一,列值可以有null(但只能有一个null)。创建唯一约束时,会自动的创建唯一索引。唯一约束是通过唯一索引来实现数据的唯一。
tinyint
bigint
可以指定长度,例如tinyint(1)
,但长度只作用于显示几位数,存储空间不变,可存储的数值范围也不变 ,所以默认即可- 使用逻辑删除的原因是:即使误删还有机会恢复反悔,可以设定定时任务自动删除被标记删除的行
-
lowo_api_platform.interface_info
表中- 使用逻辑删除
requestHeader
responseHeader
前端暂时没展示totalInvokes
用 Redis 存接口的总调用次数后此字段可以废弃(,或通过定时任务刷写到 MySQL 数据库中,Redis 宕机后可以查 MySQL 的数据)
lowo_api_platform.user_interface_invoke
表中- 用户查自已有没有订阅过某个接口时查MySQL不查Redis,创建
userID
和interfaceId
的联合索引方便查询- 为啥用联合索引而不单独索引? 因为要实现用户查自已有没有订阅过某个接口这个功能WHERE语句需要同时限定userID和interfaceId,所以用联合索引
- 要防止索引失效(联合索引遵循最左匹配原则)
- 若经常以
userID
字段查询则创建(userID,interfaceId)
的联合索引比创建(interfaceId,userID)
的联合索引更有效
- 给每个用户维护其调用各个接口的历史记录(最新调用时间、总次数……),使用逻辑删除,
totalInvokes
也可以用 Redis 存当前用户调用某接口的次数,之后此字段可以废弃(,或通过定时任务刷写到 MySQL 数据库中,Redis 宕机后可以查 MySQL 的数据)
- 用户查自已有没有订阅过某个接口时查MySQL不查Redis,创建
lowo_api_platform.daily_check_in
表中(暂时废弃)lowo_api_platform.product_info
lowo_api_platform.product_order
lowo_api_platform.payment_info
lowo_api_platform.recharge_activity
支付相关的功能还没开发完(借鉴别人的设计)lowo_api_platform.recharge_activity
大致显示用户的订单(先查需要的基本信息,若需要详细信息再查详细信息)(不查详细信息,可以再增加一个订单是否完成的状态,省的查两次才能显示是否成功),要具体信息时可以通过其中的id查找对应lowo_api_platform.product_order
的订单信息和lowo_api_platform.payment_info
的支付信息
若是实习项目,怎么跟产品配合的?怎么测试的?怎么上线的?
- 产品原型图: 产品经理把分布的位置画好,备注了要实现的功能点,UI还没有开始画
- M站:手机端
- 产品原型图 -> 产品需求文档 -> 产品设计文档 -> 产品开发文档 -> 产品测试文档 -> 产品上线文档 -> 产品上线
为啥不用HTTPS?
后续更新再统一上线
在这个项目中线程池参数怎么配置的?你这个项目是根据 I/O密集型 还是 CPU密集型 计算?
Web应用大部分是 I/O密集型 的,与数据库、缓存交互多,网络传输,查数据库最消耗性能,少查数据库
简历上亮点的回答
SSM是啥?SDK?MD5签名?
- Spring + SpringMVC + MyBatis
- SpringMVC的注解 @RestController = @Controller + @ResponseBody、@RequestMapping(“/user”)、@PostMapping(“/register”)、@GetMapping(“/getCaptcha”)、@RequestBody、@RequestParam(“username”)、@Controller、@ResponseBody
- SDK:方便开发的工具包
- 签名是不可逆的,不存储原数据,只能做签名验证 ; 加密是可逆的,能够解密
- 为防止重放攻击,加上了timestamp字段
- 在数据库里的 登录密码 不用 明文 保存,保存用MD5算法对 明文密码+盐值 数据生成的 签名,网页表单Post提交用户输入的密码,将 提交的密码加上盐值 后用MD5生成签名,把生成的签名与保存在数据库里的签名对比,相同则登录成功
- ak/sk与登录密码的区别:登录密码 通过网络传输了,而 secret_key 不通过网络传输,所以在数据库中是否保存明文、用于校验合法的方法…… 对于 登录密码 和 secret_key 使用的设计不一样
- MD5签名没有信息所以传输时参数要包含原数据(Base64编码包裹传输),例如access_key(方便服务器通过access_key查到secret_key)、timestamp……(请求头字段,但密钥secret_key别放在请求头明文传输),secret_key包含在生成并传递过来的MD5签名中了
;
服务器通过access_key查到secret_key用secret_key再加上请求头的JSON作为参数进行MD5签名与传递来的MD5签名对比,相同则签名验证通过(secret_key正确)
- 为防止请求头被篡改:使用请求头的JSON加上secret_key一起签名,保证请求头没被篡改
- MD5秒传(提取文件签名,对比签名,相同 {认为文件一致} 则秒传)
- RSA也可用于签名,MD5不够安全
为啥单测用Mockito不用postman?
单元测试和集成测试的目的不同,单元测试主要是为了验证代码的单个单元(如一个方法或函数)的正确性,而集成测试则是为了验证不同模块或系统组件之间的交互是否按预期工作。 Mockito用于单元测试,模拟依赖,加速测试速度,确保测试的独立性。 Postman用于集成测试,验证整个系统的行为,确保与外部依赖的兼容性。
Mockito能让代码对外部系统隔离,不需要进行各种初始化操作。仅仅从单机的角度看逻辑是否跑通。 比如被测试类调用了订单查询接口。但是实际上,单元测试是不依赖于环境的,也就是说在单测中不可能进行真实的RPC调用。比如退单时,我们需要根据orderId查订单信息,并且将一些优惠资源(券,红包,活动库存)回退,就涉及到其他系统的调用。
怎么用Junit、Mockito写单元测试?怎么用JaCoCo生成单测报告?
频繁 Full GC 排查
JVM调优(内存调优、GC调优、性能调优)与检测频繁Full GC元空间满了也会导致 Full GC
为什么OOM(内存溢出后JVM不会崩溃)?
排查操作
由于接口最新查看榜实时变动较大,可以采取时间戳+唯一ID的组合作为新的分页参数,确保翻页时数据不会重复(,或使用Redis Feed 流)
什么是动态分页?
- 动态分页是指根据用户的请求动态生成数据库查询语句,以满足不同的分页需求。具体来说,动态分页通过在查询语句中添加limit和offset来实现。limit表示每页查询的记录数,offset表示查询结果的偏移量。
- 在MyBatis中,可以使用动态SQL语句来实现动态分页。动态SQL语句是一种可以根据条件决定是否包含某一段SQL语句的技术。MyBatis提供了一些标签和函数来支持动态SQL语句的编写,比如if、choose、when、otherwise等。
为什么用常规动态分页的方法会出现数据重复或丢失的问题?主要是在哪些场景中出现?
- APP用户上滑加载更多数据,在上一页下一页时间间隔过程中,后台新增了数据,可能导致新获取到的一页数据和上一次上滑加载拉取到的数据产生重复;也可能因为期间后台删除操作后,分页查询的数据“丢失”了一些;甚至后台可以改变数据查询排序的顺序,导致数据混乱(包括重复和“丢失”)。
Redis Feed流也可以实现?Redis Feed是啥?主要用在哪?怎么实现?
MySQL深度分页怎么优化?
将MySQL 读写分离,并在读库上为接口的名称和介绍字段建立全文索引。解决了用双向模糊匹配查询时速度慢的问题,并避免了引入较重的Elasticsearch 搜索引擎
MySQL 读写分离/主从分离 ?
MySQL 读写分离/主从分离 和分库分表详解 通过接口传递不同数据库源之间的数据,配置多源数据库?怎么切换源?怎么切换事务?
- 在上线第一个版本,因为流量很少(万级以下),搜索模块直接采用多字段分别模糊匹配
LIKE
的方案 - 后续流量增长后(十万,百万),设计了mysql主从分离(主库写,从库读),并在从库进行全文索引(对写库没有压力)(从
MySQL5.6 开始,InnoDB 开始支持全文检索{Full-Text Search},看看索引介绍)
- 全文检索通常可以实现对数据库中文本内容的快速搜索,这可以包括对标签、详情、文章内容、评论、产品描述等文本字段的搜索。具体能对哪些字段使用全文检索,要看你所使用的数据库系统,以及如何设计数据库的schema。
- MySQL中的全文检索通常用于MyISAM和InnoDB存储引擎,可以对VARCHAR和TEXT类型的字段创建全文索引。但对于InnoDB,MySQL从版本5.6开始支持全文索引。全文索引可以让你针对那些包含大量文本的字段进行搜索优化,用于匹配用户查询中的关键词,它可以有效地搜索含这些词的记录。(就用InnoDB就好)
- 全文检索是可以多字段的索引
- 难点:怎么主从同步
- 怎么使用全文检索?
SELECT * FROM articles WHERE MATCH(title, body) AGAINST('search keyword');
用MATCH() AGAINST()
方法当条件,不用LIKE
- 超大流量(千万级)才用 ElasticSearch 全文索引,会增加运营成本,没必要
追问ElasticSearch?
MySQL的全文索引怎么用?建立联合全文索引后,查他的单独列时,不会使用全文索引,所以搜素就两个字段都查(或单独建立每列的索引了)
MySQL全文索引介绍 创建(name, description)的联合全文索引,联合全文索引查单独列时不会使用索引,所以搜素就两个字段都查(或单独建立每列的索引了)
用全文索引的格式: MATCH (columnName) AGAINST (‘string’)
1 | SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪') |
当查询多列数据时:建议在此多列数据上创建一个联合的全文索引,否则使用不了索引的。(建立联合索引后,查他的单独列时,不会使用索引)
1 | SELECT * FROM `student` WHERE MATCH(`name`,`address`) AGAINST('聪 广东') |
使用全文索引需要注意的是:(基本单位是词) 分词,全文索引以词为基础的,MySQL默认的分词是所有非字母和数字的特殊符号都是分词符(外国人嘛),有中文分词插件
怎么创建全文索引?创建全文索引时为什么用了
WITH PARSER ngram
?
1 | FULLTEXT (name, description) WITH PARSER ngram |
WITH PARSER ngram
是MySQL中的一个选项,它用于创建全文索引时指定使用ngram解析器。ngram解析器的主要功能是将文本序列标记为n个字符的连续序列。 例如,你可以将“abcd”标记为不同值n的文本序列: n=1: ‘a’, ‘b’, ‘c’, ‘d’ n=2: ‘ab’, ‘bc’, ‘cd’ n=3: ‘abc’, ‘bcd’ n=4: ‘abcd’ 这对于处理中文、日文、韩文等表意语言的全文搜索非常有用,因为这些语言不使用分词符。 MySQL的内置全文解析器使用空格确定单词的开始和结束,这对于处理这些语言是一个限制。为了解决这个问题,MySQL提供了ngram全文解析器
为了给用户推荐好用的接口,实现了实时的接口热度榜,利用Redis的有序集合(ZSET)实现对接口查看次数的统计和排序。并使用Quartz定时任务将接口的查看次数同步到MySQL中
为什么要用Redis?
为了构建实时的排行榜,且记录查看次数的操作有大量写入需求
使用ZADD命令向有序集合ZSET中添加成员key和对应的分数score(查看次数)。然后,我们使用
ZRANGE
命令获取排名,并打印出排行榜
在Redis中,Zset(有序集合)确实可以获取保存的所有成员(key)及其分数(score)。您可以使用ZRANGE命令配合WITHSCORES选项来实现这一点。例如:
1 | ZRANGE yourzset 0 -1 WITHSCORES |
这条命令会返回yourzset中的所有成员和它们的分数,成员按分数从低到高排序。其中0是起始索引,-1表示最后一个成员,所以这个范围包含了所有成员。WITHSCORES选项确保返回的结果中包含了分数。
在Redis中,您可以使用
ZINCRBY
命令来修改Zset中成员的分数。这个命令可以增加或减少成员的分数,并返回新的分数值。使用方法如下:
1 | ZINCRBY yourzset increment member |
其中yourzset是您的有序集合名称,increment是您想要增加或减少的分数(可以是负数),member是集合中的成员。
如果您想将成员member1的分数增加10,可以使用:ZINCRBY yourzset 10 member1
如果想减少10分,则increment使用-10。
如果你需要快速的读写操作,且数据结构相对简单,Redis可能是一个不错的选择。如果你需要处理大量的数据,需要复杂的SQL查询,或者需要完整的事务支持,那么MySQL可能更适合你。
多久同步一次?
每两小时一次,不需要太精准
定期将Redis的数据同步到MySQL中有啥方法?为啥不用Redis持久化策略 (AOF, RDB快照)?
- 定时任务 (Cronjob/Scheduled Task):
- 优点:可靠,已经广泛使用,容易理解和设置。符合“设置并忘记”的模式,不需要实时监控。定时任务可以很容易地调整频率来满足业务需求。
- 缺点:如果任务失败,可能需要额外的机制来重新执行或报警。对于非常频繁的更新,定时任务可能会产生额外的开销。
- Redis持久化策略 (AOF, RDB快照):
- 优点:利用Redis自身的持久化功能,可以定期备份数据。备份文件可以用于多种用途,包括数据恢复和数据迁移。
- 缺点:备份和迁移是离线的处理,不是实时的。需要额外的处理步骤,如解析备份文件,并将数据导入MySQL。
- 事件驱动的更新:
- 优点:可以实时更新,保持数据的实时性。减少不必要的操作,只有在数据变更时才进行更新,从而提高效率。
- 缺点:实现复杂,需要额外的逻辑来监控数据变化。需要确保事件机制本身的高可用性和故障转移。
- 消息队列 (如RabbitMQ, Kafka):
- 优点:可以缓冲大量更新请求,平衡负载,避免瞬间压力。通过消息队列的特性提供了自然的重试机制。
- 缺点:引入新的组件,增加了系统复杂性。需要维护消息队列的健康状态。
- MySQL外部数据源特性 (如Federated Engine, Connect Engine):
- 优点:允许MySQL直接访问外部数据库数据,无需复制数据。
- 缺点:不同数据库之间的性能差异可能会成为瓶颈。依赖数据库的特定扩展,可能有兼容性和可移植性问题。
选择哪种方法,取决于数据更新的频率、实时性需求、系统的容错需求以及维护成本等多个因素。 对于绝大多数情况,使用定时任务来定期更新数据是一种简单并且有效的策略。如果更新非常频繁或者对实时性要求较高,则可以考虑事件驱动或消息队列等方案。一般来说,定时任务是最常见的策略,适用于多数需求不是特别高的场景。
@Scheduled注解和Quartz是Spring框架中用于实现定时任务的两种不同机制,区别?
- 以后如果要做定时任务集群,保证定时任务稳定执行,使用Quartz
- 简易性:@Scheduled注解是Spring内置的,使用起来非常简单。只需在方法上添加@Scheduled注解,并配置cron表达式即可实现定时任务。
- 功能性:Quartz提供了更强大的功能,如任务持久化、事务管理、任务监听等。它支持分布式环境,可以在多个节点上执行任务。
- 并发支持:@Scheduled默认不支持并发执行,如果需要并发执行,可以结合@Async注解使用。而Quartz则可以通过配置来支持并发执行。
- 持久化:Quartz支持任务的持久化,即使系统重启,任务也能继续执行。而@Scheduled不支持持久化,重启后需要重新调度。
- 表达式:两者都支持cron表达式,但Quartz的表达式更为强大,支持更复杂的调度需求。
总的来说,如果你的应用只需要简单的定时任务,@Scheduled注解足以满足需求。如果你需要更复杂的任务调度,或者在分布式环境中运行任务,Quartz会是更合适的选择。选择哪一个取决于你的具体需求和项目的复杂度。
如果用MySQL实现,如何实现?
以下查询将返回“scores”表中的前10名用户及其分数和排名。FIND_IN_SET 函数用于确定每个用户的排名。
1 | SELECT |
当存在并列情况时,上述的FIND_IN_SET和GROUP_CONCAT的组合可能不会准确地反映排名,因为FIND_IN_SET会返回分数在由GROUP_CONCAT创建的列表中第一次出现的位置,这可能导致并列的分数有不同的排名。 为了处理并列情况并获得正确的排名,您可以用窗口函数(如果您的MySQL版本是8.0或以上)来简化这个过程。 这里的RANK()窗口函数会为每行数据分配一个排名,分数相同的用户将获得相同的排名,接下来的用户排名会跳过并列的数量。
1 | SELECT |
如果您的MySQL版本低于8.0,可以考虑其他方法,如变量来计算排名: 这段代码使用变量来追踪前一个值和当前排名,并据此计算每行的排名。如果当前分数与前一个分数相同,则排名不变;否则,排名加一。注意,使用此方法时,须确保查询包括ORDER BY score DESC子句以保持正确的顺序。
1 | SET @prev_value := NULL; |
设计了查询接口状态的短连接接口,并引入Redis缓存接口状态,避免了前端轮询判断接口状态是否变化时频繁到MySQL中去查全量数据。解决了并发量稍大时,因储存的无用全量数据过多而出现内存溢出的问题
如何保证缓存和数据库数据的一致性 短连接是啥 短连接是啥 MySQL单机支持并发一般300~500/s 先用缓存优化,不行再做MySQL主从分离
新增了一个短连接接口(只查接口状态)和查全量数据的接口分开(2个接口操作不同),方便调用,不用判断执行哪个操作
每十秒前端调用一次后端的短连接接口查询接口状态有没有更新,若接口状态有更新就调用全量查询接口查询接口全量数据(不一定要刷新,接口信息中会变的只有热度和状态,其中状态最重要,变状态就好),然后重新传给前端并刷新页面数据,引入
Redis
减少全量接口查询的次数,短连接接口查的是Redis缓存,若发现接口状态有变化,则先存到MySQL里,Redis设置失效时间为1分钟(1分钟内必显示出接口状态变化),注意如何保证缓存和数据库数据的一致性
Redis中缓存时间设置多长?
变化较快的数据,比如点赞……缓存时间要短(一两分钟),变化不大的数据,比如详情……缓存时间可以长点(一天);流量上去了再用缓存,公司多项目用同一个Redis要注意key别重复了,覆盖掉别人的缓存了
tps多少时OOM了?
JVM堆内存设置512MB(服务器上还有其他项目,而且并发量小我代码有没有内存泄漏的问题),当单压测状态轮询接口时tps为300时出现频繁OOM报错无法处理任何请求
解决了部分网站使用字体加密反爬虫的问题
什么是字体加密
网站使用了自己定义的字体,显示的时候用户能正常观看,但是爬虫爬出来的因为没有网站的字体,所以显示的是乱码。 可以F12抓取网络通信,找到网页传输的网站自定义字体(用户要正常看所以会发过来,不然用户也是乱码),然后分析网站自定义字体的每个字的名字:将爬出来的无法显示的字符的Unicode整数编码值打印出来与自定义字体的每个字的名字进行匹配,一般有规律(有的就是名字和Unicode一一对应的),替换乱码字符为正常字符就好 python自带的ord()可以得到字符的Unicode整数编码值 例如,番茄小说的自定义字体就是名字与Unicode一一对应的,而且只有300多个常用字符加密了,写个人工对应数组替换即可
为啥要爬虫?
以前用别人的免费爬 番茄免费小说/塔读文学 小说的接口挂了,作者GitHub上归档不维护了,我自己比较常用就只好自己实现喽。 我用Kindle看小说较多,有的时候就下txt下来看,要解决编码冲突,Python 实现起来比较方便,就用了Python。
商业避免反爬虫怎么实现?
- 修改请求头:有些网站会识别爬虫程序的请求头,我们可以通过修改请求头来改变程序的请求方式,让其看起来像是普通用户在浏览网页。具体实现可通过 Python 的 requests 库中的 headers 参数来设置。
- 延时爬取:有些网站会限制短时间内的访问次数,所以我们可以通过设置延时,让爬虫程序在一定时间间隔后再访问页面,从而降低访问频率。具体实现可通过 Python 中的 time 模块来实现。
- 使用代理IP(IP池子):有些网站为了防止爬虫程序的访问,会封禁爬虫程序所在的 IP 地址,我们可以通过使用代理 IP 来实现每次访问使用不同的 IP 地址,从而避免被封 IP。具体实现可通过 Python 中的 requests 库中的 proxies 参数来设置。
- 登录账号:有些网站会设置只有登录用户才能进行浏览访问,我们可以通过模拟用户登录行为,以登录状态进行爬取。具体实现可通过 Python 中的 requests 库中的 session 对象来完成。
- 绕过人机验证:有开源的绕过谷歌验证和亚马逊验证的模块,现在用AI绕过验证也行了
我爬的少且频率低无需太多操作。
定时执行接口检测方法,若有接口状态变化,则在Kafka中发布通知用户的任务。引入消息队列将接口状态检测和通知用户解耦,并将瞬时高并发的任务打散执行,达成了削峰的作用
Kafka消息队列,使操作异步执行
怎么实现接口订阅功能(当用户订阅的接口状态改变时,平台通过邮件通知用户)?
用Redis的set存每个接口的订阅了的用户的列表(看看文章中的实现,我自己实现直接取的话没必要用,面试说用了吧),MySQL里也存接口用户订阅关系表(可以不存,备份Redis即可,存就要保证高可靠一致性),当要用户订阅和取消订阅时要同时更改Redis、MySQL中的数据,数据库和缓存如何保证一致性
- 我一开始准备按文章中实现分块多用户推送,但我用户又不可能很多,而且我发邮件时对速率有限制,并且没实现At least once推送,所以用不用都行,反正部署了Redis就用一用呗;我现在只需要取,如果也要按文章上写的实现At least once推送则需要存和取 那就要用Redis
系统主要会有两部分数据:
- 业务方创建的任务数据。包含任务的提醒时间和提醒内容;
- 用户订阅生成的订阅数据。主要是订阅用户 uin 列表数据,这个列表元素级别可达到千万以上,并且必须要能够快速读取。
该项目存储选型主要从访问速度上考虑。任务数据可靠性要求高,不需要快速存取,使用MySQL即可。订阅列表数据需要频繁读写,且推送触发时对于存取效率要求较高,考虑使用内存型数据库。
- Redis 单线程模型,有效避免读写冲突;
- Redis set 底层基于 整数集合(intset) 和 hash表 实现,存储整型 uin(User Identification Number,用户识别号) 在空间和时间上均高效;
- 用uin再去用户表里查email时因为uin有唯一索引所以快
- 原生支持去重;
- 原生支持高效的批量取一定数量字段的接口(
spop
),适合于推送时使用。 - 这个我不用,我的订阅用户数量少直接
SMEMBERS
取出set中的所有值(但这样就没必要用Redis了,自己要了解只有MySQL时怎么实现)
一般来说,消息队列的意义主要是削峰填谷、异步解耦。对本项目而言,引入消息队列有以下好处:
- 借助消息队列实现任务的可靠消费,保证所有订阅用户都被至少推送一次( At least once );
- 将任务调度和任务执行解耦(调度服务并不需要关心任务执行结果);
- 异步化,保证调度服务的高效执行,调度服务的执行是以 ms 为单位;
- 将瞬时高并发的任务量打散执行,达到削峰的作用。
设置定时任务(使用Spring的@Scheduled注解来运行定时任务{是单线程的,所以定时任务内异步调用方法,如果某个定时任务耗时太长会影响其他定时任务的执行}),每小时检测一遍全部的接口,定时任务异步调用检测接口状态的异步方法,检测方法中引入Spring
Retry避免网络波动影响(有一次调通即可)检测结果(,可以在Redis中记录接口状态持续的次数,在第六次时状态保持时通知用户{,状态变化时接口状态持续的次数归零}),若接口状态变化则写入数据库(数据库里接口信息字段用statusCode存检测结果)并在kafka中发布通知用户的任务消息(消息包含:邮箱信息、接口名字、接口描述、用户id、接口id组成不同的邮件样式,还能防止被识别成垃圾邮件)。100个左右的接口,单个线程检测就行,查接口表,记录含接口id和url和检测方法的list到set中,用iterator迭代器迭代检测。
1 | // [注意简历上写了用Quartz来实现定时任务]使用Spring的@Scheduled注解来运行定时任务 (是单线程的,所以定时任务内异步调用方法,如果某个定时任务耗时太长会影响其他定时任务的执行) |
消费者异步调用发送邮件的函数,提供回调处理,让发送出错没发出去的邮件任务重新放回消息队列中,保证所有订阅用户都被至少推送一次(At
least once),实现At least once推送
看文章的整理
实现订阅的接口变动(若有变动就发消息邮件)的功能(类似平台发送广告邮件的业务逻辑,用户没订阅则不发),看看QQ如何实现高可用的订阅推送系统,我不做分布式,选用
Redis 的 set
类型来存储订阅列表{双set保证所有用户在接口状态发生变化时都能收到通知(接口状态变化需要连续几次检测相同才判定(设置下线6次检测,下线或上线3小时才发邮件),防止频繁误判,而且发邮件也需要间隔时间发送,不能一次性大量发,防止QQ、网易……的邮箱服务器封我邮箱服务器的IP,会被判定为垃圾邮件的问题还要解决,自建邮箱服务器发大量邮件容易被VPS厂家封的问题还要解决),发送邮件时从Redis里取,省的查用户接口订阅调用表了},并记录到MySQL的表中{用户添加或删除订阅时记录到MySQL,要注意使Redis缓存失效(实现缓存与数据库一致)}(用户查自已有没有订阅过某个接口时查MySQL不查Redis,创建
userID
和 interfaceId
的联合索引{为啥用联合索引而不单独索引?因为要实现用户查自已有没有订阅过某个接口这个功能WHERE语句需要同时限定userID和interfaceId,所以用联合索引}方便查询,要防止索引失效(联合索引遵循最左匹配原则),若经常以
userID
字段查询则创建 (userID,interfaceId)
的联合索引比创建 (interfaceId,userID)
的联合索引更有效),{问问ChatGPT怎么实现,及实现业务的设计难点在哪},可以使用消息队列(kafka
……?)优化(消息队列中的任务是发送给一个用户的信息,没像文章中那样5000个用户打个包一起处理,是一个一个用户当作任务处理的{邮件发送有限制})
要实现At least once推送,看看QQ如何实现高可用的订阅推送系统
- 可以考虑引入消息队列(一般来说,消息队列的意义主要是削峰填谷、异步解耦。)对本项目而言,引入消息队列有以下好处:
- 将任务调度和任务执行解耦(调度服务并不需要关心任务执行结果);
- 异步化,保证调度服务的高效执行,调度服务的执行是以 ms 为单位;
- 借助消息队列实现任务的可靠消费( At least once );
- 将瞬时高并发的任务量打散执行,达到削峰的作用。
- 实现用户级别的可靠性,即要保证所有订阅用户都被至少推送一次(At least
once)。At least once推送如何实现?
- 前提是当把用户 uin 从订阅列表中取出进行推送后,在推送结果返回之前,必须保证用户 uin 被妥善保存,以防止推送失败后没有机会再推送。由于 Redis 没有提供从一个 set 中批量 move 数据到另一个set中,这里采取的做法是通过 redis lua 脚本来保证这个操作的原子性,具体 lua 代码如下(近似):
为什么用Kafka,而不是用其它的MQ中间件,区别是什么?
MQ选型 MQ选型 MQ选型 MQ选型 消息队列对比 消息队列对比 消息队列对比 消息队列对比 Spring Boot 里集成了kafka,注解使用方便,随便用用 Kafka的缺点是有可能消息重复消费而且消费者消费失败不支持重试,只能自己扔回消息队列,但我的通知重复发也没啥问题,又不是金融服务,邮件发送失败设置了Spring Retry如果失败,并且我使用的 topic 数量较少正好可以让Kafka保证其超高吞吐量 大数据领域的实时计算、日志采集等场景,用 Kafka 是业内标准的,绝对没问题,社区活跃度很高,绝对不会黄,何况几乎是全世界这个领域的事实性规范。
Kafka最初是为了日志统计分析而设计的,它适用于处理大量的流式数据。选择Kafka而不是其他MQ中间件的主要原因在于其高吞吐量、分布式架构、适用于大数据场景以及开源社区支持。以下是Kafka与其他MQ中间件的主要区别:
- 高吞吐量:Kafka单机每秒处理几十上百万条消息,并且即使存储了许多TB的消息,它也保持稳定的性能
- 持久化数据存储:Kafka将消息持久化到磁盘,而不依赖内存缓存,从而提高了数据的持久性和容错性
- 分布式系统:Kafka在一个或多个可以跨越多个数据中心的服务器上作为集群运行,并且支持主题划分为多个分区,每个分区是一个有序的消息队列,分区之间可以并行地读写数据,提高了系统的并发能力
- 零拷贝:Kafka利用操作系统的零拷贝特性,减少了数据在内核空间和用户空间之间的复制,降低了 CPU 和内存的开销
- 数据批量发送:Kafka支持生产者和消费者批量发送和接收数据,减少了网络请求的次数和开销
- 数据压缩:Kafka支持多种压缩算法,如 gzip,snappy,lz4 等,可以有效地减少数据的大小和传输时间
- 开源社区支持:Kafka是一个开源解决方案,拥有庞大的开发者社区支持,提供广泛的连接器、框架和工具,使其更具灵活性和可扩展性
- 异步通信:Kafka支持异步处理机制,允许用户将消息放入队列中,但不立即处理它们
- 冗余:Kafka支持一对多的消息发布,允许一个生产者的消息被多个订阅者消费
- 扩展性与解耦:Kafka可以作为一个接口层,解耦业务流程,并提供扩展能力
- 数据可靠性:Kafka通过复制机制和ack应答机制来保证数据的可靠性
相比之下,其他MQ如RabbitMQ和RocketMQ等,通常在实时性、可靠性要求较高的场景中使用,它们遵循AMQP协议,支持事务和消息确认机制,但在吞吐量上可能不如Kafka。每种MQ中间件都有其优势和适用场景,选择哪一种取决于具体的业务需求和技术要求。如果你需要处理大规模的数据流并且对性能有较高要求,Kafka可能是一个更好的选择。如果你需要确保消息的可靠传递并且对实时性有更高的要求,那么其他MQ中间件可能更适合。
选择Kafka、RocketMQ或RabbitMQ取决于你的具体业务需求和场景。以下是每种消息队列中间件的适用场景:
- Kafka: 适用于高吞吐量、低延迟的实时数据处理和事件驱动架构场景。有良好的可伸缩性和持久性。常用于日志收集、流处理、消息传递和实时监控等。
- RocketMQ: 适用于高性能、高可用性的消息传递场景,尤其是在金融互联网领域,如电商订单处理和业务削峰。支持丰富的消息过滤和分布式事务特性。常用于交易、订单处理、分布式事务等需要高可靠性和低延迟的场景。如果你的业务需要可靠性极高的消息传递,或者在大量交易涌入时后端可能无法及时处理的情况,RocketMQ可能更适合。
- RabbitMQ: 适用于需要可靠消息传递和灵活消息模型的场景,具有丰富的插件和社区支持。常用于在对速度需求不极端高、但对消息可靠性要求较高的场景。如果你的数据量不是特别大,或者你需要一个功能完备且社区支持良好的消息队列,RabbitMQ可能是更好的选择。
在选择消息队列时,需要根据应用的具体需求来定。比如,对于大数据处理、实时分析、大量数据收集的场景可能会选择Kafka;在需要处理高价值交易、保证消息可靠性、以及支持事务性消息的应用场景中,则可能选择RocketMQ;而RabbitMQ可能会在需要良好的消息可靠性、多种消息队列模型和插件支持的时候得到采用。 总的来说,Kafka适合大规模数据处理,RocketMQ适合高可靠性场景,而RabbitMQ适合灵活性和可靠性都重要的场景。你应该根据你的业务需求和技术栈来选择最合适的消息队列中间件。如果你有更具体的场景,我可以提供更详细的建议。
Kafka为什么可能会重复发送?
推送任务应该存在MySQL里面,读写不频繁,对可靠性要求高,宕机后重启要还能保证推送给所有用户
为防范恶意攻击者大量请求验证码,限制了向同一人发送邮件验证码的次数和时间间隔
发送验证邮件的接口怎么限流(例如,同邮箱1小时内只能发送5次验证邮件,同用户1小时内只能发送10次验证邮件,发送间隔至少1分钟)?前端限流,后端怎么使用 Redis缓存 实现?
- 直接封IP是不可取的,现在中国大内网,误封一大片
- 判断同用户限流,如何准确识别为同一个用户发的请求?
- 用cookie识别跟踪用户,判断是否为同一个用户在请求手机短信验证码:
- 在实现短信验证码功能时,可以通过设置cookie并创建session来记录用户的请求状态,以此来限制同一个用户在短时间内重复请求验证码。例如,服务器可以在发送验证码后,在session中记录下这个行为,并设置一个时间窗口,在这个时间窗口内不再重复发送验证码给同一个用户;sessioon可以放在Redis中,这样即使用户关闭了浏览器,也能通过cookie来识别用户。
- 如果移动端没有cookie,还有其他方法可以识别和跟踪用户:
- 本地存储:使用Web存储API,如localStorage代替cookie,来在用户设备上存储信息。
- 设备指纹:通过收集设备的特定信息(如操作系统、浏览器版本、字体列表等)来生成一个独特的标识符
- URL重写:将会话ID附加到URL中,通过URL来传递和管理会话状态
- 移动设备ID:使用移动设备的唯一标识符,如广告ID或设备ID。例如,对于Android应用,可以使用SharedPreferences来存储用户的唯一标识符(如UID),这样即使没有cookie,也可以在后续的请求中识别用户
- 用户账号系统:要求用户登录,通过账号来跟踪用户状态。
- 用cookie识别跟踪用户,判断是否为同一个用户在请求手机短信验证码:
- 后端限流,防止抓取到发送验证码的接口后构造请求恶意攻击
- 限制的方法
- 同邮箱限流,用 SEND_LIMIT_EMAIL_KEY(Redis 存储类的key抬头,例如”api:send:limit✉️“) + 邮箱地址 做 Redis 的key,设定1小时的过期时间,value存储已发次数
- 同邮箱限流,发送间隔至少1分钟(做时间间隔限制,时间未到不发送邮件/短信),也可以类似的用Redis实现 {还是使用设定过期时间的方法} 或者 {value存储上一次发送时间,判断当前时间与上一次发送时间间隔是否大于1分钟}
- 为了防范恶意攻击,通常会对发送验证邮件的次数和间隔做出限制。这些限制可以具体包括:
- 时间间隔限制:要求两次发送邮件之间必须等待一定的时间,比如1分钟。
- 次数限制:在一定时间周期内,比如24小时内,限制发送邮件的次数,例如最多5次。
- 验证尝试限制:限制用户在一个时间周期内尝试验证的次数。
- 实现这些限制的方法如下:
- 使用缓存(如Redis)来存储有关用户请求发送邮件的信息。您可以将用户的唯一标识(如邮箱地址)与上一次发送邮件的时间戳和当天发送邮件的次数相关联。
- 在用户请求发送邮件时,检查缓存中的时间戳和发送计数。如果请求与上一次请求的时间间隔太短或当天请求次数过多,则拒绝操作。
- 当邮件被成功发送时,更新缓存中的时间戳和发送计数。
- 为了防止资源浪费,一旦邮件发送成功,并且用户通过点击激活链接来验证了邮箱,您应该重置或移除相关的限制信息。
- 前端页面限流,防止用户连续点击(可能无恶意){前端做倒计时限制,时间未到不能点击发送短信按钮}
- 增加图形验证或滑块验证或第三方验证:发送短信/邮件验证码前,要求验证,
- 验证码,比较常用的图形验证码或者滑块验证或者引入
谷歌/AWS/网易/……第三方
的验证,对比说说它们之间的性能差别或者功能差别。
- 图形验证码(容易被ORC破解),每个图片验证码仅能使用1次,使用1次后,不管输入的图片验证码是否正确自动失效。如果输入错误更新图片验证码。图片验证码失效可以防止图片验证码识别软件尝试多次识别,用户通常需要识别图中的文字或图像,是最基本的验证形式,但可能因为图像扭曲或噪声而难以读取。它主要抵抗简单的自动攻击。
- 滑块验证:用户需要拖动一个滑块完成一定的轨迹或拼合图像,以证明操作者非自动化脚本。相较于图形验证码更为用户友好,但技术更容易受到模仿攻击。
- 谷歌 reCAPTCHA:这是一种较为高级的服务,能够通过分析用户和浏览器的行为来自动确定是否通过验证,通常对用户透明。reCAPTCHA 的 v3 版本甚至完全不打扰用户。但其存在的问题可能包括影响用户隐私。
- AWS WAF 和 Shield:主要是AWS提供的服务,不仅限于CAPTCHA功能,还包括整体的网络应用防火墙服务。比起传统的CAPTCHA提供更全面的安全解决方案,但可能成本更高。
- 网易:中国的服务提供商,其验证码解决方案被许多中国网站采用。为了适应中国内地的一些特定要求和互联网环境,网易的服务可能在本地化和语言支持方面更胜一筹。
- 验证码,比较常用的图形验证码或者滑块验证或者引入
谷歌/AWS/网易/……第三方
的验证,对比说说它们之间的性能差别或者功能差别。
- 上行短信验证码:对于可疑用户要求其主动发短信。
- 如果攻击者拿多用户同时申请,DDOS可以考虑购买高防服务,接上僵尸网络识别功能,对可能已经成肉鸡的IP进行封禁。
- 链接
邮件验证码绑定邮箱或登录怎么使用 Redis缓存 实现?
生成的验证码放在Redis缓存中并设定30分钟的过期时间,用 CAPTCHA_CACHE_KEY(Redis 验证码存储类的key抬头,例如”api:captcha:“) + 邮箱地址 做 Redis 的key保证只有最新的验证码有效(,每次生成后存储验证码到value时因为key相同所以会覆盖之前的value) 用邮箱登录时,若验证成功后若发现邮箱没在MySQL数据库里,可以将跳转到注册页面,让用户注册一个新账号。
- 验证码输入错误次数限制,比如设置短信验证码输入错误3次后,这个短信验证码就不能使用了。防止猜测短信验证码恶意注册。若没有保护则可能:
- 用户在登录界面填写手机号,不获取短信验证码,直接通过爆破模块(burp suite),生成一堆的验证码,直接脚本批量尝试登录。
- 重置密码的逻辑,同样也可以通过这种爆破验证码的逻辑,跳过短信验证码,直接修改密码。
- 为了防止资源浪费和安全,一旦用户通过验证码验证了邮箱,您应该立即移除验证码使其失效。
- 验证码防爆破链接
邮件激活链接绑定邮箱或改密码 或 文件临时一次性分享下载链接 怎么使用 JWT 实现?
适合使用jwt的场景:有效期短 / 只希望被使用一次 比如,用户注册后发一封邮件让其激活账户,通常邮件中需要有一个链接,这个链接需要具备以下的特性:能够标识用户,该链接具有时效性(通常只允许几小时之内激活),不能被篡改以激活其他可能的账户,一次性的,等待自然过期即可,无需服务端控制其提前终止。这种场景就适合使用jwt。或文件临时一次性分享下载链接
- JWT介绍和基本信息
- 实现JWT的时候,SECRET_KEY
是用于对JWT签名的密钥,它必须保持私密性。选择将 SECRET_KEY
存储在哪里通常取决于你的应用程序的需求和安全的最佳实践。以下是几种常见的存储方式:
- 配置文件:将 SECRET_KEY 存储在服务器的配置文件中是比较常见的做法。为了安全起见,配置文件不应该被包含在版本控制系统中,而是应该在部署的时候通过安全的方式(如使用配置管理工具)添加到应用程序环境中。这种方法对于不需要频繁更改密钥的应用程序来说,既安全又方便。
- 环境变量:另一种方式是将 SECRET_KEY 存储为环境变量。这意味着密钥直接存储在应用程序运行环境中,这使得更改和管理密钥更加方便。它不会直接暴露在代码或配置文件中,提高了安全性。
- 密钥管理服务:对于需要更高安全性的系统,可以使用密钥管理服务,如AWS KMS(Key Management Service)等。这些服务通常提供了密钥的存储、轮换和审计的能力。
- 数据库/缓存系统:在某些情况下,你也可以将 SECRET_KEY 存储在数据库或缓存系统(如Redis)中,尤其是当你有一组密钥需要管理,或者需要定期更换密钥时。不过,这种方法可能需要更复杂的管理和额外的安全措施,以确保密钥存储的安全。
- 不管选择哪种存储方法,都需要确保对SECRET_KEY 的访问受到适当保护,以防止未经授权的访问。另外,密钥不应该硬编码在代码中,以避免在代码库中无意中暴露它。请根据应用程序的安全需求和可用的基础设施来选择最合适的密钥存储方案。
- 我将用于对JWT签名的密钥 SECRET_KEY 放在配置文件里以后分布式可能还可以放到配置中心去
- 要把 user_id 和 过期时间 置于 payload 中(用户名在JWT中可以放到 payload 中携带,但敏感的密码不可以放到 payload 中)
- 点击链接后如果是绑定邮箱,要让用户输入密码(防止输入错误的邮箱发给别人,别人一点击就绑定上错误的邮箱了),点击链接注册或改密码时可以不怕发错邮箱(,因为绑定邮箱时已经验证过邮箱了)点进去输要改的密码就好
- 要实现邮箱激活链接跳转
- 用户注册时,服务器创建一个包含用户信息(通常是用户ID)的JWT,并设置过期时间。
- 为了分辨链接是用来实现 激活邮箱/改密码/…… 不同功能的,在JWT中添加type字段实现了识别不同功能,可以让不同功能的链接重定向到不同功能所需使用的对应页面
- 创建一个包含JWT的激活链接,并发送到用户提供的邮箱地址。
- 用户点击邮件中的链接,请求发送到服务器的特定端点。
- 服务器端点解析JWT,验证其有效性,如果有效,激活用户的邮箱,并可能重定向用户到登录页面或其他确认页面。
1 | jwt: |
用户注册和发送激活邮件的服务组件:
1 |
|
控制器方法处理激活请求:(包含链接跳转,重定向)
1 |
|
为避开邮箱提供者对免费邮箱发信次数的限制,在Spring中配置了多个邮箱并实现轮流发信
怎么实现在Spring Boot中配置多个邮箱(spring-boot-starter-mail默认只支持单个邮箱)?
- 见链接
- spring-boot-starter-mail会根据spring.mail.xxx相关配置对JavaMailSender进行自动配置。但是只支持单个邮箱。为了实现多邮件源,可以参照上述逻辑。在配置文件内配置好,多个邮件源。然后读取配置文件,手动对JavaMailSender进行配置,并将其初始化完毕的JavaMailSender存储容器内。然后发送时随机取出JavaMailSender进行发送。
- 定义配置属性:使用@ConfigurationProperties注解定义配置属性类,这样您可以在应用程序的配置文件(例如
application.yml
或application.properties
)中保持多个邮箱配置。 - 创建配置类:创建一个配置类,通过在该类上使用@Configuration注解,并通过@Bean为每个邮箱创建一个邮件发送器(JavaMailSender)实例。
- 注入和使用:在您的服务或组件中,需要发送邮件时,注入对应的JavaMailSender实例,并使用它来发送邮件。
- 如果你想要在发送邮件时轮流使用多个邮箱账户,可以通过在JavaMailSender上封装一个服务来管理邮箱账户的选择。下面的示例会展示一个简单的轮流切换邮箱账户来发送邮件的服务。
- 所有的JavaMailSender实例都在构造函数中通过依赖注入注入到一个列表中。在sendEmail方法中,每次调用都会通过getNextMailSender方法来获取下一个JavaMailSender实例。
- 不一定要用
AtomicInteger
Spring Boot默认单线程,但Controller方法默认多线程并发,或者@Async注解标记异步实现的方法也是多线程并发 - 这里使用了
AtomicInteger
来保证索引的线程安全性,java.util.concurrent.atomic.AtomicInteger
。 AtomicInteger 是依靠 volatile 和 CAS 来保证原子性的
1 | import org.springframework.mail.javamail.JavaMailSender; |
为啥现在还没改发送的邮箱?
流量小,免费邮箱QQ、Google一天50封,网易一天100封,Spring虽然默认只能配置1个邮箱,但自己写Bean可以配置多个邮箱轮询使用 并且,Amazon Simple Email Service (SES)不好用,还是会被识别成垃圾邮件,只防止了被封ip被拒收,并且可能产生费用
还要限制发送速度?
免费邮箱发送速率受限,发太快的话号会被封且邮件也发不出去,用Guava的RateLimiter限制了消费者消费发送邮件通知任务的速率
自建邮件服务器
自建邮件服务器避免被主流邮箱屏蔽的方法:使用中继主机
例如 Amazon Simple Email Service (SES) 使用Guava的RateLimiter限制每秒发送邮件的速率,满足Amazon
Simple Email Service
(SES)限制,避免被封IP和被当成垃圾邮件的问题
消费者调用发送邮件的函数,使用Spring Retry,保证邮件发送成功
会被判定为垃圾邮件的问题要解决 待实现根据不同状态码调整发送策略 自建邮箱服务器发大量邮件容易被VPS厂家封的问题还要解决,解决方法 - 发信模板:不管使用文字、图片、附件还是HTML,都必须要使用变量,同一内容被大量群发后,腾讯就会识别然后设置为垃圾邮件内容,所以变量是防止垃圾内容的方法之一。 - 发信ip:通过vps切换ip来达到模拟人工操作的要求。 - 自建邮局方法并非不可行,有避免被主流邮箱屏蔽的方法:使用中继主机。我开通了Amazon Simple Email Service (SES)(主用)和Mailgun(备用)作为发件中继主机,SES每个月免费 62000封,Mailgun每个月免费1000封,两者免费版的都使用共享 IP 地址,理论上仍有可能因其他共享用户发送垃圾邮件或自己大量发件被收件方邮局屏蔽,送达率可能不如大厂的邮箱,解决办法是购买专用IP,但这半年来我没有碰到过邮件被拒收的情况,除了163邮箱莫名收不到Mailgun的邮件,163邮箱似乎会屏蔽大部分海外来件。 - 此外通过中继主机发送的邮件,有些收件人客户端会显示“由 [email protected]代发”字样,可能会给对方带来困惑,因此最好在Amazon SES或Mailgun上配置与发件地址同一域名下的子域作为发件域。 - Amazon Simple Email Service (SES)限制:每天50000封、每秒14封、每条消息 50 个收件人、每封邮件包括附件最大 40MB,带宽上行 40MB/秒 - 发送时用Guava RateLimiter来限制每秒发10封邮件,这样就能避免被封IP的问题,发送出错的重新放回消息队列并记录重发次数超限就不发了,(千用户以内,用户多了就买企业邮箱,我不收费就用免费的方案,不行的话就不自建邮箱服务器了,还是配多个邮箱账号轮询来发邮件吧) - 自建邮箱服务也不可以大量发送 - SMTP/POP3协议介绍。采用常用的SMTP作为邮件发送协议,采用常用的POP3作为邮件读取协议。请注意,SMTP和 POP3 (或IMAP)都是使用TCP连接来传送邮件的,使用TCP的目的是为了可靠地传送 邮件。
算法题参数一定要用校验,不然就挂
默认先http访问,之后再转https?
Chorme内核最新版(2024.3.19)已经变成默认按https请求了
数据库为什么存用户密码明文的签名而不是直接存明文?签名和加密有啥区别?MD5签名认证怎么实现的?怎么防止请求头被篡改?怎么防止重放攻击?
- 签名是不可逆的,不存储原数据,只能做签名验证 ; 加密是可逆的,能够解密
- 为防止重放攻击,加上了timestamp字段
- 在数据库里的 登录密码 不用 明文 保存,保存用MD5算法对 明文密码+盐值 数据生成的 签名,网页表单Post提交用户输入的密码,将 提交的密码加上盐值 后用MD5生成签名,把生成的签名与保存在数据库里的签名对比,相同则登录成功
- 登录密码 通过网络传输了,而 secret_key 不通过网络传输,所以在数据库中是否保存明文、用于校验合法的方法…… 对于 登录密码 和 secret_key 使用的设计不一样
- MD5签名没有信息所以传输时参数要包含原数据(Base64编码包裹传输),例如access_key(方便服务器通过access_key查到secret_key)、timestamp……(请求头字段,但密钥secret_key别放在请求头明文传输),secret_key包含在生成并传递过来的MD5签名中了
;
服务器通过access_key查到secret_key用secret_key再加上请求头的JSON作为参数进行MD5签名与传递来的MD5签名对比,相同则签名验证通过(secret_key正确)
- 为防止请求头被篡改:使用请求头的JSON加上secret_key一起签名,保证请求头没被篡改
- MD5秒传(提取文件签名,对比签名,相同 {认为文件一致} 则秒传)
- RSA也可用于签名,MD5不够安全
登录时怎么保护通过POST在网络上传递的账号密码明文数据安全?其与使用access_key和secret_key签名验证的网关接口服务有啥区别?Spring Boot中怎样将HTTP请求自动重定向到HTTPS请求?
- Spring Boot使用HTTPS保证POST请求中传递的密码安全 ; 签名验证的网关接口有防重放保护,请求时secret_key不在网络上传递,无论使用的是 HTTP 还是 HTTPS 都能保证安全
- Spring
Boot配置SSL证书开启HTTPS请求,并将HTTP请求转换成HTTPS请求。用acme.sh脚本自动申请泛域名SSL证书,并自动续期(见科学上网收藏夹中申请SSL证书的步骤)【生成证书前必须将认证服务设置为letsencrypt(Let’s
Encrypt)】
- Spring Boot配置步骤见链接
- 生成SSL证书 — 你需要为你的应用生成SSL证书。你可以使用Java的keytool或者Let’s Encrypt等服务来生成一个自签名的SSL证书。
- 配置SpringBoot以使用SSL证书 —
一旦你拥有了SSL证书,需要将它配置到SpringBoot应用中。这通常需要在你的
application.properties
或application.yml
文件中设置相关的SSL属性。 - 在Spring Boot应用中配置Connector进行HTTP到HTTPS的重定向,创建一个新的配置类来添加额外的Connector:(代码见下)
1 | server: |
1 | import org.apache.catalina.connector.Connector; |
这段代码将会创建一个新的HTTP Connector,当它接收到HTTP请求时,它会将请求重定向到已配置的HTTPS端口。请确保redirectConnector方法中设置的端口与你的需求相符,setPort方法设置的是你希望HTTP请求监听的端口(默认是8080),而setRedirectPort是你的HTTPS端口(以上代码中为8443)。 现在当你尝试通过HTTP访问你的应用时,例如访问
http://localhost:8080
,Tomcat应当会自动将请求重定向到https://localhost:8443
。
关掉浏览器重进,依然登录的原因?
- 前后端分不分离
- 不分离的话,可以通过cookie/session方案实现;分布式的话,需要解决session的共享
- 分离的话,一般需要通过前端请求的参数找到对应的Token值
- 集中式和分散式
- 集中式是把登录信息放到统一的登录后台系统,前端Token只做映射,不包含用户信息
- 分散式是Token里面记录用户信息(JWT),后台只做校验。比较常见
- 登录Token保存的信息是什么?失效时间怎么处理?(具体看JWT的介绍)
- Token保存的信息
- 核心就是userId,最重要的就是标记一个用户;不可以存密码,JWT存放的信息可直接解析出来
- 保证安全性加个签名,Token在前端,如何保证安全性?
- 如果只存放userId,那别人改一下就可以登录别人的账号了,所以需要对数据进行安全处理:可以加个签名
- 签名没有信息,只能验证传递的参数是否被修改过,所以JWT传递的参数中需要包含原数据
- 现在用RSA代替MD5做签名了,MD5不安全
- 加个过期时间防Token丢失,Token如果丢了,是不是账号也丢了?
- 是的,加个过期时间
- Token保存的信息
- 前后端分离后,有两种选项离散式Token和集中式SSO(登录一个模块,其他全登录;登出一个模块,其他全登出)?
- 为避免数据库被意外拖库后泄露用户密码的明文,在数据库中储存用户密码明文加盐值生成出的签名;
- 但是可以暴力破解签名,发现数据库中有许多相同的签名,拿常用密码去试看看有没有一样的,所以让用户设置密码要复杂
- 盐值(SALT)要经常更新,最好 三个月 ~ 半年 更新一次
Spring Session + Redis 怎么实现登录? JWT 怎么实现登录?
- Spring Session 校验成功后就在 Session 中记录查询出来的登录用户的user信息(可放敏感信息),下次通过cookie中的sessionid查找到session,并从session中得到登录用户的user信息(若无则没有登录),用此来判断是否登录
- JWT 校验成功后返回一个 token
给用户,用户下次发请求时带上此token,服务端校验此token若成功就相当于登录,并可以从token中获取基本信息(不可放敏感信息)
- 用 JWT 实现登录,要把 user_id 和 user_role 和 过期时间 置于 payload 中
为什么使用 JWT 登录 而不用(通过 Redis 实现了分布式Session,避免了使用分布式架构时用 tomcat 保存 session 时会出现的用户登录失效的问题) ?单点登录(SSO)?
- JWT 的有效性无法主动注销用户的已登录状态,只能等待 token
过期,更改密码或点击退出后之前的 token 依然有效 (设置黑名单/Redis 保存
JWT 的状态可以撤销但与 JWT
不在服务端存储状态的理论相违背,变成类似session的东西了),而 Spring
Session + Redis 可以通过修改 Redis 中的 session
数据来主动撤销用户的登录状态
(单点退出后其他服务也一并退出,SSO)方便后续做单点登录
{自己业务少的时候或只有单一业务不用实现单点登录,没有实现的场景}
- 单点登录(SSO)适合在多个应用系统中,只需登录一次就可以访问其他相互信任的应用系统时使用。这种方法提高了用户体验,减少了重复登录的繁琐,特别适用于企业内部网或外部网、学生门户网站、公有云服务等环境。通过单点登录,用户可以在一次登录后访问多个相关应用和服务,无需重复输入凭证,节省时间并提高便利性。然而,需要注意凭证泄露可能带来的安全风险,因此建议结合多因子身份验证(MFA)以增强安全性
- 适合使用jwt的场景:有效期短 / 只希望被使用一次
- 建议将 JWT 存放在 localStorage 中,放在 Cookie 中会有 CSRF 风险。
- 比如,用户注册后发一封邮件让其激活账户,通常邮件中需要有一个链接,这个链接需要具备以下的特性:能够标识用户,该链接具有时效性(通常只允许几小时之内激活),不能被篡改以激活其他可能的账户,一次性的,等待自然过期即可,无需服务端控制其提前终止。这种场景就适合使用jwt。或文件临时一次性分享下载链接
- 而由于jwt具有一次性的特性。单点登录和会话管理非常不适合用jwt,如果在服务端部署额外的逻辑存储jwt的状态,那还不如使用session。基于session有很多成熟的框架可以开箱即用,但是用jwt还要自己实现逻辑。
- 使用session与redis结合,因为单纯的使用session缓存数据的话,当一次会话结束后,session就会消失,如果结合redis使用则不会出现数据失效的情况。
- JWT (类似身份证)无需在服务端存储 session 信息,不用数据库的查询(仅需存储解密密钥,使用密钥校验),对跨域友好,可以在不同应用间共享用户信息
- 用 OAuth 2.0 集成第三方登录 QQ、支付宝、钉钉、GitHub……
- 使用 SpringSesion 的思路是:除了网关服务,每个服务都引入 SpringSession,使用 redis 实现 session 同步。获取信息时,根据 sessionId 从服务器 session 取,如果没有,连接 redis 服务器获取。
- 使用 jwt 的话,我们在卡号服务里生成一个 jwtToken,放在 cookie 里,由网关服务解密后放在请求头里,这样的话,所有服务都可以从请求头里获取卡号信息。
- JWT 只能传输非敏感的人员数据,base64解码后就可以得到json,每次请求都需要在header中携带token信息,增大了带宽的压力
- JWT (Json Web Token) 分为三部分,header、payload(载荷)、signature(签名)。前后端分离开发模式下,token加密后前端请求服务端获取授权,完成登陆校验,其中我们可以拿到payload中的内容,来回显到前端展示界面
- session是存在服务端的,他是后端的产物,在前后端不分离场景下,单体应用、分布式架构下都能很好的担任他的角色,特别是有SpringSession这一完美解决方案,将session的令牌存在浏览器cookie中,数据存储在redis;但是在前后端分离流行的当下,特别是微服务架构下,JWT以简洁、易用更能胜任校验状态的角色,JWT更是最流行的跨域认证解决方案,通过加密,载荷也相对安全的存储了用户的信息,前端也更容易拿到这一信息,并把信息存储在localStorge或cookie中
前后端分离时使用(实现分布式Session),如果客户端是 手机app/小程序 等非浏览器,没有cookie实现保存不了cookie怎么办?
- Spring Session 默认使用 cookie
保存sessionid (对浏览器方便),如果客户端是
手机app/小程序
等非浏览器,没有cookie实现保存不了cookie就不能通过cookie来访问session对象,需要在登录成功后,将sessionid添加到响应数据中,保存在客户端,下次用户访问,就在请求头当中带上sessionid
; 用 Spring Session 中的
HeaderHttpSessionIdResolver
实现 - 用 Spring Session 中的
HeaderHttpSessionIdResolver
实现时,当会话被创建时,HTTP响应会包含一个指定名称的响应头和会话ID的值。例如,响应头可能如下所示:X-Auth-Token: f81d4fae-7dec-11d0-a765-00a0c91e6bf6
客户端在每个请求中应该通过指定相同的头来包含会话ID。当会话被下线无效时,服务器将发送一个带有相同头名称但值为空的HTTP响应 - 确保会话ID被改后用户不会登录成别人:
- 使用安全的会话管理机制:确保在用户登录认证成功后,将用户的登录凭证放入会话中进行管理
- 例如,会话代替方案:考虑采用会话代替方案,如使用单次令牌或其他安全机制来代替传统的会话ID
- 注意会话ID的安全性:尽量避免会话ID泄露给他人,以防止他人伪造请求。通过HTTPS协议传输会话ID可以加密通信内容
- 定期更新会话ID:定期更新会话ID可以增加安全性,减少被猜测或利用的可能性
- 限制会话ID的有效期:设置会话ID的有效期,当超过一定时间后自动失效,减少被滥用的风险
- 实施防护措施:考虑使用防护机制如防止会话固定攻击和跨站请求伪造等安全措施来保护会话安全
- 使用安全的会话管理机制:确保在用户登录认证成功后,将用户的登录凭证放入会话中进行管理
一个用户有没有注册怎么判断?
- 数据量小的时候可以用MySQL的唯一索引代替布隆过滤器
- 量级极大时才考虑布隆过滤器,黑白名单……
项目追加问答
什么是双属性枚举?为什么要用双属性枚举?
- 双属性枚举是指只有两个属性的枚举类型,有一个为数字id,一个为说明字符串,数据库里只用存数字id(例如,分类,权限……等只有固定几类的东西)
- 类型安全:枚举提供一种类型安全的方式来定义一组固定的值。这可以防止使用无效的值,并在编译时就能发现错误。
- 代码可读性:枚举使得代码更易于阅读和理解。字符串描述提供了对数字代码的直观解释。
- 易于维护:将数据和状态的描述集中在枚举里,更改和维护变得容易。只需在一个地方更新即可。
- 内存高效:在数据库中存储一个整数比存储字符串占用的空间小,这对于提高性能和减少存储需求是有好处的。
- 代码和数据分离:业务逻辑代码中使用枚举,而数据库中存储枚举的数值,这有助于保持代码的整洁性和数据层的简洁性。
- 扩展性:如果以后需要添加更多的属性或者状态,枚举提供了一种简单的扩展方式。
- 对于像分类,用户性别,用户状态,用户权限这种有固定值的字段,使用双属性枚举可以在数据库中只存数字减少空间占用与网络流量消耗(做查询的参数)
- 枚举的说明字符串就直接在代码里,数据库只存数字
- 使用双属性枚举,并在代码中同时定义说明字符串和相应的数字,而在数据库中只存储枚举对应的数字,这是一个常见的编程模式。这样做的好处是在数据库里只存储数字可以节省空间,加快数据库操作速度。同时,在代码中保留了可读性很强的字符串,便于开发和维护。
- 使用双属性枚举的方法,枚举说明字符串就直接在代码里,数据库只存数字(能不存文本就不存,文本不好校验参数),代码中也可以用枚举类实现的getById()方法传入一个数字来获取枚举值,要判断返回值是否为空
- 枚举有业务属性,双属性枚举有一个字符串属性(,用来描述具体业务)
查标题用模糊查询,查描述用了全文索引,按标签查含单个标签的接口可以用MySQL的FIND_IN_SET函数(只能单个标签)
要查找同时包含多个特定标签的数据行,可以用 LIKE 和 AND 操作符。以下是一些可能的方案:
- 全文搜索索引:某些数据库(如 PostgreSQL、MySQL)支持全文搜索功能。如果您经常需要进行此类查询,使用全文搜索可以提高效率。
- 正则表达式:使用正则表达式来匹配具有特定模式的行,部分数据库如 PostgreSQL 有这个功能,使用 REGEXP 或类似的函数。
- 分割成多个列:如果可能,将数据分割到不同的列或者表中,然后使用联接 (JOIN) 来查找同时含有这些标签的行。
涉及浮点运算或钱时使用BigDecimal计算小数
RPC与MQ的区别?以及MQ的使用场景?
- RPC介绍链接
- 消息队列介绍链接
- 见链接
- RPC是远程过程调用,MQ是消息队列,RPC通常是同步的 请求/响应 调用,MQ是异步的流处理
- N个不同系统相互之间都有RPC调用,依赖程度深,引入MQ降低耦合度
- MQ实现RPC会造成更大通讯开销,不要强行替代
- MQ异步有自动重传重试,与http同步调用相比能提高系统的可靠性(MQ大部分时候用于提高系统的可靠性,很少场景能用来提速),http要自己实现重传重试的补偿定时任务
- 异步只有在接口流程能同步进行时能提高速度,有的业务是链式的,比如下单,下一步操作依赖上一步操作,异步就没啥用
- MQ削峰/限流
为简化查询接口对应标签的常用操作,在“接口信息表”中增加了一个varchar类型的冗余字段来存放接口对应标签的id(标签id间用逗号分隔开)
为简化查询接口对应标签的常用操作,在“接口信息表”中增加了一个varchar类型的冗余字段来存放接口对应标签的id(标签id间用逗号分隔开);流量大了上Redis缓存
- 使用VARCHAR字段来存储多个标签ID,然后用逗号分隔,是一种常见的简化数据库设计的做法,尤其是在一些小型或不需要高度正规化的数据库中。然而,这样做会影响到数据库的拓展性、性能和数据完整性。
- 一个接口仅拥有少量标签时,可以在“接口信息表”中用一个varchar类型的字段存放多个标签的id(id间用逗号分隔开),使用MySQL的FIND_IN_SET函数能实现按单个标签查询接口,不用创建“接口标签表”,优化了按标签查询接口和查询接口标签的操作;
- MySQL手册中FIND_IN_SET函数的语法解释:FIND_IN_SET(str,strlist)
- str 要查询的字符串
- strlist 字段名 参数以”,”分隔 如 (1,2,6,8,10,22)
- 查询字段(strlist)中包含(str)的结果,返回结果为 null或记录
- MySQL的IND_IN_SET函数确实能够查询出含有特定标签的记录,但这种方式并不高效,尤其是在标签数量较多或是记录数量庞大时。这是因为FIND_IN_SET是一种字符串函数,它不会利用索引,所以每次查询都需要进行全表扫描。
- 如果考虑到可维护性和性能,建议使用一种更可扩展的设计,比如创建一个标签表和一个接口与标签的关联表(通常称为“联结表”或”中间表”)
- fooId字段可以用逗号分隔储存成varchar类型 一个字段储存多个fooId,一查查个String出来再按逗号分割可以分出多个fooId,MySQL的varchar类型支持输入逗号并且MySQL有FIND_IN_SET函数支持逗号,fooId数量少的时候实现了存可变数量的fooId数据(可以设置not null);不用设置 fooId_1、fooId_2、fooId_3…… 多个字段(有的时候只存一个数据,但查得全查则查出的后面几个字段会是空,还要判空,且浪费空间)