如何脱坑转AI

  1. 学历要求
    • 虽然AI就业岗位体量大,但是要求相对较高,若无相关经验,本科难以入行,所以最好是能读研,工科我是很推荐大家读研的,和本科的待遇差距挺大,这个如果大家有兴趣,可以另外开帖再谈
    • 如果不是追求进互联网大厂,江大的硕士也足够找到一些中小厂的AI岗位,当然读研的学校越高越好
  2. 专业要求
    • 岗位对于专业的限制不大,所以不是说一定要学计算机、电子信息,从我呆过的几家大中小公司来看,科班出身的从业者的大约20%左右,不乏机械、材料、物理等专业的从业者,属实是学科交叉win麻了
    • 考研时切勿拘泥于专业(除非是要考公,但是要考公学啥技术都无所谓,也不用学AI),应该更关注学校的title和上岸难易,即使是同等级学校,科班和非科班应聘时,也不会有太大差别,假如计算机要考380,机械只要考340,最后找AI岗位可能是相同的结果,所以同等难度下,考211的计算机不如考985的机械,后者的应聘时反而更有优势
    • 计算机≠AI,传统计算机方向如前后端和AI也没关系,科班的优势仅在于学习的计算机基础对于入门AI来说更快一些,但是这些非科班自学花3个月也足够弥补,在起点上达到一致
  3. 自学要求
    • 咱们江大在资源上确实和名校存在差距,但是能分配到我们大多数人的资源,在差距上是微乎其微的,而且学校里教的内容90%以上在你就业时是用不着的,或者说是和过时的,所以要在AI发展迭代如此快速的背景下,自学当下的前沿技术
    • 有人问要不要报班,这个是没必要的,很多是质量不高的水课,费钱费时,我就走过这样的弯路,不如找个有经验的从业者询问指点一下,如何快速掌握当前AI生态中最常用的技术

如何快速入门AI,有哪些知识点是需要知道的,有哪些工具是需要掌握的,以及大致的学习路线

  1. 科班基础:正如上面说到的科班的优势仅在于学习的计算机基础,这些我们非科班花费3月也足够掌握,其中大部分也是用不着的,所以只学有用的,时间分配如下
    • 计算机组成原理:知道CPU、GPU的概念,进程是如何执行(3 day)
    • 操作系统:知道进程、线程的概念,如何管理,最好是搭配着linux操作系统学习,掌握大约30个常用的linux命令(14 day)
    • 计算机网络:知道IP、Port、URL等概念,实现通信的原理,因为AI是做产品,产品就需要给人使用,所以一定要做成对外的服务,让人来访问(14 day)
    • 数据结构:学这个纯粹是为了应付面试,手撕代码,实际工作用不上,把leetcode hot 100刷熟即可,但是也是最费时的(2 month)
  2. 开发工具:这部分内容比较多,只能说个大概,我有相关的全套整理笔记,后续会发
    • Python:设计语言学Python就够,C系列不做推理优化用不着,Python学习到会写类的程度即可,什么私有保护、继承多态知道就行,大多数代码只会用到最基本的类
    • Pytorch:框架就学Pytorch,其余的难用框架都被淘汰了,可以自己看官方文档学习,把torch的属性、变形、运算,自定义数据集、模型等学会
    • Linux操作系统:最常用的开发系统,掌握常用的大约30个Linux命令,知道如何管理进程,配置环境等
    • docker:轻量化的虚拟机,在开发和搭建服务时很有用,可以快速的搭建环境,常用命令大概10多个
  3. 理论基础:机器学习不用去学,浪费时间,直接从深度学习入手,以及现在建立的很好的生态,一些常用的工具
    • 模型结构:MLP、CNN、GNN、Transformer
    • 模型架构:ResNet、DenseNet、MOE,Encoder-Decoder、Backbone-Neck-Head等要知道
    • 生态工具:huggingface中的Transformers、Diffusers、Accelerate、Peft等库,ModelScope社区和MMLAB社区的封装工具
    • 方向选择:目前发展的最好的都是生成模型,分语言、图像、视频的生成,都大有可为,又可以讲出很多的内容,像是Lora、Position Embedding等,这里实在讲不下了,可以看我后续笔记,自行理解

学习资源

  1. 视频就看B站的视频就看B站的,什么吴恩达,李沐的那些课,工具书就看官方文档,除此之外都是水货浪费时间的