位置：AI门户网 > AI百科 > 基础概念 > 人工智能技术教育经历：从好奇到深耕，我的十年AI学习与成长之路

人工智能技术教育经历：从好奇到深耕，我的十年AI学习与成长之路

来源：AI门户网时间：2026/5/9 21:39:29 共 2313 浏览

回想起来，我对人工智能产生兴趣，大概是在大学二年级那会儿。那是个午后，我偶然点开了一篇关于AlphaGo击败李世石的新闻报道。说实话，当时的感觉很奇妙——一方面觉得这事儿“酷毙了”，另一方面又完全搞不懂它到底是怎么做到的。这种“不明觉厉”的感觉，像一颗种子，悄悄埋进了心里。现在回头来看，我的AI学习之路，还真有点像一场漫长的“打怪升级”，充满了偶然的邂逅、痛苦的摸索，以及偶尔“顿悟”的快乐。

一、启蒙阶段：迷雾中的摸索（2016-2018）

这个阶段，我的关键词是“好奇”与“混乱”。就像走进一个装满宝藏却毫无地图的迷宫。

一开始，我试图从最“热”的东西入手，比如在网上找那些“三天入门机器学习”的教程。结果可想而知，满屏的数学公式和陌生的术语（什么梯度下降、反向传播）很快就让我败下阵来。我意识到，自己缺的不是热情，而是一套系统的基础。

于是，我调整了策略，从学校开设的相关课程补起。那时候，我们学校的AI课程体系还处在建设初期，课程比较分散。我把自己修读和自学的一些核心课程梳理了一下：

课程/知识模块	学习方式	掌握程度与感受
:---	:---	:---
高等数学、线性代数、概率论	大学必修课+重新精读	基础中的基础，当时学得痛苦，后来才知是“内功”。
Python编程	选修课+网络项目实战	从“打印HelloWorld”到能爬取数据、处理文件，算是拿到了入场券。
机器学习导论（吴恩达Coursera）	慕课自学	真正意义上的启蒙，第一次对监督学习、逻辑回归有了整体概念。
模式识别	专业选修课	接触了更传统的分类、聚类方法，理解了机器学习的“前身”。

这个阶段的学习是碎片化的，很多时候是“用到什么，才去补什么”。比如做课程项目，需要用到决策树，我才去疯狂看原理、调库。虽然效率不高，但这个过程让我明白了一个道理：AI不是魔法，它是一步步的数学计算和逻辑推理。那些看起来“智能”的结果，背后是清晰（ albeit complex）的步骤。

二、入门与项目实践：在“试错”中成长（2019-2021）

有了前期不算牢固的基础，我决定“下水试试”。这个阶段，“项目”和“实践”成了最好的老师。

我参加了学校的实验室，跟着导师和师兄师姐做课题。第一个像样的项目是基于CNN（卷积神经网络）的图像分类。还记得当时为了配置TensorFlow环境，折腾了整整两天，各种版本冲突、CUDA错误，差点让我放弃。但当我第一次用自己的代码，成功让模型区分出猫和狗的照片时，那种成就感是前所未有的。我意识到，理论知识和让代码跑起来，完全是两回事。

后来，我和几个同学组队，参加了一个校内的数据挖掘竞赛。题目是关于用户行为预测的。我们兴致勃勃地尝试了各种复杂的模型——XGBoost、LightGBM，甚至搭了个简单的神经网络。但初赛成绩一出来，排名中后。我们复盘了很久，最后发现问题出在最开始：特征工程做得太粗糙，对业务背景理解不够。我们花了大量时间在调参上，却忽略了数据本身的故事。这次教训极其深刻，它让我记住了：“Garbage in, garbage out”（垃圾进，垃圾出），在AI领域是铁律。

这个时期，我的技术栈开始变得清晰，也形成了初步的学习方法：

1.“手敲代码”原则：绝不满足于仅仅看懂别人的代码。哪怕是简单的算法，我也会自己从头实现一遍（比如用NumPy写一个简单的感知机），这个过程能暴露无数理解上的盲点。

2.“问题驱动”学习：不再漫无目的地看教材，而是针对项目中遇到的具体问题（比如“为什么我的模型过拟合了？”）去查阅论文、技术博客，寻找解决方案。

3.拥抱社区：开始频繁使用GitHub、Stack Overflow、以及国内的一些技术论坛。从“提问者”慢慢变成偶尔的“解答者”，这个过程极大地锻炼了我梳理和表达技术问题的能力。

三、深化与方向选择：从宽度到深度（2022-2024）

随着接触的东西越来越多，我感到了另一种焦虑：AI领域太庞大了，机器学习、深度学习、计算机视觉、自然语言处理、强化学习……我好像什么都懂一点，但什么都不精。

硕士阶段的选择迫使我必须聚焦。根据兴趣和行业观察，我选择了自然语言处理（NLP）作为主攻方向。原因嘛，一是觉得语言是人类智能的核心体现，研究起来很有意思；二是预感到大语言模型（LLM）可能会带来一波巨变（当时GPT-3已经崭露头角）。

这个阶段的学习，强度和深度都上了一个台阶：

*系统攻读经典：精读了像《Speech and Language Processing》这样的“圣经”级教材，弥补了之前零散的知识漏洞。

*紧跟技术前沿：养成了读论文的习惯，从经典的Transformer、BERT，到后来的GPT系列、T5等。开始关注模型背后的设计思想，而不仅仅是调用API。

*深入研究某个子领域：我的毕业论文选择了“文本摘要生成中的事实一致性”问题。这要求我不仅要懂模型，还要深入理解评估指标、设计实验、进行严格的误差分析。这个过程非常折磨人，经常为一个不升反降的实验结果debug到凌晨。但正是在这种深度钻研中，我才感觉自己真正“入门”了NLP研究。

这里我想特别提一下对“大模型”认知的转变。起初，我也曾觉得，有了ChatGPT这样的“神器”，很多底层技术和研究是不是就没用了？但越深入学习越发现，事实恰恰相反。大模型的出现，抬高了整个行业的天花板，但并没有降低地板。它更像一个强大的“基座”，而要想在这个基座上构建可靠、安全、符合特定需求的应用，反而需要更扎实的基础知识（比如对模型机制、微调技术、提示工程原理的理解）和更深刻的领域洞察力。换句话说，大模型让“调用”变简单了，但让“用好”变难了。