• 现在是不是也没什么人想去深入学习 AI 的源码级知识了
  • 发布于 11小时前
  • 13 热度
    9 评论
没有 AI 的时代,网上很多“手撸一个 XXX”的教程和帖子。 现在感觉好像已经很少有人从底层的数学和模型开始讲那种深入浅出的教学了。 是我被信息茧了,还是真的咩有了? 如果有的话可以给我推荐一下吗? 或者感兴趣的话要一起学一下子吗?
用户评论
  • 飛雲
  • 多年前跟着教程手撸过机器学习算法。这些东西跟业务框架源码最大的区别在于,这些工具其实是数学模型,不理解数学模型光看源码不知道他在干啥,而知道了数学模型不看代码也可以使用,用起来优化的知识其实也是数学知识,跟懂不懂源码关系不大。后来的神经网络、cnn 啥的乃至后来的大模型我就一窍不通了,已经多年不接触了
  • 2025/7/3 16:18:00 [ 0 ] [ 0 ] 回复
  • 摇滚枷锁
  • 不知道你说的源码级是哪个方面的. 如果是指手推基础的 bp, kl divergence, vae, diffusion , 手写 cnn, rnn, transformer, vit 的话, x 上还是挺多的. inference 加速的话不就更多了, flash attention, linear attention, 感觉天天都有新东西...
  • 2025/7/3 16:15:00 [ 0 ] [ 0 ] 回复
  • 追梦魂
  • 大概是发展的必然规律?不需学习底层技术就可以直接编写上层应用不见得是坏事。
    有点像上个世纪网络技术的发展,最开始的研究者需要探索传输介质、线路编码、调制与载波这种底层技术。
    待到底层技术成熟,后来的开发者就只需要思考如何编写实际的应用程序,而不必操心数据要用什么算法转换成电信号了。
  • 2025/7/3 9:19:00 [ 0 ] [ 0 ] 回复
  • 枪蹦狗友
  • AI 怎么手撸?别说个人了,中小公司连显卡都买不起。即使你买得起训练显卡,你有清北数物奥赛金牌保送生的智力水平吗?没的话能撸出啥,刚出就严重落后。你既不会基于你自己撸出的 AI 做实用工具,也不可能基于你撸出的 AI 做 AI2.0 技术迭代,也就是说,你撸出的 AI 没有任何价值,除了浪费你的时间。

    AI 就放弃吧,让全球真正智力顶尖的那些人去搞,荣耀是他们的,他们可以上史书,我甚至认为实现 AGI 的人比牛顿还要牛逼。牛顿让我们可以科学的认识世界,AGI 让我们像造物主一样创造世界。我们普通人的价值就是使用 AI 。撸操作系统、编译器同理,也没见哪家公司招聘考核这个。
  • 2025/7/3 9:12:00 [ 0 ] [ 0 ] 回复
  • 青墨断笺
  • 因为越来越多人认清了,机器学习 AI 基础设施,是极少数团队才能做的高度垂直领域。一开始关注度高,是因为猎奇。真正对知识体系感兴趣的人很少。即便退一万步说,你感兴趣,基于成本原因你也只能做一些小打小闹。你跟着中航学造火箭,流体力学、空气动力学、导航技术学了一溜够,最后只能自己拿摔炮做实验,是个人也坚持不下来吧?所以一旦猎奇程度降低,就没有流量了。没流量,曝光度也就少了。
  • 2025/7/3 9:09:00 [ 0 ] [ 0 ] 回复
  • 白笙枫客
  • 性价比太低,我以前深入学过,学过后发现,其实没啥用,自己也捣鼓不出来一个新模型,自己最多把别人的模型拿来改改参数喂数据就行了。改参数过于玄学,基本上就是瞎几把试,喂数据又没技术含量,因此基本上就是只要大概懂原理,根本不需要学各种公式怎么推导出来的也能干活。其实跟写代码没区别,也没几个人研究 cpu 编译器运行原理啊。
  • 2025/7/3 9:07:00 [ 0 ] [ 0 ] 回复
  • 白衣煮茶
  • 现代人做事主要讲究性价比,如果研究底层能够给你带来更多的好处——收入。那么完全可以去研究。但是现实情况是,你即使研究底层了,干的活儿还是调用高层 API ,性价比极低
  • 2025/7/3 9:03:00 [ 0 ] [ 0 ] 回复
  • 忘川河畔
  • 我想有两个原因
    1. 现在的大模型还是基于 transformer 的架构,之前的教程仍然有效。
    2. 现在想深入了解源码的人不需要教程,可以直接问 AI

  • 2025/7/3 8:51:00 [ 0 ] [ 0 ] 回复