道闪电。
陈默喃喃自语:“所以……通用的CPU,从硬件物理架构上就不适合跑我们的算法?”
“没错。”夏冬顺势抛出一个引导性的问题,“既然一个精通微积分的老教授算得慢,那我们找一万个只会算乘法的小学生来并行计算呢?”
“我们需要的是高并发、低逻辑复杂度、海量的浮点运算单元……”
吴泽明推了推眼镜,眉头微皱,大脑在疯狂检索现有的硬件架构:“夏冬,你说的这种硬件特征,听起来怎么那么像电脑里的显卡?”
“确切地说,是GPU。”夏冬打了个响指,“泽明抓住了盲点。”
夏冬表情淡定,内心其实正在快速梳理之前用豆包查阅的资料。
早在2007年,英伟达就推出了CUDA架构,让GPU不仅仅能打游戏渲染图像,还能进行通用计算。
现在这个时间节点,多伦多大学的HintOn团队、斯坦福大学的吴恩达,其实已经开始尝试用GPU加速神经网络训练了。
效率足足比CPU高出了几十倍。
到了2011年,吴恩达更是用12块GPU,生生跑出了相当于2000个CPU的深度学习算力。
这就是降维打击。