是指哪个,我知道的最近比较出圈的就是deepseek的AI了,这公司我前段时间就已经听说过了,战略目光挺有前瞻性的,19年AI还没热门的时候就开始准备算力资源,才能成为除了那些大头以外少有的有资格入场的公司,然后模型训练方向也不是和国外那些一样一直叠算力,而是通过各种方式去优化减少成本,你可以理解成把所有能拆分的小细节都优化成了更省成本的样子,最后弄出来和国外模型一样的甚至更强的模型,成本却只有别人的几十分之一这种
我觉得这种才是AI模型应该研究的方向,不然硬叠算力只会造成成本上升,入门门槛也高,难以普及
ds成功的还有一个主要地方就是他的数据集质量特别高,你可以理解为模型就是个孩子,数据集就是交给孩子的知识,比较普通的数据集会有一些没什么用的信息,这部分拿去给AI训练效果也不高,而高质量的数据集就能做到都是很有用的信息,可以理解为上了个贵族学校教的课程质量也高(),这也是个能用低成本训练出更聪明模型的原因之一,同时也让这个模型相比其他国内模型在中文上也好不少