相关从业者冒泡。
Deepseek 的推理集群资源应该还是吃紧的,不过云厂商现在也有部署,可以多找下。避嫌这里就不安利具体平台了,总之几个比较大厂的云都可以看看。毕竟去年年底已经冲击过一小部分人,加上 deepseek 的 moe 路线不可能融入某些模型的 dense 主线(尤其在模型 moe 版本独立发布的情况下,目测 dense 相关人员的屁股更重)。
效果方面其实如果你能用国外,那更推荐 claude 3.5 sonnet:整体来说无论是刷榜灌水还是实际用起来,claude 是独一档的好,可以不考虑 chatgpt 系列。如果觉得贵,那 deepseek 很多时候可以作为下位替代,效果我自己感觉比 qwen/qwen-coder 都好点。
btw 上面的评测主要针对 deepseek v3 671b,r1 我没具体评过,更小参数的版本也没具体评过。