转跳到内容

分享一些个人尝试大语言模型部署的经验


只显示该作者

只有该作者的内容显示中。 返回到主题

推荐贴

  • 管理员
1 小时前,Vinda说道:

确实慢...一条回答至少几分钟,我听说lmstudio会好不少,还有kobold也有推荐的,或许会快一些?

那不清楚。。首先要足够显存把模型全装进去才行。。3090用sglang的话12B模型一条简单的回答估计15秒内吧。

链接到点评
×
×
  • 新建...

重要消息

为使您更好地使用该站点,请仔细阅读以下内容: 使用条款