转跳到内容

【返乡】【1/1报名送100JC】【投票拿勋章】2024年冬季返乡~预告篇~


只显示该作者

只有该作者的内容显示中。 返回到主题

推荐贴

17 小时前,攸薩说道:

:SS04:咕咕咕!

:SS04:话说这种抽象课一定要拿到吗

最近给AI加了个知识库,效果比我以前预想的好,我之前一直以为rag知识库核心的向量化模型只是个将文本转换成向量用于计算用的,结果最近才明白这个模型是用来提取文本中含义的,然后就可以放在空间上进行计算比较。

比如说“我带狗去看医生”和“我带猫去看医生”,这两句的意思就比较接近,最后在空间中的位置也会更近

知识库就是通过提取你发言的信息,然后根据这些信息在知识库里寻找最接近含义的文本,然后返回这段文本

我以前也搭过,但是效果不好,前几天试了一次,还是不太好,结果换了个国内智谱的向量化模型,效果直接提升几十倍,然后我才明白,我之前用的模型,要么太辣鸡了,要么就是国外的对中文支持几乎没有

现在几乎能做到我把一些游戏啥的信息放进去,然后接上AI问,AI每次都能准确回答出来,效果让我有点感动

链接到点评
17 小时前,哥特的亡零说道:

这让俺想到了盒子酸奶(:mx051:

b站现在俺只用来看汉化的动画作品,游戏的话更喜欢看那种搞笑的,比如小潮院长他们(:mx068:

游戏的话我现在主要看原野郎中,他也是有讲恐怖游戏的,不过确切来说大部分都是“垃圾恐怖游戏”,整的挺好玩的,也有几个精品的高质量视频,给游戏的故事很好的呈现出来了的,我有时候吃饭的时候就看他视频)

链接到点评
17 小时前,攸薩说道:

:SS04:基本上还是要找中文圈制作的才好,外文的总是会误解吗

主要是看训练的数据吧,毕竟国内模型肯定中文为主,几乎都是中文的数据,所以理解能力也高,国外的话,像谷歌那个我猜就没加多少中文数据,这时候让模型去读中文文本的意思大概就像是个只知道你好再见小笼包的外国人去读,什么都读不出来,但是换成英文他就很懂了

我之所以会优先谷歌是因为谷歌自己的gemini聊天模型的中文就整的挺不错的,聊天起来毫无压力,我还以为向量化模型也行,结果是中文支持很糟糕,要是没看到网上的资料我还在找自己的问题

链接到点评
20 小时前,攸薩说道:

:SS04:只是现在进展就很顺利了吗

是了,现在用那模型做知识库的向量化模型整的挺好了,基本上我想问的都能查出来,我今天还去找AI商讨了一下拿来做记忆库的可行性,基本上有了个大概的框架了,我的预想是整出来一个可以有长期记忆的聊天AI,比如说我提起上周的某个事情AI也能记起来并且继续跟我聊这种

链接到点评
15 小时前,哥特的亡零说道:

口味有点重,虽然俺也一样(:kl:

明明不喜欢玩恐怖游戏,但看别人玩觉很有趣呢(:mx051:

主要郎中的视频虽然讲的恐怖游戏,但是实际上大部分看着不恐怖,跟玩普通游戏一样,还有节目效果,我是当搞笑视频看的)

类似的可以拿来下饭看的up我还看过折纸姬,还有个拧不动啊真拧不动,就是饭点的时候放着看看

链接到点评
20 小时前,攸薩说道:

:SS04:正常的情况不会记忆吗

不会的,AI聊天的正常流程其实都是直接把聊天记录发给AI,上下文记忆就是这样实现的,你看着可能只是把最新一条消息发送给AI,实际上是连同前面的消息记录也发给了AI,这样AI才能知道前面的内容

AI本身没有记忆功能,所以才只能把前面的内容一块发给AI才能让AI理解,如果想要存储记忆,基本上就是得像我这样另外整个地方存,然后要的时候再发给AI

链接到点评
17 小时前,哥特的亡零说道:

【拧不动啊真拧不动】这名字……话说最近的名字是不是开始越来越抽象了?:kl:

可能是)不过这名字倒是也好记,起码我第一眼有想要记住UP名字想法的时候看到这个就有了个印象

我挺喜欢他的VR系列的,对了,说起VR,还有个up叫叶猫gamer来着,他之前有段时间似乎是嗓子不好,就出了几期像是默剧一样的游戏实况,但是节目效果非常好,非常搞笑,我还挺喜欢的,配音配的很有意思

furobert得到了穿越资格,兴奋过度从而砸坏了键盘.-2节操

链接到点评
21 小时前,哥特的亡零说道:

嗓子不好还要直播好辛苦,难道就没有好好休息吗(:mx051:

他是发视频,不过我想应该是好好休息了,因为他的视频确实一句话都没说过)纯默剧,虽然没有说话但是搞笑程度也不低,我最先看到这个up就是看那些默剧,反而现在他说话了我还有些不适应)

链接到点评
16 小时前,攸薩说道:

:SS04:原来如此,我还以为是自己记忆,话说要实现记忆的话会不会要很多容量呢

容量肯定是要的,不过这种基本上就是文本,光文本的话其实还好,像是纯文本,1MB大小的文档,大概能存储几十万个汉字,其实能存挺多的,不过我现在用的是知识库,他的存储是将文本先转换成多维向量,这个貌似就得多点了,不过总归来说应该还好,不用很多,至少我觉得短期内都用不到几百MB

链接到点评
18 小时前,哥特的亡零说道:

那看的时候会不会有弹幕说“主播闭嘴”或“解说员出现了”之类的(:kl:

应该没有吧,我是没看到)大伙都蛮友善的,虽然有些人可能更喜欢默剧那种,但是也只是委婉的表达,基本上看不到一些很有攻击性的,况且人家本来就是说话的,默剧才是比较少的,反正他说话也不怎么影响,我照样都看的

链接到点评
17 小时前,攸薩说道:

:SS04:居然,只要没有图片的话就很小吗

文本的占用大小比图像小多了,图片视频音频这些多媒体就是占用容量最主要的东西,哪怕这些实际上已经是经过压缩算法优化过的了

不过有时候你可能看着一个文本文档有十几MB什么的,这种也要小心一下,因为这种情况下里面的文字数量是非常惊人的,你用记事本打开都可能会崩溃)还得找一些专用的工具来打开

furobert在新手区仔细阅读版规时,意外收到来自小小坛娘奖励的4节操。

链接到点评
21 小时前,攸薩说道:

:SS04:哎,不过word也会崩吗

word我倒是没试过打开那些大文档,我不是很常用,我现在大部分情况用的还是notepad++这个软件,虽然大了也会崩,不过我是有一些特殊格式需要才用的,比如json,md,以及看一些简单的代码

链接到点评
21 小时前,哥特的亡零说道:

说起来最近弹幕确实和平了不少呢:mx051:

以前看个视频都不能安静,虽然现在还是有些奇奇怪怪的弹幕,但和之前比好上不少(:mx072:

我是记得老早以前加了个屏蔽的规则,大概就是把带时间日期的都屏蔽掉,省的看到什么考古啊之类的,不过因为那个规则是简单粗暴的屏蔽数字来着,导致好些正常弹幕也没了,虽然偶尔会感觉弹幕有点缺失(比如翻译字幕之类的),不过大体上也能正常使用

furobert不吃不喝三天三夜只为“汉化”某悬赏游戏,搞定后发现居然是要翻译成俄语.-3节操

链接到点评
21 小时前,攸薩说道:

:SS04:话说遇上日语的会特别转码吗

这种和你文本文档的差不多,notepad会自己看你文档的编码格式换的,当然你也能手动将这些编码转换,就是你得知道转换后的后果才能这么做,我有时候就是会把日语乱码放进notepad里然后转换一下转换回正常文本

链接到点评
10 小时前,哥特的亡零说道:

不过多到一定程度后就不会管那些了(:mx051:

话说平时会开弹幕还是关闭?:59468f9bbc56d_7_16:

开着的,就1/4的弹幕位置,我现在还是习惯开着,除非一些比较特别的,比如我不想被剧透或者我就是来享受画面的不想被弹幕打扰才会关

链接到点评
18 小时前,攸薩说道:

:SS04:转码不会说都很顺利吗

这种不一样的,比如说有时候你直接去下日文原版资源压缩包,然后解压的时候就会出现乱码,因为正常来说这类压缩包基本上不会带转码功能,只能按照压缩解压的算法把原文件给你弄出来,编码不一样也还是会乱码

而且这种算是文字编码上的问题了,可以这么说,编码只是读取二进制的一种规范格式,同样的二进制内容,用不同编码读出来的就不一样

比如说有一段二进制编码是01101110

你用一种编码可能是这么读的“0110“,”1110”,会拆分开,用另一种编码可能就是直接读“01101110”,这就会导致两种编码不仅内容最后读出来不一样甚至字数也不一样,不过我这个只是举个类似的例子,实际上原理差别还是有点大的)

然后没有专门的适配的话一般来说你对文本文档强行转码,是会有点问题的

链接到点评
9 小时前,哥特的亡零说道:

俺是开透明度,弹幕果然还是多点好玩,就是有点遮(:mx051:

说起来那些高级弹幕究竟是怎么来的(:kl:

我也有整半透明,不然遮挡的很难受

高级弹幕的话,一般都是有人弄了然后up主审核后就能放出来了吧,早期h5版本那种高级弹幕好像就是类似网页代码的样子,现在的我不清楚了,总之应该有专门的自己一套格式

链接到点评
18 小时前,攸薩说道:

:SS04:悔过处也可以减少

:SS04:原来,那样如果出现乱码会知道哪里有问题吗

一般都是从来源去推断,毕竟除了几个广为人知的锟斤拷烫烫烫以外直接从字节上去看编码还是比较麻烦的,我对这方面略微有些研究,因为我之前用的垃圾编程语言不支持最主流的utf8编码,导致我为了适配找了不少资料

链接到点评
18 小时前,哥特的亡零说道:

第一次看的时候还以为是UP自己弄的,直到看到有人评论说是观众,俺才开始好奇(:mx051:

不清楚up自己能不能弄,应该也行的吧

不过要说的话不用高级弹幕,只是玩字幕也能玩的很有意思,比如说热异常那首的字幕就做的很好

furobert看指路牌的时候拾起一片古怪的叶子,被河童用4节操买來高兴地吃掉了

链接到点评
19 小时前,攸薩说道:

:SS04:不过老游戏开不起来跟这有关吗

有点关系,不过似乎大部分还是游戏底层代码的缘故,因为有时候像这种文本编码其实可能不太影响游戏,所以才会有那种能玩但是文本都是乱码的情况

我觉得可以说是随着现在技术更新换代,旧的那些有很多已经不兼容了,代码也是,也包括硬件方面,可能架构上就不支持老游戏运行,就得另外折腾点什么模拟器之类的

不过像我用前面说的那个语言写QQ机器人,文字编码不兼容是很致命的东西)毕竟不折腾的话那么机器人能收到的消息就几乎只有中英文了,其它语言都收不到,emoji和特殊符号更是直接变成问号,这在使用上就会很麻烦,所以我才去研究文字编码,去捣鼓适配兼容我的机器人

链接到点评
19 小时前,哥特的亡零说道:

说起来弹幕爆满时,是不是会被清除一些旧的?:mx051:

是吧?好像就有不少老视频的一些精彩弹幕就这样被挤掉了,有些老视频的话up好像还会定期清理新的弹幕,避免老弹幕被挤掉

链接到点评
于 2025/1/26 于 AM5点15分,哥特的亡零说道:

如果不清理会变成什么样呢~:mx051:

应该就是一些有价值的老弹幕会被新弹幕挤掉吧,所以我很不喜欢那些什么考古之类的弹幕,既没有意义还会挤占弹幕空间

链接到点评
于 2025/1/26 于 AM5点18分,攸薩说道:

:SS04:不过表情方面你怎改善呢

一样的,虽然你看着是表情,但是这些其实也算是字符,和文字一样的,emoji,特殊符号,文字,都可以用同一种编码表示出来,其实本质上都是一个东西,只要搞定这些编码的兼容,就都能支持了,不过表情也仅限于emoji,像是QQ微信那些自带表情不算在内的

链接到点评
18 小时前,哥特的亡零说道:

突然有点好奇弹幕能不能做AA(:mx051:

应该也是可以的,利用高级弹幕可以做到很多事情,以前b站不是还有那种弹幕视频吗,就是up只发一个纯黑的视频,带声音,但是你不开弹幕就只能看到纯黑的画面,开了之后才能看到弹幕组成的画面,比如经典的bad apple这种

链接到点评
×
×
  • 新建...

重要消息

为使您更好地使用该站点,请仔细阅读以下内容: 使用条款