mistreee
帖子发自 mistreee
-
-
最近学校里的主课是越上越没兴趣了,各种频谱信号分析简直烦躁。还好只有一门这样的课。说起来咱还真是不务正业,身为一名电气专业的学生却点了码农天赋,更蛋疼的是咱主修分支是生物学(神经计算)。爱好是研究大脑和机械学习算法。最近刚刚花了几个礼拜写完了某个算法的实现。又看了些NLP(自然语言处理)的资料。然后就开始脑洞大开了
{:10_637:}大概就是想挖坑制作一个辅助翻译工具。。。。。。具体怎么做都没想好,大概需要先让电脑轰轰作响建立一个语言模型,然后从各个翻译引擎字典翻译库拉取资料排列组合,然后判断评估各个翻译的通顺程度,同时给翻译者提供多个候补翻译选项。然后翻译过程就变成了类似于审核修改的过程了。。。。。。
其实只是某蛋疼青年想测试锻炼下自己的水平
[fold=无聊的技术相关]词句的信息提取想自己实现一个基于深度学习的概率判断系统(用咱已经写好的深度学习库 http://www.github.com/mistree/GoDeep),语言模型的建立应该也离不开概率系统。不过不做具体的翻译。翻译文字可以直接在线拉取或者其他字典(http://www.github.com/mistree/AssistiveReader)咱已经写过类似的从翻译引擎拉取文字的代码了orz。语言模型的建立其实咱还在学习中,想边写边学。用语言模型来评估各种翻译的的靠谱程度。上下文人名和特殊名词之类的直接用正则全部提取出来。另外如果可能的话能获取各个已有的汉化文本提取应该能更好的建立语言模型(咱日文水平也就一般般自己看得懂)词向量还是其他实现方法咱还在琢磨
不过就咱目前的时间表,目测只有暑假回国才有可能把坑填上一点,有兴趣的也可以pm咱,主要还是想稍微练习下算法的实际应用[/fold]
-
-
-
-
-
-
-
-
-
ID: mistreee
ID本来是mistree,但是曾经n年之前注册的账户密码已忘,邮箱已不用,于是多加了一个e。说起来还真是巧合,就读专业是ee也可叫做eee,电气电子工程这方面。mistree本身有两部分组成,为中二时期产物,mist+tree=misty forest英文谐音mystery。本人三次元和二次元设定均为电工+疯狂科学家设定,最终理想是创造天网毁灭世界。
会说中文,英文,日文,c系语言,v系语言,m语言,能够和数学符号以及硬件沟通。
爱好人工智能,人工智能和人工智能,了解dbn或者htmcla的同好可深入交♂流。
n年之前大概注册过ss的账户,原因不知,目的不明。再次来访ss是从光影吧到尘埃吧到d吧最后才重新回到ss。
来访目的无他,提高绅士水平,增进绅士交流,和谐发展,共求进步。
虽然从未有过汉化经验,正在尝试帮助某绅士解决乱码边界检测问题,希望未来能更好的为绅士界做贡献。
-
-
-
-
-
-
举报一个疑似盗链
在 综合事务区
发布于
http://www.galgame.org/bbs/viewthread.php?tid=274826&extra=page%3D1
我没记错的话本作只有 @flamestar 完坑
https://sstmlt.moe/thread-60321-1-1.html
虽然记不清这里能否发举报贴,如果不合适请版主删帖或者移动(辛苦了