转跳到内容

【复活】数学算法挑战 —— 和上次完全一样的题目(有奖励)~


推荐贴

发布于 (已修改) · 只看该作者
6 分钟前,Tokur说道:

:mx043:可能暂时没有,起码也要几个月之后才有这种闲情逸致啦,最近都忙忙的,总感觉什么事情没做,之后还有什么事情要做x:xfccln1:

 

:NEKOMIMI_PARADISE_27:这方面四面体也有一模一样的感觉的说~

人生就是由不同的任务组成的说~

任务是做不完的说~

,由tetrohedro修改
发布于 · 只看该作者
7 小时前,tetrohedro说道:

:SS08:四面体再次成功烧毁了一个AI~

这道题实际上可以用AI做,只是得满足两个条件之一:

  • 智能体AI
  • 提示正确的方向

四面体这次在出题前已经反复让各种AI测试过题目的说~

有不少的AI在有限的提示下解决了这个问题,还有一个智能体AI不需要任何提示,就解决了这个问题。

字数: 112

所以是哪个AI不需要提示就能解

发布于 · 只看该作者
2 分钟前,safcz说道:

所以是哪个AI不需要提示就能解

:mx043:我也好奇,应该是某种带CLI agent的AI,光凭LLM自己估计做不到,肯定要带sage玩的。CLI Agent我都没用过,完全不熟,不过可能是Claude的?貌似有印象有这个功能

发布于 · 只看该作者

让chatgpt来做,到椭圆曲线的推导都很正常,结果后面写sagemath代码的时候就开始犯病出现幻觉,经典开始调用错误的属性和错误的函数,以及提前投降说此题无解,放弃本题了

顺便,如果暴力求解的话,ABC在-2000到2000的取值范围内,可以找到-1936, -1849, -1764, -1681, -1600, -1521, -1444, -1369, -1296, -1225, -1156, -1089, -1024, -961, -900, -841, -784, -729, -676, -625, -576, -529, -484, -441, -400, -361, -324, -309, -289, -256, -225, -205, -196, -193, -169, -144, -121, -111, -100, -81, -64, -60, -57, -49, -36, -25, -24, -22, -17, -16, -11, -10, -9, -4, -1, 3, 5, 6, 9, 10, 14, 15, 19, 40, 41, 53, 66, 87, 159, 261这几个系数的解

发布于 · 只看该作者

给一个等号右边给任意值的通用解法吧:

x/y + y/z + z/x = n
Step 1:
换元u=x/z,v=y/z,得
u/v + v + 1/u = n
Step 2:
换元X=-u, Y=uv,得
Y^2 + nXY + Y = X^3
即(a_1,a_2,a_3,a_4,a_6) = (n,0,1,0,0)的椭圆曲线
Step 3:
通过查表(例如LMFDB)或SageMath等计算工具得到椭圆曲线的rank,若rank=0,则很可能无解(用有限阶有理点推原方程的解很可能是错误的)。
若rank至少为1,则可以找到一个无穷阶的有理点,即可由此这个点推算原方程的整数解。
以下是求解的SageMath代码:

剧透

n = 92
E = EllipticCurve(QQ, [n, 0, 1, 0, 0])

E.two_descent(second_limit=15, verbose=True)
rank = E.rank()
print(f"EC rank = {rank}")

if rank < 1:
    print("Solve Failed: No inf-order points")
    exit()

generators = E.gens()
P = generators[0]
print(f"rational point P = {P}, order = {P.order()}")

X, Y = P.xy()
u = -X
if u == 0:
    print("Solve Failed: invalid rational point (X=0)")
    exit()

v = Y / u
den_u = u.denominator()
den_v = v.denominator()
z = den_u * den_v
x = u * z
y = v * z
g = gcd([x, y, z])
if g != 1 and g != 0:
    x //= g
    y //= g
    z //= g
print(f"Integer solution:")
print(f"x = {x}")
print(f"y = {y}")
print(f"z = {z}")

if x == 0 or y == 0 or z == 0:
    print("Check Failed: Invalid solution (Zero value)")
else:
    left = x*x*z + y*y*x + z*z*y
    right = n*x*y*z
    
    if left == right:
        print("Check Pass: the solution is correct")
        print(f"Left  = {left}")
        print(f"Right = {right}")
    else:
        print("Check Failed: invalid solution (Not equal)")
        print(f"Left  = {left}")
        print(f"Right = {right}")

然后是输出的结果:

剧透

Working with minimal curve [0,1,1,-1492439,701269845] via [u,r,s,t] = [1,-705,-46,32430]
Basic pair: I=71637088, J=-1212653937584
disc=5382104832
2-adic index bound = 2
By Lemma 5.1(a), 2-adic index = 1
2-adic index = 1
One (I,J) pair
Looking for quartics with I = 71637088, J = -1212653937584
Looking for Type 2 quartics:
Trying positive a from 1 up to 2821 (square a first...)
(1,0,-4232,4,4477272)   --trivial
Trying positive a from 1 up to 2821 (...then non-square a)
(277,176,-4190,-1340,16057)     --nontrivial...locally soluble...(x:y:z) = (-1891632 : 35661385544981 : 828271)
Point = [31972627018996679641497576950100026575573575:-18401847671127799092651220843820496649836:45351811426345621650009333682925120228141]
        height = 61.92236706
Rank of B=im(eps) increases to 1
Finished looking for Type 2 quartics.
Looking for Type 1 quartics:
Trying positive a from 1 up to 2821 (square a first...)
Trying positive a from 1 up to 2821 (...then non-square a)
Finished looking for Type 1 quartics.
Mordell rank contribution from B=im(eps) = 1
Selmer  rank contribution from B=im(eps) = 1
Sha     rank contribution from B=im(eps) = 0
Mordell rank contribution from A=ker(eps) = 0
Selmer  rank contribution from A=ker(eps) = 0
Sha     rank contribution from A=ker(eps) = 0
Searching for points (bound = 8)...done:
  found points which generate a subgroup of rank 0
  and regulator 1
Processing points found during 2-descent...done:
2-descent increases rank to 1,   now regulator = 61.92236706
Saturating (with bound = -1)...done:
  points were already saturated.
EC rank = 1
rational point P = (-11217639776756321041004430/1271734418987779814374290361 : -165129881198178499588183393974421656/45351811426345621650009333682925120228141 : 1), order = +Infinity
Integer solution:
x = 229365321791393105114775911058660762150
y = -10733680363511342830998605670315357876
z = 26002954279983814794511196680447493149805
Check Pass: the solution is correct
Left  = -5889615387302719627439057247103422259423225512549510026550109437132523984698081635906203006624869363617153515750404000
Right = -5889615387302719627439057247103422259423225512549510026550109437132523984698081635906203006624869363617153515750404000

和楼上给出的应该是同一组结果,只是轮换对称并乘了个-1

注:我在以上求解过程中尝试使用了Gemini、Grok和豆包(给了一定的提示),但没有一个完全做对的,Gemini和豆包都给出了无解的伪证,Gemini思路对了,但注意力不集中,换元时没有注意到正确的变换,导致后面全错,找了个错误的曲线以为rank=0无解。豆包则是用初等数论给出了一个伪证,看起来似乎像模像样,但实际上错误很严重,推理到后面就不记得自己在前面假设的条件了。Grok则不知道为什么一直沉迷于写程序穷举,给它提示后也只是换一种思路再写代码再穷举,然后说在它尝试的范围内找不到解。我把Gemini的伪证给Grok看,但Grok找不出真正的错误点。把豆包的伪证给Gemini看,倒是很快就发现问题了。从数学推理能力来看,Gemini在这几个里应该算是遥遥领先了。

发布于 · 只看该作者
8 小时前,Tokur说道:

:mx043:我也好奇,应该是某种带CLI agent的AI,光凭LLM自己估计做不到,肯定要带sage玩的。CLI Agent我都没用过,完全不熟,不过可能是Claude的?貌似有印象有这个功能

字数: 51

:NEKOMIMI_PARADISE_8:没错的说~

的确是Claude的说~

发布于 · 只看该作者
7 小时前,367ddd说道:

让chatgpt来做,到椭圆曲线的推导都很正常,结果后面写sagemath代码的时候就开始犯病出现幻觉,经典开始调用错误的属性和错误的函数,以及提前投降说此题无解,放弃本题了

顺便,如果暴力求解的话,ABC在-2000到2000的取值范围内,可以找到-1936, -1849, -1764, -1681, -1600, -1521, -1444, -1369, -1296, -1225, -1156, -1089, -1024, -961, -900, -841, -784, -729, -676, -625, -576, -529, -484, -441, -400, -361, -324, -309, -289, -256, -225, -205, -196, -193, -169, -144, -121, -111, -100, -81, -64, -60, -57, -49, -36, -25, -24, -22, -17, -16, -11, -10, -9, -4, -1, 3, 5, 6, 9, 10, 14, 15, 19, 40, 41, 53, 66, 87, 159, 261这几个系数的解

字数: 96

:NEKOMIMI_PARADISE_27:这张表看起来好熟悉~

四面体在出题时,准备了一张基本一模一样的表的说~

ChatGPT实际上可以解这道题的说~ 不过需要一些辅助的说~ 

如果将ChatGPT配合Codex和一些提示的话,就可以解决的说~

发布于 · 只看该作者
5 小时前,ikazuchi说道:

和楼上给出的应该是同一组结果,只是轮换对称并乘了个-1

注:我在以上求解过程中尝试使用了Gemini、Grok和豆包(给了一定的提示),但没有一个完全做对的,Gemini和豆包都给出了无解的伪证,Gemini思路对了,但注意力不集中,换元时没有注意到正确的变换,导致后面全错,找了个错误的曲线以为rank=0无解。豆包则是用初等数论给出了一个伪证,看起来似乎像模像样,但实际上错误很严重,推理到后面就不记得自己在前面假设的条件了。Grok则不知道为什么一直沉迷于写程序穷举,给它提示后也只是换一种思路再写代码再穷举,然后说在它尝试的范围内找不到解。我把Gemini的伪证给Grok看,但Grok找不出真正的错误点。把豆包的伪证给Gemini看,倒是很快就发现问题了。从数学推理能力来看,Gemini在这几个里应该算是遥遥领先了。

字数: 414

:SS04:看来有理点的高度还是不够高~

下次四面体如果出类似的题目的话,需要提升有理点的高度~

Gemini的数学推理能力的确鹤立鸡群,四面体在使用时也感到Gemini能够解决其他AI解决不了的数学问题。

发布于 · 只看该作者
于 2026/3/9 于 AM2点49分,TsumiKAMI说道:

你的意思是 只要让AI作弊 或者 略微作弊 就可以做得出来吗?!四面体大将!:mx051:

AI不作弊的话 连哲学题都做不出来 简单的说就是没有skills的加持 或者 训练数据特化的 情况下 

目前的通用型AI无法完成【检索】然后【重组】——它们会傻傻的爆窗口。

因此,解决方法是!

人类给出方向(作弊一)检索指引(作弊二)

增加窗口容量(能力提升1.0)

智能体重组(邪修1.0)

这种题目很不适合拟人系统的AI,交给专业处理数学题(批发数学问题)的家伙就对了。

【根据四面体大将的论述:得到的结论是!AI BRO并没有“独立”解数学题的能力,死因皆为性能不够和作弊】

于是正直的AI BRO 在吐司禁用提示词和联网以及skills的情况下 它们全部都给出了 【无法解答】 的答复。

————————————————————————————————————————————————

结论:复合型 or 人机协作 型 AI BRO 确实可以解题,但是 这完全属于专业领域人士使用专业知识解答专门问题,

完全无法实际应用(完蛋)【也就是说 不知道答案的人 是 无法得到答案的 而知道答案的人又没必要让AI去嘎嘎嘎】

是《四面体悖论一号》:mx057:

——————————————————————————————————

准确的说【无法解答】:指的是 AI BRO的计算力 无法给出【具体解】,

但它们都说,这道题必定存在整数解,但无法直接给出答案,需要外部软件。

 

 

 

太同意了,门外汉表示完全不懂椭圆曲线,所以也就完全不会给AI feed合适的提示词

×
×
  • 新建...

重要消息

为使您更好地使用该站点,请仔细阅读以下内容: 使用条款