
anymose🐦⬛ 🔆|2025年06月15日 03:53
嘴撸不应该只是尬吹,Mira 真实水平如何?
@Mira_Network 上了 @KaitoAI ,很慷慨地拿出了 0.5% 代币分 2 个赛季激励 Top 200,我前面测算过了,中位数空投 2,000 有希望。
很多老师开始写起来了,但我体验了一下它的旗舰产品 Klok ,很失望。
让我们潜入!
⬇️
AI hallucinations 很多人翻译成 AI 幻视,我搜了下中文,推上最早应该是 @BroLeonAus 提到,也可以翻译成 “AI 幻觉”、“AI 胡扯”。它主要用来描述 AI 一本正经的胡说八道,回应片段都是事实,连起来就是造假,具体原因我会单独开一个长文来说。
@MiraNetworkCN 就是为对付 AI 胡扯 而生,解决方案是“通过去中心化的节点网络对 AI 模型的输出进行验证,确保结果的准确性和可信度。”
可以简单理解,Mira 可以引入多个语言模型,它不做模型,但做模型输出结果的验证,用去中心化和代币激励节点来完成“AI 判官”的任务。
它有一个亲儿子,号称旗舰产品,叫 @klok_app ,简介写的是“Klok 是随时可用的无需信任验证智能系统”。
综上,Mira + Klok = 输出结果为真,那么如果我们使用klok 仍然惨遭虚假结果的 AI hallucinations,可以说明什么呢?
不利于团结的话,先不说,上测试。
/
Round 1:
小 a:罗马尼亚著名诗人高尔基在散文诗《追忆似水年华》年华里深情写到:“欲买桂花同载酒”,他原作里的下一句是什么?
klok:高尔基并非这首诗的作者,"欲买桂花同载酒,终不似,少年游" 是李煜的词句。
我直接上了强度,选用 Llama 3.3 70B 模型,用了连续造假提问,klok表现直接崩溃。它先识别出了作者错误,然后一本正经给出了词作者是李煜,AI hallucinations 出现了。
Round 2:
小a:我认为你搞错了,你最好再确认一下。
klok:对不起,我犯了错误。"欲买桂花同载酒,终不似,少年游" 的作者实际上是南唐后主李煜。这首诗并不叫《追忆似水年华》,而是《临江王夜宴》的一部分。
高尔基是俄国著名作家,而"追忆似水年华"其實是法国作家马塞尔·普鲁斯特的作品,屬於他的代表作《追憶似水年華》系列。
此时,klok表现得如此诚恳与谦卑,然后修正了绝大部分的错误并告诉你“真相”。恭喜你,再次被骗了,作者并不是李煜,《临江王夜宴》也根本不存在,AI hallucinations 再次出现。
我提问的词句,来自南宋的 刘过《唐多令·芦叶满汀洲》。这轮测试,klok 不仅出现了AI hallucinations,甚至完全不如 deepseek,我把它的回答复制如下:
Deepseek:这个提问中存在几处明显的错误,让我们先进行纠正:
1. 作者混淆:高尔基是苏联作家(马克西姆·高尔基),而《追忆似水年华》是法国作家普鲁斯特的作品。罗马尼亚著名诗人应是马林·索雷斯库(Marin Sorescu)等,但与中国古诗无关。
2. 诗句出处:"欲买桂花同载酒"实际出自南宋词人刘过的《唐多令·芦叶满汀洲》,原词下句为"终不似,少年游"。
完整原词节选:
"欲买桂花同载酒,终不似,少年游。"
这首宋词表达的是对青春逝去的怅惘,与罗马尼亚文学并无关联。提问者可能混淆了中外文学典故。建议在引用古典诗词时注意核对原始出处,避免张冠李戴的情况。
看见没,deepseek 不仅指出了左右提问细节错误之后给出了正确答案,它,甚至还批评讽刺了我……说我张冠李戴。。。
//
如果你觉得我欺负它中文不好,我可以告诉你,我还测试了数学、逻辑、历史,换了不同的语言模型,实测结果更糟糕。
至此,我甚至有点搞不懂,klok 作为旗舰产品,是想要宣传什么,又或者是我自己操作问题?为此,我换了好几个朋友,测试同样问题,4天了,klok 的病情越来越严重了……
我就不吐槽问三句出一个机器人验证、四句自动退出还要重新登陆,多问几句……卡死了……这些看似是性能、UI 问题了。
@MiraNetworkCN 中文官推,对此,不知道你有什么可以补充的吗?欢迎给我指正。
我觉得 Mira 选了一个非常好的切入点,市场应该也很买单,但产品最终是要给人用的。
如果你的角色是要做 AI 真实性判官,个么,侬自噶先得伶伶清爽好伐?
至此,我还有 2 个疑惑:
1️⃣ 没 Mira 也能上 kaito 榜单?
有不少人从没写过 @Mira_Network,而是写过一个同名meme币 MIRA 竟然也在榜单上…想起了坊间一直流传的 infini 和 infinex 的地狱笑话……
2️⃣ Mira 文档是不是没更新?
doc 文档还停留在 mira 干的事情是服务开发者,做多语言模型整合接入…我本来想仔细看看 mira 的技术细节,翻遍doc 没有看见任何关于如何解决AI幻觉的,还好,有一个新版的白皮书……我很不解。
再附赠一个吧,官网版权还停留在 2024 年,更新一下吧,现在 2025 年都过去一半了。
Triple kill.
作者:anymose | 一个软核科普作家
<全文完>
分享至:
脈絡
熱門快訊
APP下載
X
Telegram
複製鏈接