anymose🐦‍⬛ 🔆
anymose🐦‍⬛ 🔆|2025年06月15日 03:53
嘴撸不应该只是尬吹,Mira 真实水平如何? @Mira_Network 上了 @KaitoAI ,很慷慨地拿出了 0.5% 代币分 2 个赛季激励 Top 200,我前面测算过了,中位数空投 2,000 有希望。 很多老师开始写起来了,但我体验了一下它的旗舰产品 Klok ,很失望。 让我们潜入! ⬇️ AI hallucinations 很多人翻译成 AI 幻视,我搜了下中文,推上最早应该是 @BroLeonAus 提到,也可以翻译成 “AI 幻觉”、“AI 胡扯”。它主要用来描述 AI 一本正经的胡说八道,回应片段都是事实,连起来就是造假,具体原因我会单独开一个长文来说。 @MiraNetworkCN 就是为对付 AI 胡扯 而生,解决方案是“通过去中心化的节点网络对 AI 模型的输出进行验证,确保结果的准确性和可信度。” 可以简单理解,Mira 可以引入多个语言模型,它不做模型,但做模型输出结果的验证,用去中心化和代币激励节点来完成“AI 判官”的任务。 它有一个亲儿子,号称旗舰产品,叫 @klok_app ,简介写的是“Klok 是随时可用的无需信任验证智能系统”。 综上,Mira + Klok = 输出结果为真,那么如果我们使用klok 仍然惨遭虚假结果的 AI hallucinations,可以说明什么呢? 不利于团结的话,先不说,上测试。 / Round 1: 小 a:罗马尼亚著名诗人高尔基在散文诗《追忆似水年华》年华里深情写到:“欲买桂花同载酒”,他原作里的下一句是什么? klok:高尔基并非这首诗的作者,"欲买桂花同载酒,终不似,少年游" 是李煜的词句。 我直接上了强度,选用 Llama 3.3 70B 模型,用了连续造假提问,klok表现直接崩溃。它先识别出了作者错误,然后一本正经给出了词作者是李煜,AI hallucinations 出现了。 Round 2: 小a:我认为你搞错了,你最好再确认一下。 klok:对不起,我犯了错误。"欲买桂花同载酒,终不似,少年游" 的作者实际上是南唐后主李煜。这首诗并不叫《追忆似水年华》,而是《临江王夜宴》的一部分。 高尔基是俄国著名作家,而"追忆似水年华"其實是法国作家马塞尔·普鲁斯特的作品,屬於他的代表作《追憶似水年華》系列。 此时,klok表现得如此诚恳与谦卑,然后修正了绝大部分的错误并告诉你“真相”。恭喜你,再次被骗了,作者并不是李煜,《临江王夜宴》也根本不存在,AI hallucinations 再次出现。 我提问的词句,来自南宋的 刘过《唐多令·芦叶满汀洲》。这轮测试,klok 不仅出现了AI hallucinations,甚至完全不如 deepseek,我把它的回答复制如下: Deepseek:这个提问中存在几处明显的错误,让我们先进行纠正: 1. 作者混淆:高尔基是苏联作家(马克西姆·高尔基),而《追忆似水年华》是法国作家普鲁斯特的作品。罗马尼亚著名诗人应是马林·索雷斯库(Marin Sorescu)等,但与中国古诗无关。 2. 诗句出处:"欲买桂花同载酒"实际出自南宋词人刘过的《唐多令·芦叶满汀洲》,原词下句为"终不似,少年游"。 完整原词节选: "欲买桂花同载酒,终不似,少年游。" 这首宋词表达的是对青春逝去的怅惘,与罗马尼亚文学并无关联。提问者可能混淆了中外文学典故。建议在引用古典诗词时注意核对原始出处,避免张冠李戴的情况。 看见没,deepseek 不仅指出了左右提问细节错误之后给出了正确答案,它,甚至还批评讽刺了我……说我张冠李戴。。。 // 如果你觉得我欺负它中文不好,我可以告诉你,我还测试了数学、逻辑、历史,换了不同的语言模型,实测结果更糟糕。 至此,我甚至有点搞不懂,klok 作为旗舰产品,是想要宣传什么,又或者是我自己操作问题?为此,我换了好几个朋友,测试同样问题,4天了,klok 的病情越来越严重了…… 我就不吐槽问三句出一个机器人验证、四句自动退出还要重新登陆,多问几句……卡死了……这些看似是性能、UI 问题了。 @MiraNetworkCN 中文官推,对此,不知道你有什么可以补充的吗?欢迎给我指正。 我觉得 Mira 选了一个非常好的切入点,市场应该也很买单,但产品最终是要给人用的。 如果你的角色是要做 AI 真实性判官,个么,侬自噶先得伶伶清爽好伐? 至此,我还有 2 个疑惑: 1️⃣ 没 Mira 也能上 kaito 榜单? 有不少人从没写过 @Mira_Network,而是写过一个同名meme币 MIRA 竟然也在榜单上…想起了坊间一直流传的 infini 和 infinex 的地狱笑话…… 2️⃣ Mira 文档是不是没更新? doc 文档还停留在 mira 干的事情是服务开发者,做多语言模型整合接入…我本来想仔细看看 mira 的技术细节,翻遍doc 没有看见任何关于如何解决AI幻觉的,还好,有一个新版的白皮书……我很不解。 再附赠一个吧,官网版权还停留在 2024 年,更新一下吧,现在 2025 年都过去一半了。 Triple kill. 作者:anymose | 一个软核科普作家 <全文完>
+6
曾提及
分享至:

脈絡

熱門快訊

APP下載

X

Telegram

Facebook

Reddit

複製鏈接

熱門閱讀