Tether,这家以USDT闻名的稳定币公司,刚刚发布了一款适合您口袋的医疗人工智能模型,其表现可能超越比其大十多倍的竞争对手。QVAC MedPsy今天由Tether的人工智能研究小组推出,作为一种新型医疗语言模型,可在智能手机、可穿戴设备和边缘设备上运行——无需云端支持。
标题数字:一个小型的17亿参数模型,尽管其大小不到谷歌的MedGemma-4B的一半,但在医疗基准测试中能够超越它。在HealthBench Hard——OpenAI的基准,评估AI在由262名医生评估的现实多轮临床对话中的表现——Tether表示其17亿参数模型的得分超过了MedGemma-27B,这是一种几乎大十六倍的模型。
参数是模型在交易过程中学习的所有配置和数值。理论上,参数越多,模型的性能应该越好。
来源:Tether
测试套件覆盖了MedQA-USMLE,该测试使用美国医疗执照考试风格的问题来衡量临床知识,得分为百分比精确度,一直到AfriMedQA,专门测试服务不足的非洲医疗环境的表现。
Tether首席执行官Paolo Ardoino将这一成果归因于效率而非规模。他在一份声明中表示:“通过QVAC MedPsy,我们的重点是提高模型层面的效率,而不是单纯扩大规模。我们的40亿参数模型在结果上超过了接近七倍于其规模的模型,同时每个响应使用的令牌少达三倍。”
这种令牌效率是另一个亮点。40亿参数模型平均每个响应约为909个令牌,而可比系统则为2953个——减少了3.2倍。更少的令牌意味着更低的计算成本、更快的响应速度,并且至关重要的是,能够在没有云端后端的情况下本地运行。
“您可以在已有数据的地方进行医疗推理,比如在医院系统内部或设备上,而无需通过云移动敏感信息或等待外部处理,”Ardoino说。
这些模型以量化的GGUF文件形式交付——17亿参数模型为1.2 GB,40亿参数模型为2.6 GB,压缩版本在大多数基准性能上保留了大部分功能,同时能够适配标准消费硬件。这意味着医院系统、乡村诊所或个别临床医生可以完全在设备上运行该模型,保持患者记录不进入第三方云基础设施,并避免HIPAA的暴露。
隐私的优势可能是一些人的重大利好,但即便按照今天的标准,利用人工智能进行医疗意见的使用也远非理想。一项牛津大学在二月份发布的研究发现,LLMs经常提供危险的医疗建议,给出错误答案、混淆的指导和处理细微症状的能力较差。研究人员并没有完全否定这项技术,但认为人工智能的角色应是“秘书,而非医生”。合规性问题使情况更加复杂:如今大多数医疗人工智能都将患者数据通过云服务器传输,使得每次医生输入查询时都会产生HIPAA暴露。
此次发布符合Tether过去一年的模式。上个月,它发布了QVAC SDK,这是一个开源工具包,用于在iOS、Android、Windows和Linux上构建本地离线AI应用。在此之前,它推出了QVAC Health,这是一款消费者健康应用,完全在设备上保存生物特征数据。MedPsy是专门为临床推理训练的第一款QVAC模型。
根据Tether自己的公告,当前医疗AI市场约为360亿美元,预计到2033年将超过5000亿美元。模型和GGUF权重现在可以在qvac.tether.io/models获取。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。