这个人工智能将“所有人类烹饪”压缩到了2兆字节。

CN
Decrypt
关注
2小时前

约瑟夫·陈说他把人类所有的烹饪压缩到了两兆字节。这是一个大胆的说法。它也得到了验证。


陈是伦敦食品人工智能初创公司KAIKAKU.AI的联合创始人兼首席执行官,本周与研究员雅库布·拉季科夫斯基一起在arXiv发表了一篇论文,介绍了Epicure——三个基于来自七种语言的11个数据集中提取的414万份食谱训练的人工智能模型。结果是:一个包含1790种成分的地图,每种成分用300个数字描述,适合你的电子邮件附件限制,并且还有剩余空间。


“414万份食谱。7种语言。1790种成分。300个维度,”陈在X上写道。“人类所有的烹饪都压缩到了两兆字节。”



它并不是存储食谱


在你想象一个装满炒菜说明的两兆字节USB闪存之前,这个模型并不存储单一的食谱。这两兆字节更像是一个坐标表,而不是一本食谱。


可以把它看作是一张地图。每种成分根据其在全球数百万道真实菜肴中的表现获得一个精确位置。数学非常简单:1790种成分 × 每种成分300个数字 × 每个4字节 ≈ 2.05兆字节。这些数字编码了哪些成分一起出现,哪些成分共享风味化合物,以及哪些成分属于同一烹饪传统。一旦模型从食谱中学习到了这些,食谱就可以去掉了。知识存在于坐标中。


这实际上与word2vec于2013年在语言处理领域所做的事情相同,当时谷歌的研究人员展示了可以用意义进行算术运算。Epicure为食物做到了这一点。拿牛肉,指向美洲,你会得到面包、生菜,也许还有啤酒。指向东南亚,模型就不再考虑汉堡和烧烤,而是开始考虑酱油、生姜和芝麻油。





这是通过论文中描述的一个称为SLERP旋转的操控算子实现的。拿一个种子成分——鸡肉——并在数学上将其旋转到一个烹饪方向。在30度时,你开始看到德克萨斯-墨西哥地区。在60度时,鸡肉和牛肉在同一个墨西哥食品储藏室中汇聚:玉米饼、沙拉酱、蒙特雷杰克奶酪、波布拉诺辣椒。这个角度是“靠近这个成分”的拨盘和“到达某个新地方”之间的调节。


Epicure分为三个版本,选择哪个版本取决于你实际提出的问题。Cooc学习食谱共现——什么在真实菜肴中同时出现。Chem学习风味化学——哪些成分共享来自FlavorDB化学数据库的香气化合物。Core是前两个的混合。


问Cooc与巧克力搭配的东西,你可能会得到甜点储藏室的伴侣:可可粉、香草、杏仁。问Chem,你得到风味化学的同行:太妃糖、软糖、甘纳许。


相同的成分,不同的问题。寻找替代品的厨师需求与绘制风味相容性的厨师需求不同。


为什么这不是食物的ChatGPT


Epicure没有一般知识,没有语言生成,也没有想象出它从未见过的成分的能力。它知道1790种成分。对这个模型来说,这就是整个世界。它在广度上放弃的东西,在可靠性上得到了补偿——与食谱聊天机器人不同,如果你以错误的方式推动它,它们会自信地建议毒药作为烹饪成分。


这里的先前最先进技术是FlavorGraph,一个结合化学数据与仅英语的Recipe1M+数据集的2021年模型。Epicure引入了一个多语言语料库,规模大于四倍,并为效率清理了词汇。


实际用途并不难想象。一位厨师询问东亚的相当于地中海成分的东西是什么。一个食品产品开发者询问最小加工的替代品是什么,它与某种添加剂处于同一风味区域。当一个成分在储藏室缺失时,一个食谱应用需要一个连贯的替代品。最后这一点是专门构建的小模型安静超越大型通用模型的差距。


Epicure论文是一个研究发布。训练好的模型现在在Hugging Face上上线,互动成分地图在epicure.kaikaku.ai上公开访问。它们甚至发布了一个适用于你的代理的MCP。完整的训练代码目前尚未发布。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接