一个YouTube创作者正在将怀旧情怀和尖端技术相结合,将生成式人工智能与对任天堂标志性宝可梦游戏系列的怀旧之情融合,展示如何打造自己的AI动力宝可梦图鉴。
在宝可梦世界中,宝可图鉴是一个数字百科全书,记录着丰富多彩的怪物物种的数据,包括它们的特征、能力和栖息地。训练师们使用宝可图鉴来追踪他们的宝可梦遭遇并了解每个物种。
AI宝可图鉴项目是前谷歌工程师、Abe's Project YouTube频道主持人Abraham Haskin的创意。他们希望创建一个手持设备的真实版本,并利用现代技术来填补这一空白。
“主要是意识到我可以做到这一点,”Haskin在接受Decrypt采访时说。“我认为在电影、卡通和科幻作品中总有一些很酷的项目,让你想:如果这个存在了,那不是很棒吗?”
最初由总部位于东京的Game Freak于1996年推出的全球现象宝可梦,在1998年随着在美国推出《宝可梦红色版》和《宝可梦蓝色版》的原版Game Boy游戏以及美国电视上的同名动画系列的推出而来到美国。
任天堂和宝可梦公司过去曾推出过各种宝可图鉴复制品,但它们只是简单的玩具,而不是能够重新创造来自熟悉的视频游戏和动画小工具的实际功能的工作工具。
意识到技术已经足够先进,可以制作真实的宝可图鉴,Haskin转向OpenAI的旗舰AI模型ChatGPT,将这一设备变为现实。这个DIY宝可图鉴连接到本地Wi-Fi网络,使用ChatGPT和宝可梦API(一个粉丝制作的数据库)来识别当DIY宝可图鉴对准图像或玩具时的个体生物。
一款3D打印的、AI动力的宝可梦宝可图鉴。图片:Abraham Haskin
在演示中,Haskin展示了DIY宝可图鉴能够识别屏幕上的全彩宝可梦,但在识别玩具和微型模型时会更困难。
Haskin表示,虽然使用GPT-4技术可能会很昂贵,如果对系统进行数百次调用,但在AI实施方面,宝可梦项目只需要花费几分钱。
“如果你要制作一个网页应用程序或类似的东西,用来上传照片识别宝可梦,那可能会很快变得非常昂贵,”Haskin说,并补充说项目的语音克隆部分使用了Play HT音频生成式AI平台的免费版。
另一个利用宝可梦的流行文化影响力的生成式人工智能创作是由佐治亚理工学院的一个名为POKE 'LLMON的项目,该项目利用人工智能来理解并掌握类似人类的技能在宝可梦游戏战斗中。
自从去年初ChatGPT公开发布以来,AI幻觉一直是人工智能行业的一个持续问题。Haskin表示,虽然该项目确实需要处理ChatGPT的怪癖,但AI并没有给出过于令人担忧的回答或与宝可梦无关的答案。
“它确实有点靠不住。事实上,我考虑过添加一个功能,比如一个检查,两次问ChatGPT同样的问题,”Haskin说。“因为在某些情况下,它只是错误的,它认为它没有看到任何东西——就像在那张图片上什么都没有。”
然而,当再次提示时,Haskin表示ChatGPT会给出正确的答案。这只是处理生成式人工智能和ChatGPT、Claude AI和Gemini等大型语言模型工具这样的新兴技术的一部分。
大型语言模型(LLM)是指基于用户输入生成类似人类回答的人工智能,使其能够回答问题、撰写文本和生成图像。
“这些LLM有一种粘性;当你使用计算机系统时,它们没有你习惯的那种严谨性,”Haskin说。“所以在处理这种模糊性时,你必须做出一些让步,”他们说。“但它不会变得更糟,因为对ChatGPT的每个提示都是一个独立的事件。模型不会从我这里更新或学习,所以无论如何都不会影响它。”
回到他们对怀旧的热爱,Haskin表示,宝可图鉴项目可能不会是该频道的最后一个标志性的90年代技术项目。
“我真的很喜欢做一些看起来接近可能性边缘的事情,如果还有其他可行的事情,我肯定会考虑做的,”Haskin说。“我很想做一些90年代人们制作的东西的复兴。我很想重新制作并看看我们可以用现代技术做些什么更酷的东西。”
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。