前言:看到多个AI硬件群里的小伙伴们热火朝天推广AI玩具等智能硬件产品,讨论各种微创新和分享合作资源,我们也从关键记忆角度提出一些自己的观察和思考,希望对侧重C端消费电子产品创新的研发人员有所启发。
你有没有过这样的体验?小时候陪你长大的那只毛绒玩具熊,虽然不会说话、不会动,但你就是觉得它"懂你"——哪怕只是你一个人的情感幻想。
可现在,我们有了能对话、会互动的AI智能玩具。它们看起来聪明多了,甚至还能讲笑话、背古诗。但为什么用不了多久,很多人就把它们丢到床底去吃灰?
因为它们根本不懂你!
然而,现在那些卖得火爆的玩偶,比如泡泡玛特的Labubu,根本不需要懂你也被抢购一空,为什么AI玩具一定要"懂你"呢?
很简单,因为常规玩偶是靠颜值,IP吃饭的,而AI玩具必须要靠AI吃饭。
靠AI吃饭就要发挥AI的优势,AI在手机和PC端的优势是什么"都懂"的万事通,而在玩具端的优势只需要个性化地"懂你",这也是情感陪伴的诉求。
在技术圈里,我们常常用"拟人性""交互性""智能化"来衡量一个AI玩具是否优秀。但真正打动用户的,并不是这些冷冰冰的参数,而是那个最朴素、也最难实现的关键词:懂你。
什么叫"懂你"?就是它记得你喜欢什么颜色、害怕什么声音、昨天刚说过不想听那首歌……更重要的是,它能在不同时间点之间建立联系,像人一样记住你们之间的"共同经历"。
这就像你和老朋友的关系——不需要每次见面都重新介绍自己,你们之间有积累、有默契、有情感基础。这种"熟悉感",才是用户愿意持续使用AI玩具作为情感陪伴的关键所在。
而这一切的基础,就是——关键记忆。没有关键记忆,就不会"懂你"。
人类记忆的"奥卡姆剃刀":人类大脑每天过滤掉99%以上的感官信息,只保留关键节点信息。就像宜家通过出口处的1元冰淇淋(终值优化),让顾客忽略漫长的购物路线。
在此,我们可以用峰终理论来解释关键记忆的重要性。
峰终理论(Peak-End Theory)由诺贝尔奖得主、心理学家丹尼尔・卡尼曼提出,它指出人们对于一段经历的记忆主要取决于两个时刻:峰值时刻(最高潮或最低谷-体验中最强烈的部分)和结束时刻(体验的最后阶段)。这两个时刻决定了人们对整个事件的整体评价,而中间过程的细节往往被淡化或遗忘。
对于 AI 玩具(智能消费电子产品)来说,用户对产品的记忆和印象同样遵循峰终理论。如在使用过程中,AI玩具应该能记录下用户的个性化信息(比如个人称谓,性别,声音等),以及与用户互动过程中的峰值时刻和结束时刻的信息。这些关键记忆可以在AI玩具与用户的后续互动中,被及时调用来改变玩具状态(如声音,表情和行为模式等)。
这就类似你下班回家,狗狗马上识别出你的声音,热情地冲过来,摇头摆尾,亲热地狂舔你。
关键记忆的时效性很容易理解。
如果一个AI玩具只能记住几分钟前的事,那它就跟一个得了短期失忆症的人没什么两样。你今天跟它说喜欢蓝色,明天它就忘了;你昨天教它念一首儿歌,今天它又开始胡编乱造;你说"别再讲这个笑话了",它每天给重复……
这不叫智能,这叫机械复读机。
我们在搭建AI智能体的时候,都有记忆时长的设置。如图:
这是百度的智能体后台之一。你可以选择搭建的记忆时长,如永久,一天,一周,一个月,三个月等等。
如图,阿里的智能体应用在启用长期记忆功能后,将自动创建长期记忆体(Memory)。长期记忆体通过记忆片段和记忆变量实现记忆管理。
如图,这是扣子智能体搭建的记忆时效设置,你甚至可以按天设置记忆的时效性。
有人会问:"难道每个AI玩具都要像人类一样记住十年八年的往事吗?那是不是太夸张了?"
其实不然。对于AI玩具来说,"关键记忆"的定义并不需要那么极端。关键在于它能否做到以下几点:
1. 记住用户的基本偏好(如性别、年龄、兴趣爱好)
2. 记录互动历史上的峰值和结束信息(如用户最高兴,最悲伤,最生气的事情)
3. 记录最近的重要互动信息(如最近一次情绪状态、最喜欢的活动)
4. 根据历史数据优化后续行为(比如避开用户不喜欢的话题,用户兴趣转变)
换句话说,它不需要记住你三年前说了什么,但至少要记得你最喜欢听的那几首歌。
这就像是你在咖啡店办了一张会员卡,服务员下次见到你时,不需要知道你第一次来的天气,但最好能记得你喜欢喝美式还是拿铁。
目前,包括国内的文心,通义,扣子,以及外网的Gemini,ChatGPT,Grok等,几乎所有主流的AI平台都提供了记忆时效性设置功能。
但是,这些对AI玩具来说,意义不大。
因为,AI玩具的每次互动都需要调用关键记忆数据,这些重复内容被反复调用产生的token费用,谁受得了。
所以,智能硬件企业往往会设置自己的服务器来存储和管理"记忆"信息。
既然关键记忆如此重要,那问题来了:如何设计一套既能记住信息,又不会侵犯隐私的记忆系统?
这其实是三个问题:
第一,记什么?
第二,怎么记?
第三,存在哪?
1. 记什么?
AI 玩具记忆内容采集的关键环节可以基于峰终理论。那研发儿童AI 玩具举例子,为方便存储并有效利用记忆内容,可从以下关键环节采集记忆:
情绪峰值捕捉:利用传感器和情感识别技术,检测用户在交互过程中的情绪波动,当检测到用户处于强烈的高兴、感动、惊喜等积极情绪,或愤怒、恐惧等消极情绪时,及时采集相关数据,包括当时的对话内容、场景、用户行为等。比如孩子玩 AI 玩具时,因玩具讲的笑话笑得前仰后合,此时就应记录下笑话内容和孩子的反应。
交互结束时刻:在每次交互即将结束时,采集用户最后的反馈和状态。例如,孩子与 AI 学习机器人结束学习后,记录孩子对本次学习的评价、是否还有疑问等信息,确保给用户留下良好的 "终值印象" ,也为下次交互提供优化方向。
习惯与偏好数据:持续记录用户在多次交互中的习惯和偏好,如孩子喜欢听什么类型的故事、喜欢在什么时间使用 AI 玩具等,这些数据虽然不是瞬间的峰值,但对构建用户画像、实现个性化交互至关重要,也是记忆内容的重要组成部分。
2. 怎么记?
这里我们可以借鉴心理学中的"记忆层级理论"。人的记忆分为感觉记忆、短期记忆和长期记忆。AI也可以模仿这种结构,构建多层记忆模型:
短期记忆模块:用于处理即时交互,比如当前对话上下文。
关键记忆模块:存储用户画像、行为习惯、情感倾向等核心数据。
遗忘机制:设定合理的数据保留周期,避免信息过载或隐私风险。
顺便说一下,欧盟《通用数据保护条例》(GDPR)确实要求AI设备和其他数据处理系统提供"遗忘权",用户有权要求删除其历史数据。这提醒咱们企业在追求个性化服务的同时,必须重视数据安全和隐私保护。
3. 存在哪?
这是整个系统的最大挑战之一。很多AI玩具采用云端存储,这样可以节省本地资源,但也带来了隐私泄露的风险。因为谁也不希望家长里短被存在在云端,这就是仿佛是达摩克利斯之剑,令人无法安睡。
所以,一个理想的设计是采用混合存储架构:
• 敏感信息本地存储(如人脸图像、语音样本)
• 非敏感行为数据加密上传(如互动次数、偏好标签)
• 引入差分隐私技术,确保即使数据被泄露,也无法追溯到具体个人
这种方式既保障了AI玩具的学习能力,又避免了"偷窥式"的数据采集。
就像一段没有记忆的感情,再热烈也只是短暂的火花。而真正的智能玩具,应该是那个能陪你慢慢成长的朋友,是你下班回家时第一个跑过来迎接你的"电子狗"。
它可能不会说话,但你能感觉到——它记得你,并表现出足够的亲热。
这才是"懂你"的本质,也应该是AI智能玩具未来发展的真正方向。