吃碗面的功夫,我随口用"灵光"搓出一个有8大功能的app,还不止(含灵光3大创新应用解锁)
作者:张顾问,一个天天在老板和研发团队之间斡旋的人

晚上吃面的时候,想到上高中的儿子这次英语考试没考好,原因居然是单词量不够,看不懂阅读理解文章,头疼。

突然想到蚂蚁集团新出的"灵光",号称全模态通用AI助手。这能干什么?

于是直接问了"千问",灵光有什么特色功能。

"千问"好像不太了解自己兄弟"灵光"的情况?!

隔壁邻居"文心"倒是比较清楚:

新晋高手"DeepSeek"更加门清:

这就有点搞头了,哈哈

我打开灵光,直接让它帮我做一个高中英语记单词闪应用

灵光表示:这个想法很实用 📚我先琢磨下怎么让记单词变得更有趣。

然后不到一分钟给我生成了这个:

这个速度和效果感觉还是挺惊人的,关键这是一个类似APP的应用啊!

增加更多功能

惊奇过后,我突然觉得这个应用有点过于简陋,怎么能没有中英互译和拼写测试呢?

灵光说很好……,马上扔给我这个

不愧是上线4天破百万下载量的AI啊,有点东西!

然后,我巴拉巴拉地加功能,每加一个功能,就一句话,然后灵光就马上开始快速生成新功能和界面,到最后是这样的:

包括英文发音,记忆曲线,闯关模式,积分奖励,单词本,游戏设定,颜色设定等差不多8-9个功能。直到最后加的几个功能灵光都承认"失败"为止

很显然,我把灵光闪应用的轻型模式搞得越来越重,直到它受不了了

但是,灵光的闪应用效果还是令人吃惊不小。

这种感觉就像是,吃碗面的功夫,谈笑几句,其他单词APP都要被干趴下了。

实体企业的创新应用

然后,我又想到灵光也许可以为实体企业的研发提供一些独特的创新应用。

法思诺今年帮企业解决了不少软硬件一体化融合创新的问题。

所以,我想测试灵光的全模态交互功能,让它快速开发电子产品的交互界面。

这是一个常用场景,比如,产品研发团队需要快速需验证电子产品交互界面的可行性。

我用一句话描述了需求:生成一款支持手势控制的智能音箱界面。

灵光智能体快速运行.....,手机有点烫

并在30秒左右生成了这个可互动的智能音箱交互界面,如下:

实际上不是手势交互,是触碰交互。最起码,你可以在这个交互的操作界面上播放声音和调节音量大小。

当然,你还可以继续要灵光生成一些酷炫的操作彩色光斑如:

这种交互应用功能未来有可能被大量用于各种面板设计中,尤其是消费电子和智能家居领域。

探索灵光的核心功能

我又问了问灵光,你的核心功能是什么?

灵光扔给我一张长图,我截了一小部分,如下:

我打算尝试一下生成3D图形的功能。

灵光然后生成了这个3D保温杯,虽然非常简陋,不过的确是3D的,可以上下和左右360度旋转。如图:

我希望灵光能美化一下外观和配色,然后灵光扔给我这个:

嗯,还是很丑。也许,如果能上传企业内部的零部件,这个3D模型生成功能会有更多用途。

灵光开眼:解析物理世界

其实,我最感兴趣的是第三个功能:灵光开眼,解析物理世界。

其他"传统"的AI智能体其实更侧重在虚拟世界,要求它们回答各种知识还算ok,但是要它们解决物理世界的问题,多是天马行空的想象(杜撰),很难落地。如果"灵光"具有更多与物理世界交互的能力,那么绝对是企业研发创新的一大助力。

我先尝试了一下灵光识别物体

还行,然后,我让灵光帮创建一个实物工具识别的应用

灵光马上给我甩过来这个

各种工具分类倒是比较清楚,但是,好像少了什么?"灵光开眼"呢?

然后灵光又马上补充完善这个功能,如图:

嗯,现在可以用这个来解析物理世界了,看看识别能力如何?

如果企业用灵光把各种设备,工具和应用场景结合起来,生成特定的闪应用,快速培训指导新员工,应该非常有效。

总结与展望

总体体验下来,感觉灵光的各种新功能还是非常有特色的。尤其是闪应用,各种简单的应用工具快速生成,绝对秒杀很多小型软件开发公司。

再联想一下,人类学会制造工具,是人类演化史上的 "奇点" —— 它不仅解决了人类生存难题,更从根本上改变了人类的未来,推动人类从 "生物物种" 跃升为 "文明缔造者"。

那么,AI学会制造工具后呢?(有点细思极恐)

我最期待的是灵光开眼功能的完善。因为它的识别错误也不少,比如:

如果灵光开眼的物理解析能力获得极大增强,那么,对咱们实体企业技术研发和产品创新将是大有助力。毕竟,咱们也不能总活在AI的幻觉中。