产品展示
AI 在等开创性的用户界面和产品爱游戏官网
只是具体来看,到底巨头覆盖之下还有没有机会,机会在哪里,怎么把 AI 红利挖到尽,怎么设计原生应用,长期和短期如何平衡……都还存在非常多非共识。这是好事儿,乱七八糟的时候,像我这样的看法想法奇奇怪怪的人才有机会:)
启发 A:占据用户心智(品牌)很重要,Perplexity 占了 AI 搜索,ChatGPT 占了 Chat,Character AI 占了陪伴。做 AI 产品肯定第一时间想自己的技术壁垒、网络效应、数据飞轮,很容易忘掉品牌这事儿。但如果在产品侧没法做到永远绝对领先,做品牌也是很重要的——洗发水也没啥科技含量,但也有领导品牌不是?国内更典型的例子是 Kimi,其实 Moonshot 技术上也未必一骑绝尘,但长上下文这个 C 端也能理解和使用的品牌概念做得极好,以至于身边 10 个用国内大模型的朋友 8 个用 Kimi,哪怕其他模型也做了长上下文也不影响。所以说,如果能占据独特品类或者独特特性的心智,也是壁垒。
启发 B:我们现在和 AI 交互都是实时对话,但实际上,我们和人类交互不是如此——我们会异步地开不同的会,开会时安排组织不同的工作给不同的人,然后约定好下一个同步的时间或方式。所以,其实可以考虑两个更极端的 AI 应用方式,一是让真实世界更实时化,比如一边开会,就一边在旁边大屏幕上实时生成脑图和 todo,根据会议纪要还在不停擦除、修改、更新,让所有人都能看到信息的沉淀和流动;另一方面,则可以让AI 更懒一点,不一定都是实时交付,为啥不能是我回去想想,明天再和您同步呢?回去之后,它可以再找 5000 个 Agent 分别开 5000 个会再挑选总结再回来呀,如果计算便宜了,我们就应该更极端使用算力而不是优化效率啊。
启发 A:2024 年,人工智能领域可能的最重大突破爱游戏官网,应该是非常大的上下文与主动推理和自主思考的结合( very large context combined with active reasoning and thinking )。我也在思考和设计这方面的东西,不过受限于能力,只能在产品和 agent 机制层面玩,泪。
启发 B:大语言模型和印刷术是完全相反的两种技术,大语言模型是一种反向的宗教改革。说实在的原文没太看懂,但被这句话激发了很多思考——印刷术其实是把权力之源汇总到了一本小册子上,剥夺掉了相关的信息、解说和网络。而大语言模型则是反过来,不再提供正确答案,而是根据每个人每个场景具体问题,从隐藏空间里根据相关信息和网络,生成出相应的内容。我们不再会被书籍(或者网页)这种容器的带宽束缚,可以直接连接背后的 Latent Space。这样说起来,好像又从书面回到了很久以前的口语时代,可以直接听圣贤因材施教的时代。
◈ 现在我们要考虑上下文长度,就像是以前玩游戏时要半路换软盘一样(天啊,死去的记忆被唤醒了!)
启发 A:人类在 1969 年登月,但要到 1972 年才诞生给行李箱装上轮子的专利,而我们现在习惯看到的拉杆带轮行李箱,要到 1991 年才出现。未必简单的技术就会先落地,复杂的技术就会后落地。从这个角度来说,或许人工智能进步的关键并不在于数据、算力、能源,而是我们并没有找到恰当的用户界面和产品。
启发 C:说是生成式 AI,但观察苹果就会发现他们其实做了非常少的生成创造,而做了非常多的风格改造。或许就好像 Transformer 这个名字暗示的,我们应该把 AI 用在更多的 Transform 上,而不是 Create 上。
启发 E:最好的竞争位置,是可以影响到别人竞争胜败的关键位置。比如几大巨头的竞争,取决于谁拿到了足够的 GPU,能够第一个发布下一个 SOTA 模型(而不是第二个发布一个处于同一水平线的东西),那么英伟达就会在最能攫取利润的位置。
启发 A:解决空白页面问题已经是巨大价值。很多时候,从 0 到 1,从无到有,是创作时最煎熬的阶段。只要有了个东西(哪怕最后改得一笔不剩),剩下的事儿就简单了很多。AI 在大量的创造性工作上,就可以解决空白页面问题。
启发 B:多模态和迭代。原文讲得比较浅,举的还是 HeyGen 之类老例子。我自己觉得更猛的例子是 withaqua 和 krea。前者看起来只是个简单的语音输入框,但它不是微信这种说半天然后转成文字,而是你一边说它一边打字。更强悍的是,它会精确判断哪些话是内容,哪些话是指令,所以可以一边说话,说着说着忽然冒出来一句好像语气不太客气,前面帮我改客气点,把称呼从 Harry 改成刘总,然后前面文字就变了,我们就可以接着往下说。krea 则是左边一边涂鸦,右边跟着无延迟迭代出画,体验非常神奇——但 prompt 输入还是用输入框有点傻,画画和指令不能同时。如果可以我一边在天空画个圈,一边嘴巴说这是个飞碟,整体体验会舒服得多。
启发 C:创业团队的优势,可能正是啥都没有,必须从零开始。我们可以抛弃现有设计,直接思考如果要用 AI 解决用户的问题,应该具备什么特点,然后组装模型和技术来构建。但传统大公司则一定会在现有的产品上 +AI,会被已有的资源束缚。
启发 D:AI 的特殊之处是,它可以把任何东西转化为另一种形式爱游戏官网,比如把文字变成图,把文档变成 PPT,把 PPT 变成笔记卡片,把日记变成精神分析……一切都变成了液态,可以重新装到不同的容器(Form)里。而转化容器本身也可以成为一个可以交易或者分享的实体,比如 Imogen 就让婚礼摄影师分享自己的编辑风格模型,这样其他人就可以直接使用。以前最实在的内容本身,变成了流动的液体;而以前最虚无的风格之类的容器,居然变成了可用的实体。这实在是太好玩。
启发 A:举了个很好的例子,说的是AI 做简历判断这事儿时间周期有限,应该反过来想——企业要的其实是更了解这个人是否适合岗位,而候选人要的是更全面积极表达自己,过去只是因为人类的输入输出带宽被迫使用简历这种压缩形式,未来为什么不能直接用这个人所有数据或者部分数据(比如周报,比如即刻,比如微博)来直接交流呢?既然 AI 能看简历,它其实自然也能看周报,看即刻,看微博,为什么要让它一定要适应人类削足适履(目前来说,AI 未必有人类聪明,但一定比人类算力高带宽大)呢?
启发 B:智能无限供给的时代,最好的交互就是不需要交互。并不是说不需要 GUI 都换成说话聊天,而是应该把不必要的说话聊天也去掉——对于大部分打工人来说,几个人受过训练如何使用助理、如何给别人(AI)安排工作?好的 AI 应该自己有感知、有眼力劲儿,自己会来事儿,围着人转——就好像好的体制内下属应该总在揣摩上意,不用事事都等领导发话一样。这才是真正以人为中心的操作系统,而不仅仅是更方便的工具。
启发 C:张一鸣做内涵段子,做今日头条,现在看起来都只是在小池塘里做个不大的事儿。但重要的不是这两件事,而是验证了推荐引擎的重要性和能力,最终在抖音和 TikTok 上放大。从这个角度来说,在 AI 这个浪潮的早期,其实重要的不是做什么,而是怎么做,做法上越 AI 原生,越可能是新物种。哪怕出生在小池塘,但最后仍然有机会在下一浪的时候游向大海。
最后再广告一遍:如果你做出海的 AI Native 应用,而且有比较强的海外市场能力,欢迎找我呀,投资孵化都可以聊;或者,如果你关注过 Chirper 或者 Butterflies 这类诡异产品,对这条路的可能性有比较深思考的话,也欢迎来脑暴呀;再或者,你对于 multi-agent 机制设计有经验,也欢迎链接来参加我们的工作坊呀。爱游戏官网爱游戏官网爱游戏官网