状态
已推送
作者/预览/来源
季逸超Peak
Know-How分类
字数
3225
导读
AI 创业的核心在产品化和商业化,而不是底层技术。
Takeaways
真正有价值和壁垒的数据是来自特定领域或客户的独有数据
AI 创业的核心在产品化和商业化,而不是底层技术。
不要把解决的最显眼的limitation当作自己唯一的护城河
我们发现跟客户聊的过程中,其实有65%的需求,你最后都可以就集中理解成信息的检索汇总和再生成。
大家做AI,大家投入AI这么久才发现其实客户要的根本不是AI,不是模型,要的是一个解决方案。
Long Context的终极目标是能够高效地利用原本面向人类的教学资源。任何公司都会有知道怎么去培养人,比如说我们可能积累了对于新员工的培训的材料,要使用一个工具,我们可能有说明书,它可能这个说明书蛮长的,对于一个专业的软件可能几十页,上百页。那么如果我们能有一个更长的Context的话, 对于要实现一个新的任务,我们不需要让模型去单独训练,不需要去tune它,而是说我们把原来给人的材料让这个模型看一眼,那它可能通过说明书学会了使用一个资源,所以我认为这个东西对于模型的潜力是一个巨大的提升,绝对不只是一个输入长度这么简单的事。
不要给AI做插件,而让AI成为你自己业务的一个插件
你真正做AI创业的话,你必须要有技术之外的know-how
目录
Takeaways目录概要思维导图精华笔记01
真正有价值和壁垒的数据是来自特定领域或客户的独有数据。02
运营能力是兜底的能力,要建立更好的运营和反馈机制。03
AI 创业的核心在产品化和商业化,而不是底层技术。04
懂 AI 的产品经理是稀缺资源。05
数据是AI产品进步的基石,学会构建数据反馈回路。06
只有垂直应用,没有垂直模型。07
更长上下文对模型潜力是一个巨大提升。08
真正的多模态还远未到来。
概要
本期播客节目讲述了 AI 领域当前的发展局限和未来发展趋势,以及 AI 创业者应如何把握机会应对挑战。嘉宾季逸超认为,企业可以通过利用有限制发展的窗口进行创新和竞争;AI 创业者必须懂得创新的要点是找到自己独一无二的点;AI 产品的运营能力是应对落地难和复制难挑战的关键;AI 企业应关注核心业务和工程逻辑,尝试快速迭代;AI 产品经理面临前所未有的挑战,需不断思考人工智能发展形势,积极应对。
思维导图
精华笔记
01 真正有价值和壁垒的数据是来自特定领域或客户的独有数据。
现在最有价值的数据是“不属于你但与你共生的数据”。
这意味着什么?举个例子,我们为许多企业客户提供信息化解决方案。什么数据属于你?你训练的基础模型和框架属于你,但客户的数据不是你可以取走的,你要与客户建立一个使他们难以迁移的成本。
Fine-tuning 的概念有助于与客户建立共建关系。否则,在LLM时代,大部分业务可以简单地通过人工替换上下文来完成。
无论是做ToB还是ToC,要更关注能与之共建的数据来源。
Peak 在评论区的补充:「上下文和 Prompt 确实太浅了,算不上共生。我理解的共生可能是:客户在你的平台上搭建的流程数据、对某个场景/功能的反馈标注数据、为了兼容而转换得到的数据,甚至是一些仅与你的产品兼容的 LoRA。」
02 运营能力是兜底的能力,要建立更好的运营和反馈机制。
目前,不同供应商提供的语言模型能力非常接近。所以,关键是建立更好的运营和反馈机制,这也是与客户建立共生关系的一种方式,可以让客户难以切换到其他供应商。
从长期来看,在技术层面,我们可能会遇到一种新的语言模型,那就是运营能力可能以在线学习的形式融入语言模型本身。
就像任何企业都知道如何培养员工一样,你是否可以用培养员工或纠正人的错误的方法实现现场运营,这可能是一个有趣的方向。
运营是兜底的能力,大语言模型惊艳但不可靠,面对对幻觉零容忍的客户,要做一些 hard coding 的东西进去。后续能不能把运营能力作为一项服务供应给所有大模型,这只是我(Peak)的一个想法。
03 AI 创业的核心在产品化和商业化,而不是底层技术。
AI 的发展不是循序渐进的,你会感觉周期性地另起炉灶,之前流行的方向会被抛弃。这对创业者来说是好事,可以不断探索新的可能性。
但从技术角度来说,技术进步通常是在替代过去的实践,尽管底层技术有一定延续性。真正从事AI创业的人会发现,80%是产品工程,20%是底层技术。现在创业的话,10%的技术完成就不错了。
💡 这段内容让我想起前段时间 OpenAI 那场引起全世界关注的“政变”:
Sam Altman 还没有当年的乔布斯那么不可或缺,乔布斯的长项在对用户的理解、审美、对产品的感觉、商业的感觉。
Sam 强在产品能力、商业能力;Ilya Sutskever 则是殿堂级的技术能力。作为一家技术公司,产品能力和技术能力谁更重要?it's really hard to say…
为什么这个 Beta 版的乔布斯反转能这么大呢?
Sam 情商高、人脉好,nerd 只是他的一种伪装,YC搞定了半个投资圈的人。而且硅谷作为“冒险者的圣地”,可能更喜欢 Sam Altman 这样的人:做过产品、搞过投资、见过创业的各个阶段、连续创业者……
推荐收听 👉🏻 张小珺·商业访谈录
04 懂 AI 的产品经理是稀缺资源。
现在做的生成式AI产品,其不确定性、响应速度和服务成本与以前有非常大的区别。
举例来说,以前会关注QPS,每秒可以承载的查询数量,但现在生成AI产品的QPS可能只有0.1或更少,甚至包括Google和百度在内,其并发能力也非常差。
如果产品经理还按照以前的惯性思维来做,可能会把公司玩死。所以,懂AI的产品经理既要理解以前的知识,更要理解其中的差别。
05 数据是AI产品进步的基石,学会构建数据反馈回路。
使用 Midjourney 生成图片时,它会返回4个小的结果让你选择,这个过程中它完成了数据反馈回路的构建。
因为默认选中的图片比其他3张好,所以Midjourney的数据反馈率是100%。
一旦用户使用过Midjourney,就帮助构建了一次反馈数据集。而ChatGPT可能稍微弱一些,它只有一个赞和踩的选项,实际上很少用户会使用。
一个好的AI产品经理构建数据反馈回路是非常重要的。构建有效的数据反馈机制是AI产品成功的关键,这需要产品思维与设计。
数据是AI产品进步的基石。选项设置、默认设定以及交互体验都会影响用户的选择与反馈,这需要产品经理综合考量。Midjourney 的4选1设置与默认选择设置就是一例。
06 只有垂直应用,没有垂直模型。
许多人会认为先使用通用语言模型如ChatGPT,再训练自己的垂直领域模型。但这有一定的惯性,在GPT/通用大模型出现之前,要解决一个业务是没有“非垂直”模型概念的,所有的任务都在使用垂直模型。
垂直模型并没有解决通用模型的本质缺陷,如解释能力、运营能力、可溯源性;而事实上目前大多数垂直模型的性能不如 GPT-4。
这是因为对于通用大模型,数据和规模还远未达到饱和,任何有价值的新领域都会被整合,不存在 trade off,这是完全免费的提升,最终会被吸收。新增领域不但提高该领域性能,也提高全局性能,这是大模型最吸引人的地方。
垂直模型只在某领域提高,而大模型在全局提高。
总结:应用之间的差异应在业务而不是模型。
07 更长上下文对模型潜力是一个巨大提升。
目前语言生成模型的成功率很低。如果有更长的上下文,可以一次描述更长的任务,让模型在自身更好的记忆中完成。
但这不是最关键的,最关键的一点是,更长上下文的最终目标是高效利用面向人类的教学资源。这意味着,要让模型学习完成一项任务,不需要单独训练或调整模型,而是让模型阅读原来给人的教材如说明书。模型可以通过阅读说明书来学习使用一个资源。
所以,更长上下文对模型的潜力是一个巨大的提升,绝不仅仅是一个输入长度的简单事情。
产品经理需要从整体角度考虑AI技术应用,不局限于某一特定模型。大量高质量的数据和教材已面向人类开发,如何使AI也能学习与利用,将是一大机会与挑战。这需要在人与AI之间架起一座桥梁,让AI具备阅读与理解人类知识的能力。
💡 月之暗面Moonshot 创始人杨植麟有一期访谈观点 ——
杨植麟:长输入窗口和短输入窗口之间的区别,要比想象的更本质。
AI 一个很终极的形态是能够跟人建立长期的情绪价值,就是每一个人都可以有一个几乎无限长时间的终身陪伴。时间是一个很重要的维度,只有时间长了之后,你所有的信任、更复杂的情感,以及能够横跨几十年交互才会展现出来它的力量,这个时候它才有可能给人提供很深刻的精神上的价值。
这种情况肯定不能是一个需要每天重启上下文窗口的 AI 可以满足的。🤣
推荐阅读 👉🏻
08 真正的多模态还远未到来。
市面上很多号称是“多模态模型”的做法,其实还是一个预训练好的语言模型,注意是拿文本去训练的,他们做的只是把图片/音频等其他模态,通过一个适配转成能够融入文本特征、文本向量空间的东西。
它带来的最大问题是什么?这个模型所有对于世界的认知仍然来自它文本的预训练。
我们理想中真正的多模态模型的世界知识不应该不应该只来自于文本预训练,而应该是它在训练过程中见过这大千世界,看过youtube、知道每个梗到底是怎么回事…… 而不是只看过一些文本。
当输入是一篇图文,输出也是图文甚至是音频,这个模型的整体能力才会有一个质的飞跃,而不是现在这种翻译的感觉。