全部语种
分享
来源:雷锋网
作者:黄楠
2023 年 8 月 14 日,由 GAIR 研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主办的第七届 GAIR 全球人工智能与机器人大会在新加坡乌节大酒店拉开帷幕。
在AI创业大爆发的时代,作为一个国际性的 AI 论坛,此次大会吸引了众多亚洲的创业者和投资人。大会共开设 10 个主题论坛,聚焦大模型时代下的 AIGC、Infra、生命科学、教育、SaaS等热门领域的变革创新。在首天的「GPT时代的杰出贡献者」专场,硅谷先锋投资人、Fellows Fund创始合伙人 Alex Ren 分享了「硅谷视角下的 AI 价值创造」主题演讲。
过去半年,AI的创业如火如荼。对企业和消费者而言,AI 意味着更好的决策、更好的行动、更好的结果以及更好的体验。比起过去几年,现在的AI公司有的已经开始盈利,前景非常可观!
Alex Ren 认为,当前 AI 的投资可以从四个维度出发:一是生产力的释放,即 AI 驱动的工具自动执行任务并提供输出;二是对产业的改变,即使用人工智能优化流程以提高效率、降低成本并改善结果;三是 AI 中间层,指 AI 中间层连接 LLM 以构建可扩展和定制的 AI 应用程序;四是 AI Agent(AI 智能体),由 AI 代替人与机器进行互动并学习。
在与华映资本海外合伙人邱谆的对话环节中,二人还就 AI 如何颠覆社交媒体内容生产方式、初创公司的商业化路径等问题进行了探讨。
以下为 Alex Ren 的现场演讲内容,雷峰网作了不改变原意的编辑及整理:
我们是一家位于硅谷的风险投资基金,与其他 VC 公司看项目的角度不同,我们会从三个点出发:空间,即初创公司的空间在哪里;时间,技术发展的程度如何、是否已进入可大量商业化阶段;维度,公司的核心能力是什么、与大公司竞争的方法论。
围绕这三大维度出发,我们提出了 AI 投资的四大方向。
第一个方向就是生产力的释放,即 AI 驱动的工具自动执行任务并提供输出。今天用户已经普遍可以感受到 AI 工具带来的效率提升,比如用 ChatGPT 生成文本、写一首歌、或是写代码等等,很快就能完成。在我们投资的公司中, Gamma.app、Taskade、CodeComplete、Opus Clip 等几家AI公司,其技术模式都是通过 AI 工具组合来提供 AI 能力,从而提升模型在领域中处理问题的能力,提高工作生产率。
第二个方向是行业的模式转换。许多行业都会有自己的数据,例如生物、保险、家居服务等等,通过将 AI 嵌入至行业的 Workflow 中进行优化,可以提高效率、降低成本并改善结果。如我们投资的生物领域的Diffuse Bio,保险领域的Kyber,生活服务领域的LiveX AI等。
第三个方向是 AI 的中间层。如果说 AI 技术的底层是大模型,那在技术通往最终的应用之间,我们将需要更多的中间件,比如 LangChain、LlamaIndex 或其他面向某个领域或架构的中间件工具。如我们投资的Anarchy AI。
第四个、也是近一两个月最热门的一个方向,就是 AI Agent(AI 智能体),AI Agent 很早之前就被提出来,但直至 GPT 的出现,引起大家对 AI Agent 的思考,目前硅谷有很多工程师都在做这方面的创业,我们所投的 Anothermind.ai 正是一家新型的 AI Agent 初创公司。
简单回顾 AI 过去的三个阶段:最早是 Classical ML 时期,出现了很多从结构化数据和预定义特征中学习的统计方法。随后进入了深度学习阶段,神经网络可以从图像、文本和音频等非结构化数据中进行学习。Transformer 以后,我们也迈向了生成式人工智能和基础模型阶段,基于 GPT 方法可以生成各种文本、图像、代码或芯片设计算法等,可以说,生成式 AI 就是下一轮的突破。
我们团队自 2016、2017 年关注 AI ,可以发现,目前 AI 公司与此前的创业公司相比,其核心区别在于:过去几年中,以自动驾驶为代表的场景应用在盈利上未及预期,但今天许多 AI 公司均具备很强的盈利能力,我们已经可以看到一些 AI 公司在赚钱。
那么 AI 到底能够产生什么价值?我们将其总结为更好的决策、更好的行动、更好的结果以及更好的体验。
首先是用 AI 去做更好的决策,比如在市场销售场景中使用其分析信用评分、解析金融风险等。
第二,更好的行动,即通过用户动作推断、提供更好的推荐个性化服务。
第三,更好的结果,也就是通过优化来获得更好的产出结果。
最后是给用户提供更好的体验。举个例子,如果你在美国打电话给某个银行或航空公司经常需要等很长时间,用户服务体验非常差,但有了 AI 客服对内部流程进行优化后,用户的体验也能得到极大提升。
具体应用时,上述所提及的 AI 体验都需要有一个 Workflow 来完成。
举个例子,媒体写一篇文章需要经历稿件批注、编辑等流程后才能发表,如果借助 AI 从最开始的草稿、文章修改、总结等来进行辅助,使用 AI 和不使用 AI 情况下,其价值曲线会有所不同。
在没有 AI 辅助的情况下,受限于个人能力或速度效率,很快就会达到极限。但有了 AI 的帮助,即便是一个没有法律文书撰写经验的作家,也可以借助大模型来完成相关文书的编写,对内容进行有效的补充,同时通过人的不断学习,进一步提升我们创造价值的能力。在这个过程中,AI 通过理解人的需求做推断和执行,最后在写作的流程中完成对人的辅助。
这里简单介绍一下大模型如何用 Agent 来提升自身的能力。
由于大模型是基于历史数据进行训练的,因此无法理解当下所发生的事件。假设我们让大模型将今天东南亚所有城市的天气温度做个排名,这个时候,大模型就需要一些工具去能够同外界沟通以获取这些信息,再基于信息完成推理,这就是 Agent 的概念。也就是说,Agent 是大模型的眼睛、耳朵,使大模型能够理解环境,从而能够处理我们现在的信息。
接下来我想讨论的问题是,AI 能为我们做些什么事情呢?
主要包括三个方面,分别是自动化和辅助性 AI,即 AI 在 Workflow 里边如何将流程自动;释放创造性;更好的人机交互。
在自动化和辅助性 AI 中,我们可以用两个维度区分其不同价值。面对复杂度较低、任务量大的问题,通过将 AI 嵌入至 workflow 自动化流程,可极大提高企业的生产效率;在面对复杂度更高的任务时,AI 则是作为人的工具、扮演辅助性角色。比如在药物开发、材料设计领域中,任务本身比较复杂,对专业性知识的要求也更高,因此它所利用的 AI 能力往往不是一个会画画的 AI 所能解决的。
举一个我们之前投的用 AI 做项目管理的案例。在Taskade中,向 AI 发出一个市场营销方案的指令,并生成各种用户身份角色,将打包好的各种 PDF 文件交给 AI 作文本分析和处理,这种就属于任务驱动 AI。
它是一个集成式的任务管理工具,加上 AI 嵌入,可对完成的生产环节实现全流程管理。这个工具中很重要的一点,就是对用户行为的研究,以内容去跟用户做交互,内容的生产也可以直接根据用户行为来生成,并从用户侧得到反馈反哺模型,同时还可以借助个性化推荐把产品广告推送给用户。
因此我们认为,这应该是下一代电商、零售领域发展的大趋势。
要注意的是,基于大模型释放生产力这件事今天如微软等大公司也在做,初创公司又该如何竞争?
我们发现,很多大公司在 AI 产品体验上往往存在「最后一公里」未能达到的问题,也就是说,虽然它们的产品、技术能力非常强,但是在后期的迭代、用户交付体验等方面通常会做得比较差,这或许可以成为初创公司同大公司竞争的一个间隙——迭代足够快,给用户提升更好的体验。
例如此前我们投资的一家AI 视频生成公司Opus.pro,上线仅两个月时间已经收获了一大批忠实客户。用户只需输入一个 YouTube 视频链接,平台即可在三四分钟内生成十几个短视频,并将视频直接分发至 TikTok、Instagram、YouTube 上。类似的AI内容生成能力在游戏、电影等方面都有很大的潜力。
而在用户交互沟通上,AI 还可以解决在自然语言理解上的问题,例如人和机器的交互、不同地区语言的沟通等,与过去以 API Call 为主的交互方式不一样,大模型的出现使得交互方式也发生巨大转变,这种通过大语言模型理解、人机和人人交互的模式,形成了以 Agent 为主的全新交互范式。例如在翻译、搜索等场景,许多工作正在被 AI 重新定义。
但同时我们也要看到大模型的局限性。比如搜索的幻觉、信息滞后等问题。举个例子,当我们向 Google 搜索某个人的离职消息时,由于模型训练使用了大量过去的数据进行训练,信息未能及时更新时,大模型所生成的答案就会产生错误结果。需要通过人的指正或引导,对问题加以进一步的综合处理和迭代,最后才能得出一个正确的结论,这就是我们目前强调在搜索场景下的大模型革新。
在自动化测试应用上,目前 AI 也被应用于药物筛查、新材料设计等方面,比如在药物筛查设计领域,过去一个药物元素的研发周期长达 7 到 12 年,通过 AI 辅助可以有效缩短药物的研发周期。如我们投资的Diffuse Bio和Persist AI,分别将AI应用在药物筛查和药剂封装上面。
AI 生态系统和投资架构如今也发生了很大的变化。如果将最底层定义为 AI 的操作系统,这个操作系统中包括了各种框架,比如 TensorFlow、PyTorch、计算机硬件以及开放领域数据等。基于开放领域数据可以处理一些开发领域的模型,例如常见的各种 GPT 模型、Diffusion model 等,这是我们对最新的操作系统的定义。
在这个基础上加入垂直领域数据,这些数据是 OpenAI 或者 Google 等公司都不具备的数据,基于特定领域训练专有的领域大模型,辅以工具对模型进行更好的训练,解决向量数据库以及数据私有化等问题,加上今天很热的 Chat Agent 辅助人做一些事情,还有部分面向特定应用领域用 AI 重塑用户体验的工作。
过去,互联网将我们数字化,不管是人、场景、物体、或行为,基于数字化衍生搜索引擎、各种电商平台等,以互联网的形式对其进行管理。但到今天,我们所要做的事情,变成了如何将部分任务或 AI 可实现的问题做成 Agent,实现自动化、更高效地处理,这将成为AI下一个突破的焦点。
通过 AGI(Artificial General Intelligence、通用人工智能),未来 AI 超越人将成为可能,并将人释放至更具创造性、有价值的事情中去。我们可以转去做一些更有意思、有价值或是更需要「人」的能力的一些事情。AI 的发展潜力非常大,但我并不担心,在这当中,我们看到的是每一代的技术革新给人类带来的便利,使人类得以做更多有价值的事情。因此,我们也希望未来能够更好地为各个领域的创新者提供支持,在硅谷、在全球各地帮助大家创立一些伟大的事业!
邱谆:我在硅谷投资多年,近期主要是中美之间跑得多,比较关注中国企业出海的一些方向,AI 正是这当中最重要的一块。想请教 Alex 的第一个问题,刚刚你提到了许多关于 AI Value Creation(AI 价值创造),我们常说当中 Value Creation 的部分就是 AI,作为创业公司中的一个关键因素,可否分享一些案例是如何落地的?社交媒体和电商目前已经进入瓶颈期,AI 能否带来什么颠覆性的改变?从投资角度如何评估?
Alex Ren :当前我们看到很多关于 AI 的讨论,主要围绕如何融入日常工作生活帮人们节省时间提高效率,另一方面就是在娱乐和交互上。
AI 的一大优势在于其讲故事的能力,传统的故事内容生产无论是电影、小说还是 YouTube 上的视频,其背后都是人完成的。我经常举个例子,例如曹雪芹写《红楼梦》,贾宝玉出家、林黛玉死去,这个故事是既定的,但新时代的叙事逻辑中,每个人应该都能去体验红楼梦,并且所得到的结果是不一样。例如在我的故事里,我可以跟贾宝玉聊天,问他为什么要出家,我也可以改变林黛玉的结局。
因此,Gen AI实际上是一个产生新时代下内容叙事逻辑非常好的机会。每一代的社交媒体用新的方式产生内容,这种新的方式也产生了一种新的媒体,因此,新的媒体实则是一个高度个性化的叙事工具。电商同样如此,未来的亚马逊电商平台是不是可以用 Peer to Peer 的模式,用模型在背后去理解人的需求,匹配需求,甚至是生产。因此,这种传统大平台的形式在未来 AI 发展过程中或许将被完全颠覆,我们需要做的是找到、并放大这些机会,去产生新代社交媒体、新的电商平台,它的方式可能完全不同于我们今天所用的方式。
邱谆:这个很有意思,也提醒了我电商最早的形态其实是 P2P。确实,从 Unit Economics(单位经济效益)角度来讲,这种有太多人工运营干预的模式较难实现,但如果用 AI、尤其用大模型的方式,这可能变成一个很非常核心的方向。第二个问题,如果从商业化路径层面来看,能否给大模型创业公司一些方向?
Alex Ren :从初创公司的角度来说,我们要清楚自身的局限性,也即是我们能做什么?擅长什么?
正如我前面所说的,初创公司在跟大公司竞争时,其优势并不在训练模型或是做 Infra 上,反而在实现客户价值上有一定的可能性。中国创业者有一个特别的优势,就是在互联网时代学会了如何快速迭代、找到用户的痛点。消费互联网不是一个「你告诉我需求、我给你做」,而是「我们大家讲一句话,把一大堆泥巴扔到墙上,看哪一块可以黏住,我们就选择那个东西」的模式,这种模式今天做 AI 也适用。另外,我们要注意 adoption(落地)速度。市场上有三种不同的客户,一种是 To C,一种是 Prosumer(专业消费者),第三种是企业。就今天市场而言,显然 To C 和 Prosumer 的落地速度要快多了,但企业场景会更慢。因此在这个过程中,初创公司要想清楚你的落地场景、你的客户是谁,他们的痛点是什么?你 adoption 的速度快不快。如果落地速度比较慢,对公司发展而言是比较痛苦的,企业能够构建的就是技术门槛。当然这也可以做,但就相对比较慢一点。
邱谆:我也补充一下。其实今天我们看很多跟商业化相关的项目,我们还是比较看重创业者本身及其产业背景、他对应用场景的理解等。从大模型领域来看,中美初创公司路径差异主要有两块:一个是实现的路径,第二块是 adoption 的状况。从你的观察来看,二者有没有一些差异?
Alex Ren :今天不管是中国还是新加坡的创业者,普遍在 To C 和 To SMB 上比较有优势,但 To Enterprise 是比较难一些,因为企业客户在美国市场化这块也是一个很大的挑战,每个美国 To B 企业中都需要建立一个很大的销售团队和市场团队,这不仅是中国的公司,可以说是所有海外创业者都会遇到的挑战。
二者的差异在于,硅谷多数初创公司在 A 轮之前很少会讲宏观战略,更多聚焦在产品如何解决用户痛点,这个是最关键的,另外就是发展趋势,因此会更落地一些。硅谷往往强调 PLG,Power Lead Growth,通过产品功能的提升来吸引用户使用,这是一个核心捷径,关注用户每次对产品的问题反馈,再进行快速迭代。
邱谆:目前国内的AI公司非常多,不管是应用层、底层包括 Infra 层,大家都很活跃。相比之下在美国创业公司的 adoption 进度如何衡量?大概在一个什么样的阶段?
Alex Ren :现阶段比较成熟的是文本、文生图。从最早的公司 Jasper AI,到 ChatGPT,以及文生图领域的 Midjourney,其实它们落地的速度都很快。但它们共同的特点就是,都是面向 C 端的消费者或 Prosumer。
美国公司有一个很有意思的现象,就是比如说 Midjourney 是通过 Discord 这样的一个平台去调用的,即我们在互联网时代讲的网络效应,在 Discord 社区里使用 Midjourney 时,每次生成的图片用户都能看到,Prompt 也都能看到,有了别人的案例后我也可以来进行生成,这个网络效应就在用户之间互相学习,因此 Discord 也是一个很重要的产品发行平台,尤其是针对 Prosumer 来讲,大家可以很快形成社区。
这种模式对早期公司而言非常重要,在用户之间形成的网络效应能加速产品传播,使用户群体很快就爆发了。当然,就目前来说,现在爆发的应用还是以文本、二维图像生成处理为主,其他技术还不够ready,仍在发展中。