OpenAI的商业化道路 | 文雅的疯狂的学习笔记

type

status

date

slug

7.1 AIGC商业化的3个阶段

随着全球经济进入下行周期，科技行业重点聚焦在人工智能商业化领域。尤其是后疫情时代，企业更加强调降本增效，人工智能技术将有望成为创造者和团队在增强自身创作能力时的首选工具。因此，部分专家认为越是经济低迷时期，AIGC爆发的可能性越大，正如每次金融危机都会有娱乐性互联网公司出现一样。 同时，Gartner发布的2022年新兴技术成熟度曲线梳理出25项值得关注的新兴技术。其中涉及人工智能的技术达到5项，包括自主系统(autonomic system)、因果AI (causal AI)、基础模型(foundation model)、生成式设计AI(generative design AI)和机器学习代码生成(machine learning code generation)。这些技术中与AIGC直接相关的只要有3项：一是基础模型，是基于Transformer架构的模型，例如大型语言模型，它体现了一种深度神经网络架构，可以基于上下文环境计算文本的数字表示，强调单词的序列；二是生成式设计AI或AI增强设计，它使用AI、机器学习和自然语言处理技术自动生成和开发数字产品的用户流程、屏幕设计、内容和表示层代码；三是机器学习代码生成，它包括可插入专业开发人员集成开发环境(Integrated Development Environment, IDE)的云托管机器学习模型，IDE是基于自然语言描述或部分代码片段提供建议代码的扩展。具体到AIGC，其商业化未来预计将重点经历以下3个阶段。

感知冲击——尝鲜阶段

在感知冲击层面，用户通过A1GC获得简单、直接的感官刺激。这也是当前大量A1GC企业主要涉足的领域——聚焦听视觉层面的感知智能，包括AIGC绘画、制作视频、作曲等。从效率上讲，作为生产力工具，如果AIGC能把用户的效率提升50%以上，那么用户将无法离开它。可以预见的是，在未来相当长的一段时间内，AIGC将辅助人们进行内容生产。

💡

关于“聚焦听视觉层面的感知智能”，OpenAI近期也放出了Dalle-3,效果直逼Midjourney,可见其也想通过视觉层面的应用吸引流量。

在这一阶段中，AlGC的大部分技术尚未达到可以稳定投入实际生产环节的水平。在这个过程中，A1GC不论是生成图片、视频还是音乐，已经不仅仅是对内容的创新与生成，同时也是对内容格式的生成。AIGC提供了一种特定格式和媒介。比如PDF是一种媒介，短视频是一种媒介，这些媒介有特殊的格式，可以在不同的硬件和环境中以不同的形式进行展现，而用户可以通过提问的方式提供特定的信息。随着AIGC融入人们的工作与生活，这些媒介将实现打通和转换。比如，在驾驶的过程中可以通过语音来生成结果；在PC端可以通过图片生成结果；在手机端可以通过视频生成结果。因此，AIGC生成的不仅仅是一种信息，其本质上是一种“编程手段”。

💡

这一段中提到的点个人觉得正是OpenAI马上要推出的“All Tools”功能想要实现的，虽然技术还没有这一段中说的那么成熟，但是这也很可能就是未来的发展方向。

认知领悟——协助阶段

在认知领域层面，AIGC可以与对话、协作、创作等工作进一步融合。在这个阶段AIGC不仅仅是助手，更将成为虚实融合的重要载体，形成人机汇智的局面。这里面需要解决的一个问题就是AIGC当前生成的内容不可控。如何让AIGC生成的内容可控，人在这个过程中如何协作，以及如何让人工智能通过人的反馈来重新学习，这些将成为认知领悟阶段需要重点解决的问题。

💡

这一段是更加遥远的设想，说不定就真的是这样呢。

其中，“模块分析+个性化推荐”将成为重要的创新模式。针对特定行业结构化、模块化的内容数据成为行业发展的关键。

新生态链 -原创阶段

基于前两个阶段的积累和技术完善，AIGC有望在特定领域形成生态链，并为整个行业提供高质量的完整解决方案。这一时期AIGC将能够真正完成独立创作内容的工作。目前大的90%的们作是由人来完成的，剩下的10%由机器确助。未来这个止学有可能完全反过来，大部分的创作都由机器来完成。在这样的方式下，所有的内容创作公司都可能要迎来革命的浪潮。AIGC在各个领域将发挥重要作用。当前，AtOC主要应用于C端产品。大部分用户仅仅为了尝鲜和娱乐，他们还难以转化为付费用户。如果将AIGC用在B端让其相助工作流程或者推动提升工作效率，那么有望打造出一个可持续的商业模式。仅仅依靠AIGC绘画，企业难以实现持续性盈利，同时由于相关领域的门槛较低，竞争将非常激烈。从ToB的角度来看，需求和技术对商业模式都很重要，但需求才是关键。以人脸识别为例，即使人工智能没有出现，计算机视觉也可以用于人脸识别的场景，只不过人工智能技术的出现让人脸识别变得更加精准、高效。从AIGC所在的内容生成领域来看，本质上它还是一个创造性的行业。这也意味着和计算机视觉的工业需求相比，A1GC的发展将有所不同，AIGC更强调人为的推动，因此AIGC的商业模式更加不清晰了。

7.2 Al领域的企业发展

随着模型规模和自然语言理解等技术的不断增强，非常多的专业创作和企业应用会发生巨大改变。未来，AIGC将会有两个明显的发展路径：一方面是将人工智能融入现有产品中，将原来的解决方案效率提升数倍；另一方面则是通过新的人工智能技术创造山之前无法实现的新功能。总的来看，这两种发展路径的核心都是打破原有的产品价值链，通过技术的选代使得新的机会出现。这也意味着未来可能出现平台级机会。 环顾四周的主流应用和业务可以发现，大部分只是实现了“销售语言”，比如营销文案、邮件、客服服务，甚至是法律顾问等，这些都是基于语育和文字的表达，而且这些表达可以进一步转化成声音、图像、视频等形式。可以预见，这种模式将是移动互联网和云计算发展以来最具有颠覆性的创新之一。本节将参考移动互联网的发展历程来分析未来在人工智能领域会产生哪些类型的企业。

平台型企业

移动互联网时代，Android和iOS操作系统实现了移动设备端操作系统的全面垄断，两者的市场占有率超过98%，就目前而言其他平台基本没有任何超越或者颠覆的机会。在人工智能基础模型领域，虽然还没有出现类似的情况，但是OpenAl、谷歌、Stability.ai等机构之间的竞争正在如火如茶地进行，同时大量创业公司跃跃欲试。与云计算时代类似，Github网站几乎托管了超过一半的开源代码，未来也将出现类似的共享神经网络模型的社群。由于目前没有出现垄断企业，因此，机会对所有人来说都是平等的。如图7-1所示，平台型企业可以提供多种大模型，为下游应用提供API和模型服务，而下游的应用公司只需要专注产品开发和上层算法。平台型企业的这种发展模式将吸引大量人工智能开发者和服务商汇聚到自己的生态中，从而构筑活跃的商业氛围。例如，GPT-3的API接口让下游的应用公司可以不需要迁移学习直接将AI能力应用到自己的任务中，API接口发布不到1年就吸引了约300家公司调用其API。典型的“基础产品+云服务”通过API提供基础模型能力，将自身的人工智能能力经由大量下游企业嵌入各行各业的的应用场景中，推动扩大生产价值，同时带动平台型企业自身的云服务、算法有子算法、技术解决方案的增长。

目前平台型企业的商业模式发展有一定的规律，如图7-2所示。

首先是顶级的AI实验室研发出具有革命性的模型；然后实验室或者人工智能的科学家成立基础设施公司，依托模型提供API和对外服务；最后应用软件公司利用基础设施公司提供的API，专注于打磨自己的专属应用、服务客户。

今天比较成功的技术巨头几乎都是先做一个成功的产品，然后将这个产品变成一项基础设施，进而孕育出新的创业公司。这一规律从自然语言处理到图像、视频等模态反复出现。也就是说Model as Serice (模型即服务)不但是一种思路，而且已经实实在在地落地。以中国科学院自动化所的紫东太初大模型为例，该模型是依托中国科学院强大的技术突破力而绮造出的强大基础模型，日前它已经具备“以图生音”“以音生图”等多模态生成能力，主要应用在产业场景，比如智能座舱、工业设计等领域”。

💡

这部分我觉得与现在的OpenAI的发展态势几乎一模一样，OpenAI符合这部分关于平台级企业发展的许多特点。比如，现在只要是比较有名的应用，统统都成自己是基于GPT3.5/GPT4的，OpenAI为所有这些下游企业提供了接口服务。所以，现在看来，将OpenAI的出现比作多年前移动互联网巨头—-苹果的诞生毫不夸张。

应用型企业

基于移动终端的定位、感知、相机等功能的成熟，移动电商等应用的出现促进了移动互联网应用生态的繁荣。而这些应用在离开智能手机之后也难以存在。日前随着大型语言模型服务或者Transformer模型的不断演进，一批新的应用将会诞生，包括文案创意、语音合成、视频合成等，这些应用涉及销售、创意、市扬、消费者支持、医生、律师、程序开发等行业。若没有机器学习的突破，这些领域的创新将难以实现。同时，基于AIGC的开源模型，创业公司可以根据白身需求研发底层大模型并为其应用提供技术支持。目前搜索领域已经有大量基于AIGC的垂直领域搜索产品。例如 Perplexity AI就是一款基于人工智能大模型的搜索工具。如图7-3所示，Perplexity Al基于OpenAI的GPT3.5底层模型以及必应网络搜索功能，针对用户输入的问题给出答案。也就是说用户在搜索框中输入问题，按回车健之后就可以得到Perplexity AI返回的答案。这个答案然于必应搜索得到的信息源以及能层大模型的能力生成，同时答案后面还会给你出引用信息源的链接。未来通过自然语言就能过获得信息搜索结果的产品将越来越多。

这种方式对中小企业更为友好，因为并非所有企业都需要自己训练模型，同时难有一家企业通吃所有算法模型。大量创业公司可以在通用大模型的基础上资索新的商业模式和赢利机会，通过定制化服务和产品来满足市场需求。

💡

为创业公司的发展提供了思路

现有产品的智能化

虽然互联网时代和移动互联网时代之间的区别明显，但是在大部分移动正展网时代有价值的业务的身后仍旧能够看到互联网时代巨头的身影。比如办公软件Microsoft Office并没有消失，而是推出了在线版。未来，人工智能的能力也将模块化内置到用户量较大的应用当中。在Web浏览器、即时通信软件、在线会软件等领城，我们将有望看到整合了人工智能的成果，这些应用和产品将具备更高的智能化属性。例如微软公司将在Office套件中增加DALLE；Adobe公司将生成式人工智能生成工具添加到软件当中。 以插件的形式进行普及是AIGC早期发展比较好的切入点。这种模式可以克服用户数据和模型质量方面的不足，实现吸引用户使用和获得足够数据以完善模型的双赢目标，后续再通过人工智能原生应用来替换现有的应用。这个过程需要一定的时间，但通过用户黏性、数据和模型性能之间形成的飞轮效应，将推动AIGC产生可持续的竞争优势。

💡

这里的以插件形式进行普及毫无疑问就是现在OpenAI在做的事情，完全被他说中了。同时，这里提到AI 原生应用，的确，我个人也觉得插件始终不是最终解决方案，原生应用才能使效率达到最大化。

目前，微软公司推出的人工智能作图软件Microsoft Desiger搭载了OpenAl开发的AIGC工具DALL-E 2。如图7-4所示，只要输入文字，Microsoft Desiger就会自动为用户生成图像。此外，微软公司正在加快OpenAl的商业化推进工作，将把ChatGPT整合进微软公司旗下的全部软件，例如 Bing、Microsoft Office等，为用户带来更加高效的交互体验。另外，微软公司还将提供AI云服务Azure OpenA1，允许开发者在OpenAI的模型基础上搭建自己的应用，从而加速人工智能技术的商业化落地。

未来，越来越多的AIG功能将与现有应用或者平台进行深度整合和嵌入。AIGC绘画、特效等都将有望整合到短视频创作、直播娱乐、直播带货等场景中。人工智能原生应用将超出我们的想象，因此尽情打开想象力，最有趣的应用形态还在等待我们去发掘。

7.3 当下典型的AIGC变现手段

当前AIGC的应用多为场景式，而且大部分产品仍然处于免费试用阶段，收费的模式都较少。同时大多数产品还是轻量级工具，不具备更大、更丰富的内容场景。能否在互联网流量相对稳定的前提下有效触达更多用户，达到较好的活跃度将是巨大的挑战。接下来简单介绍一下已知的几种收费模式。

按照计算量收费

按照计算量收费的模式是指，以算法模型作为底层平台，允许其他产品接入并对外开放，按照数据请求量和实际计算量来收费。例如，GPT-3可以对外提供API接口，而模型不同，按量收费的模式也不同。2023年2月初，ChatGPT对外推出了包月订阅版本ChatGPT Plus，收费标准为每月20美元。仅仅一个月后(2023年3月2日)，OpenAI宣布开放 ChatGPT模型接口，用户可以将 ChatGPT集成到相关应用程序中进行调用。ChatGPT的API的收费标准调整为每输出100万个单词收取1.5美元。新的付费方案将ChatGPT的使用成本大幅降低。

💡

的确，API的使用既省钱又方便。

按照输出图像数量收费

按照输出图像数量收费模式主要是指，将AIGC系统的输出，如生成的图像、视频或者文本出售给用户。目前AIGC典型的应用(比如DALL-E等)主要按照生成平台产生的图像数量进行收费。同时，一些创业公司也在探索按照输出图像数景进行收费的模式。例如一款名为Avatar Al的应用(见图7-5)的使用费为40美元。用户上传几十张照片之后，该应用将会产出100张AIGC生成的用户头像，供用户选择和使用。同类型的还有Astria、AlProfile Picture等服务，它们都可以为用户生成一系列AIGC头像，以便在社交媒体中使用。

软件按月付费

采用软件按月付费模式的前提在于，创建出利用AIGC系统功能的新产品或者服务，并且能够直接销售给用户，或者以订阅服务的形式提供AIGC服务，客户可以使用AIGC来生成内容。A1GC应用以软件形式对外销售，例如个性化营销文本协作工具AX Semantics以1900元/月的价格对外销售。目前大部分C端AIGC工具以80元/月的价格对外销售。

模型训练费

模数训练费模式是排将AIGC技术授权给其他公司或者组织，用来改进产品或服务。AIGC模型的训练需要大量的数据和算力资源，成本较高。Stability为了训练Stable Diffusion模型，在亚马逊云服务中运行了超过4000个A100GPU集群，成本在数千万美元。针对个性化需求或者特定领域，AIGC模型公司可以对模型进行针对训练，从而收取模型训练费。另外，如果能够通过去中心化方式发行Token以激励用户提供训练模型所需要的数据，就可以解决AIGC生成中版权的问题。同时，通过发行Token的方式，可以激励用户提供训练模型所需要的大量算力，分散算力成本，实现成本共担，利益共享。当前AIGC应用和模型创新你追我赶，但是要想从小众需求变成大众需求，需要进一步提升AIGC的商业化空间，涉及开发者、服务商、云厂商、科研机构等产业链将AIGC纳入工作当中。目前AIGC的产业集中度还不足，应用场景单一，既需要基础模型来教育市场、构建典型案例，也需要开发者释放创意，挖掘更多的AIGC应用场景。

💡

这个盈利模式,emmm..，OpenAI说：”你直接报我身份证好了“。（估计就是按照OpenAI的盈利模式写的）

7.4 AIGC商业模式的困境

AIGC Inside 的商业化并不容易

我们不应过度乐观AIGC的商业化过程，商业化需要厘清需求，逐步建立好商业模式。要避免拿着技术找需求，如同拿着锤子找钉子一样，出现叫好不叫座的尴尬。

以机器人领域知名的波士顿动力为例，其机器人产品是业界的标杆，每一次的创新都会在国内外引发轰动，并且该机构拥有至少70篇机器人相关的专利文献，以及大量的美国国防部订单。但是在产品大放异彩的同时，波士顿动力并没有获得赚钱的能力，亏损不断，并且面临多次被出售的境遇。这种有技术能力，没有变现能力的现象，在人工智能产业经常发生。因此，如何让一项技术从实验室走向商场货架，考验的不仅仅是技术木身。AIGC目前已经在一些行业中涌现，应让AIGC融入普通人的生活，如同“Intel Inside”一样，才能构建起“AIGC Inside”的产业。

难以建立技术壁垒

AIGC从进入大众视野就和开源结合在一起，这在之前的技术发展过程中较为少见。其他已经进入开源相对成熟期的行业主要有以下特点：一是市场教育成本低，行业已经有了较为稳定的商业模式和客户数量；二是ToB领域居多，认知盲区小，企业客户普遍具有更理性的决策能力。开源者往往具有较高的技术能力和技术壁垒，想要把“蛋糕”做大，就需要用一定的技术成果来换取繁荣的生态。这既是对生态建设的考虑，也是对于企业自身能力和影响力建设的判断。但是，针对AIGC的发展，市场教育方面还有很大的不足，整个行业仍在探索的过程中。甚至可以说，作为一个具备较强C端价值的领域，开源可能在一定程度上造成AIGC绘画在商业模式方面的混乱。正是因为技术壁垒越来越低，所以投机者可以用很低的成本来追逐“风口”，导致我们难以评估AIGC的合理定价。 同时，那些直接用开源模型进行创业的机构，由于没有自己的算法和算力，很难形成自己的技术壁垒。因此，如果希望通过AIGC从一款单点的工具进化为能够在该领域独立生存的公司并产生持续的现金流，就需要企业在某些领域有自己独特的数据。另外，提供的产品或者服务是巨头不具备的API，这样的企业才有可能具备独特性。

💡

为想要冲出重围的AIGC企业提供思路。

探索自主的大模型及应用

在全球市场中，中文和中国元素是必不可少的，甚至会随着AIGC的创新而诞生更多的展现机会。同时，中国的内容产业规模庞大，领域众多。仅网络文学市场用户就超过5亿人，国漫产业市场规模超过千亿元，还有市场规模破万亿元的中国广告行业、市场规模达3万亿元的中国传媒行业等。当前随着数字经济与实体经济融合，AIGC发展的前置条件基本具备，必将快速带动相关产业发展。但是，当前大量的AIGC模型来自海外，这就导致这些模型很难准确地理解中国的语言和文化。另外，即使一些已经发布的模型，大多也是基于海外模型，例如国内某家游戏公司发布的AIGC绘画模型就是基于Stable Diffusion的底层模型。同时，国内的中文大模型缺少高质量的语料数据，导致中文版人工智能大模型难以与海外平台媲美。国内用户在使用海外的大模型平台的过程中遇到很多挑战，尤其是用户在使用提示词的时候需要将中文转化为英文，然后让模型进行图像生成，这里面会暴露出一些问题。一方面模型不能够充分理解中文的语义和描述，导致生成的画面不够准确，甚至南辕北辙。例如中文的“佛跳墙”是一道菜，但是在翻译成英文后生成的图像基本跟这道久负盛名的菜肴没有一点关系。另一方面模型不能理解中国的应用场景，比如中国的水墨画、中国传统文化等具有鲜明的中国特色，这让AIGC更多地停留在单纯的拼接绘画阶段，难以融入国内的特有场景和特色文化中。

💡

对国内AIGC发展现状的反思

好的，这就是今天要分享的这本书中关于AIGC商业化的内容了，个人觉得这本书写的还是很有思维和深度的，值得一读哦。

参考文献：

翟尤、郭晓静、曾宣玮.《AIGC未来已来迈向通用人工智能时代》[M] 北京瑞禾色彩有限公司,2023.106-118.