第四范式发布AI大模型“式说” 现场演示文字生成软件

您所在的位置：首页 > 资讯 > > 正文

同花顺财经 2023-04-26 20:52:20

国内人工智能大模型又增一家入局者——第四范式发布的“式说3.0”。

4月26日，第四范式创始人兼CEO戴文渊现场演示了“式说”的各类能力，贝壳财经记者注意到，相比其他大模型，“式说”除了展示文本生成、图片生成和编写代码能力外，还在实机演示中重点展示了AI在B端的各类应用场景，如输入文字后自动判断任务，主动向用户提问，使用户可以直接用文本执行“装箱”目标的能力。

(资料图片仅供参考)

以此为契机，戴文渊提出了AIGS战略（AI-Generated SoftwareAI生成软件）：以生成式AI重构企业软件。他表示“式说”将定位为基于多模态大模型的新型开发平台，提升企业软件的体验和开发效率，实现AIGS，“C端产品已经逼近用户体验的上限，而B端的企业级软件往往是个十分复杂的执行系统，堆砌十几层菜单和成千上万功能也不算多，目前这些B端软件极为复杂的交互体验，以及复杂性带来的极低开发效率，恰恰为生成式AI留下足够大的重构和改造空间。”

“式说”有何能力？写作、制图、编程然后将三者结合“装集装箱”

贝壳财经记者在现场看到，第四范式一共准备了数个场景的演示，包括AI对话、AI群聊总结、AI生图、AI预定会议日程以及AI在金融、医疗、航空等领域的应用等。

“式说”首先展示了日常的文案写作功能，如生成旅游计划、编写研发大语言模型步骤等。其还展现了连续对话能力，在编写剧本的演示中，“式说”首先编写了一个《流浪地球3》剧本，当戴文渊要求“式说”在此基础上再写一个《流浪地球4》剧本，并加入第四范式公司元素时，“式说”同样完成了要求，“可以让第四范式科技公司的人工智能应用到电影中，比如让人工智能成为电影中一个重要角色，帮助救世主人公完成他的使命。”

此外，“式说”还展示了文生图和写代码功能，如“画一张配色鲜艳的篮球鞋”、“用VBA编写一个求两个数乘积的代码”。

值得注意的是，第四范式别出心裁地将上述三种能力“融为一体”，现场演示了“式说”执行集装箱“装箱”任务的流程。在实机演示中，戴文渊下达指令“帮我执行一个装箱任务”，之后“式说”在交互界面中展现了其“思考”过程，表示“我认为这是一个装箱任务”，给出了“任务目标”，并主动要求戴文渊输入集装箱尺寸、数量和其他约束条件，最后生成了装箱演示的动图，耗时1分钟左右，耗时无疑快于人工手动撰写方案。

“过去很难通过人类语言（自然语言）的方式去调用企业软件的功能，现在当我们有更强的语义理解和生成能力，再加上GPT任务翻译、任务分发和推理的能力，就可以通过更好的对话框式交互方式实现功能的调用，不再需要找到某个位于十几级的菜单目录之下的功能。”戴文渊说。

此外，针对B端的应用场景，第四范式还展示了“式说”对图片的理解能力，如输入图片后令其“找相同”等。

在戴文渊看来，要做到AIGS，大模型未必需要是知识广博、十项全能冠军的通才，更重要的在于模型具备Copilot（副驾舱），和思维链CoT（chain of thoughts，多步推理）的能力。

贝壳财经记者了解到，实际上“式说”在2.0阶段就加入了多模态和Copilot，这是因为很多企业软件里的数据是多模态的，而Copilot能把人的指令翻译成要调用后台的哪个API。此前发布的“式说”2.0的Demo中，门店员工通过语音、文本等交互方式向“式说”发起指令，“式说”理解后，联网门店监控软件调出后厨未戴口罩的图片，并直接将图片以对话框的形式输出给员工。

戴文渊表示，大模型去调用软件内置的一个个功能、数据来对话框式完成任务，已经能产生巨大价值。但员工用企业软件时也会面临复杂任务，需要人按照顺序执行一个个功能。因此，“式说”3.0强调的是Copilot加上思维链CoT，具有更强的推理能力，在学习大量数据和“攻略”后，能形成中间的逻辑推理步骤，从而做到拆分并执行复杂工作。

入局大模型如何选择发展方向？第四范式AI要走“AIGS战略”

第四范式方面对贝壳财经记者表示，在BERT（谷歌早年发布的自然语言处理框架）出来时，范式研究院就已经开始关注并投入在这个技术领域，GPT3出来以后更加明确了要朝这个方向。ChatGPT热潮对该公司最大的帮助，就是整个市场的信心一下从0调满，确定性的投入更大了，再往后就是推动产品和商业化。

该公司也透露了“式说”的迭代过程——“式说1.0”为在ChatGPT爆红之后推出的第一代产品，有生成语言的能力；“式说2.0”则在语言能力基础上，加入了文本、语音、图像、表格、视频等多模态输入及输出能力，并增加了企业级Copilot能力。以与企业内部应用库、企业私有数据等进行联网，对信息和数据进行分析，回答员工的问询或执行相关任务，从知识助手成为业务助手；“式说3.0”则在生成式和语言能力的基础之上，发力Copilot和思维链COT（多步推理、复杂任务拆分、形成数据飞轮），改造传统B端企业软件的体验与开发效率，因此称之为AIGS，以生成式AI重构企业软件。

在与国内大模型“同行”的对比上，第四范式方面表示，中国目前还没有像OpenAI那样在大模型上绝对领先的公司，也会有更多的大模型。大模型是新的生产力，大家都得有大模型作为底座，所以入局的门槛变高了，但是在达到这个门槛之后，重点在于如何选择方向。

第四范式方面认为，比较大的机会在于改造整个的企业软件行业，也就是AIGS。发力的大模型技术方向是Copilot可控（执行可控、知错能改），和思维链COT（（chain of thoughts，多步推理、复杂任务拆分）的能力，形成数据飞轮（比如将某垂直领域的数据和流程投入大模型，很快可以形成模型在该领域的思维链）。

戴文渊表示，第四范式的AIGS战略，就是指基于式说大模型背后的Copilot+COT能力，把企业软件改造成新型的交互范式，并在新型交互上不断地学习软件的使用过程，形成领域软件的“思维链”。最终，由于新的交互形式的出现，企业软件的开发效率变得更高。