第四范式发布AI大模型“式说” 现场演示文字生成软件

同花顺财经   2023-04-26 20:52:20

国内人工智能大模型又增一家入局者——第四范式发布的“式说3.0”。

4月26日,第四范式创始人兼CEO戴文渊现场演示了“式说”的各类能力,贝壳财经记者注意到,相比其他大模型,“式说”除了展示文本生成、图片生成和编写代码能力外,还在实机演示中重点展示了AI在B端的各类应用场景,如输入文字后自动判断任务,主动向用户提问,使用户可以直接用文本执行“装箱”目标的能力。


(资料图片仅供参考)

以此为契机,戴文渊提出了AIGS战略(AI-Generated SoftwareAI生成软件):以生成式AI重构企业软件。他表示“式说”将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现AIGS,“C端产品已经逼近用户体验的上限,而B端的企业级软件往往是个十分复杂的执行系统,堆砌十几层菜单和成千上万功能也不算多,目前这些B端软件极为复杂的交互体验,以及复杂性带来的极低开发效率,恰恰为生成式AI留下足够大的重构和改造空间。”

“式说”有何能力?写作、制图、编程 然后将三者结合“装集装箱”

贝壳财经记者在现场看到,第四范式一共准备了数个场景的演示,包括AI对话、AI群聊总结、AI生图、AI预定会议日程以及AI在金融、医疗、航空等领域的应用等。

“式说”首先展示了日常的文案写作功能,如生成旅游计划、编写研发大语言模型步骤等。其还展现了连续对话能力,在编写剧本的演示中,“式说”首先编写了一个《流浪地球3》剧本,当戴文渊要求“式说”在此基础上再写一个《流浪地球4》剧本,并加入第四范式公司元素时,“式说”同样完成了要求,“可以让第四范式科技公司的人工智能应用到电影中,比如让人工智能成为电影中一个重要角色,帮助救世主人公完成他的使命。”

此外,“式说”还展示了文生图和写代码功能,如“画一张配色鲜艳的篮球鞋”、“用VBA编写一个求两个数乘积的代码”。

值得注意的是,第四范式别出心裁地将上述三种能力“融为一体”,现场演示了“式说”执行集装箱“装箱”任务的流程。在实机演示中,戴文渊下达指令“帮我执行一个装箱任务”,之后“式说”在交互界面中展现了其“思考”过程,表示“我认为这是一个装箱任务”,给出了“任务目标”,并主动要求戴文渊输入集装箱尺寸、数量和其他约束条件,最后生成了装箱演示的动图,耗时1分钟左右,耗时无疑快于人工手动撰写方案。

“过去很难通过人类语言(自然语言)的方式去调用企业软件的功能,现在当我们有更强的语义理解和生成能力,再加上GPT任务翻译、任务分发和推理的能力,就可以通过更好的对话框式交互方式实现功能的调用,不再需要找到某个位于十几级的菜单目录之下的功能。”戴文渊说。

此外,针对B端的应用场景,第四范式还展示了“式说”对图片的理解能力,如输入图片后令其“找相同”等。

在戴文渊看来,要做到AIGS,大模型未必需要是知识广博、十项全能冠军的通才,更重要的在于模型具备Copilot(副驾舱),和思维链CoT(chain of thoughts,多步推理)的能力。

贝壳财经记者了解到,实际上“式说”在2.0阶段就加入了多模态和Copilot,这是因为很多企业软件里的数据是多模态的,而Copilot能把人的指令翻译成要调用后台的哪个API。此前发布的“式说”2.0的Demo中,门店员工通过语音、文本等交互方式向“式说”发起指令,“式说”理解后,联网门店监控软件调出后厨未戴口罩的图片,并直接将图片以对话框的形式输出给员工。

戴文渊表示,大模型去调用软件内置的一个个功能、数据来对话框式完成任务,已经能产生巨大价值。但员工用企业软件时也会面临复杂任务,需要人按照顺序执行一个个功能。因此,“式说”3.0强调的是Copilot加上思维链CoT,具有更强的推理能力,在学习大量数据和“攻略”后,能形成中间的逻辑推理步骤,从而做到拆分并执行复杂工作。

入局大模型如何选择发展方向?第四范式AI要走“AIGS战略”

第四范式方面对贝壳财经记者表示,在BERT(谷歌早年发布的自然语言处理框架)出来时,范式研究院就已经开始关注并投入在这个技术领域,GPT3出来以后更加明确了要朝这个方向。ChatGPT热潮对该公司最大的帮助,就是整个市场的信心一下从0调满,确定性的投入更大了,再往后就是推动产品和商业化。

该公司也透露了“式说”的迭代过程——“式说1.0”为在ChatGPT爆红之后推出的第一代产品,有生成语言的能力;“式说2.0”则在语言能力基础上,加入了文本、语音、图像、表格、视频等多模态输入及输出能力,并增加了企业级Copilot能力。以与企业内部应用库、企业私有数据等进行联网,对信息和数据进行分析,回答员工的问询或执行相关任务,从知识助手成为业务助手;“式说3.0”则在生成式和语言能力的基础之上,发力Copilot和思维链COT(多步推理、复杂任务拆分、形成数据飞轮),改造传统B端企业软件的体验与开发效率,因此称之为AIGS,以生成式AI重构企业软件。

在与国内大模型“同行”的对比上,第四范式方面表示,中国目前还没有像OpenAI那样在大模型上绝对领先的公司,也会有更多的大模型。大模型是新的生产力,大家都得有大模型作为底座,所以入局的门槛变高了,但是在达到这个门槛之后,重点在于如何选择方向。

第四范式方面认为,比较大的机会在于改造整个的企业软件行业,也就是AIGS。发力的大模型技术方向是Copilot可控(执行可控、知错能改),和思维链COT((chain of thoughts,多步推理、复杂任务拆分)的能力,形成数据飞轮(比如将某垂直领域的数据和流程投入大模型,很快可以形成模型在该领域的思维链)。

戴文渊表示,第四范式的AIGS战略,就是指基于式说大模型背后的Copilot+COT能力,把企业软件改造成新型的交互范式,并在新型交互上不断地学习软件的使用过程,形成领域软件的“思维链”。最终,由于新的交互形式的出现,企业软件的开发效率变得更高。

猜你喜欢

[ 最近更新 ]