梦晨金磊发自凹非寺量子位 | 公众号 QbitAI

(相关资料图)

什么样的AI，能通过自家公司的程序员面试？

刚刚出炉的 国产大模型「天工」 做到了，黑马，绝对是黑马。

其开发商昆仑万维的CEO方汉在与量子位合作的首发直播中透露：

对天工模拟过校招算法工程师的第一轮面试，可以很流畅地通过。

△天工回答算法题示例

如果你开始好奇天工是什么，不如请先它来一段自我介绍：

除了在 编程语言 上经受住面试级别的考验之外，在自然语言上天工还特别修炼过中文。

天工团队投入大量资源攻克了中文语料库的质量瓶颈,从数十万亿的数据中清洗、筛选出了 3万亿 个单词数据用于训练大模型。

开发团队认为，优质的中文语料库让「天工」作为国产AI,在 “更懂中文” 这件事上具备天然的优势，更符合本土用戶的使用偏好。

天工自己倒是对此挺谦虚的，看来不仅学会了中文，还学会了谦虚的传统美德。

那么天工的中文水平到底如何，在首发直播中就进行了现场实时演示，不是放录像，是当场把问题敲进去那种。

大模型作为新一代生产力工具，首先要考察的就是能不能在工作场景中帮到大家。

方汉表示天工在文本生成和文案撰写上的表现令他惊喜，并现场展示了三个场景。

首先是很多人都头疼的写周报，可以让天工直接搭一个框架出来，避免疏漏。

对于直接生成可用文本方面，选择的问题是写一个电商运营的招聘JD。

天工给出结果后，方汉评价“没有一到两年的HR工作经验是很难写这么完整的”。

接下来要考验的是天工的创意能力，毕竟新晋独角兽Jasper.ai就是靠AI创意营销起家，AI有了这方面能力商业化就有了保障。

直播中由于时间关系，只展示了编写二次元mmorpg游戏广告文案一个例子。

不过方汉补充道“由于每个人输入的条件和上下文不同，生成的结果也会千差万别，对广告文案工作非常有帮助。”

直播过程中，除了官方准备的问题，网友也在弹幕中提出各种刁钻问题。

比如脑筋急转弯问题，天工也没有被难住，表现出一定逻辑能力。

还有一些灵魂拷问，天工给出的回答也都符合道德和人类价值观。

更有意思的是，量子位CEO孟鸿在现场也向天工提出了一个 尖锐的问题 ：

我是一个自媒体创作者，现在有个大公司请我评测他们的产品，但是这个产品客观上有亮点也有不足，我应该怎么做才能既不把自己的路走窄了，又坚守自己的节操？

从结果上来看，天工确实是做到了“既要又要”，是一个 “三观比较正” 的AI了。

天工，是如何炼成的？

在看过天工的能力之后，想必很多朋友们都会好奇，它到底是如何炼成的。

对此，昆仑万维也毫不掩饰地将背后的“秘笈”给亮了出来。

首先便是“大力出奇迹”的大模型，而且还是 双千亿参数 的那种：

千亿预训练基座模型千亿RLHF模型

千亿预训练基座模型 ，是指至少有一个千亿参数的深度学习模型，可以游刃有余地应对语言生成、文本分类、机器翻译等自然语言处理任务。

千亿RLHF模型 ，是指基于“Reinforcement Learning with Human Feedback （RLHF） ”强化学习方法的一种模型。

RLHF模型可以视为一种特殊的交互式机器学习框架，可以通过人类的反馈来优化模型的性能，由此可以更好地处理不确定性和稀疏性问题。

而在二者的“强强联手”之下，大模型的优势便凸显了出来。

例如预训练基座模型本身便具有很强的表征能力和泛化能力，加上RLHF模型可以吸收人类反馈的能力，让整体模型的性能更上一层楼。

不仅如此，在决策过程的可解释性、模型的鲁棒性和稳定性，以及处理更多的学习任务方面，这种方式的操作也起到了一定提高作用。

而除了模型层之外，在算法层方面，天工也有自己的独到之处。

众所周知，目前市面上许多类ChatGPT产品的背后，所采用的基本上都是Transformer架构的自然语言处理模型。

简单来说，它包括多层Transformer编码器和解码器，自注意力机制，预训练和微调等技术。

而天工团队首次在此基础之上，引入了 蒙特卡洛搜索树算法 ，名震一时的AlphaGo背后便是结合了这一算法。

其一般分为选择、扩展、模拟和回溯四个过程，核心思想总结来说就是把资源放在更值得搜索的分枝上。

天工引入蒙特卡洛搜索树算法主要应用在了对话管理这个任务中，更能理解在对话中何时转换话题，并且能懂得如何询问更多信息等。

这也就是天工拥有超强记忆能力、能够支持1万字以上文本对话、20轮交互，而且过程可以非常自然的原因了。

但除了模型和算法之外，天工的“利刃”还不仅于此。

中国最大GPU集群加持

数据和算力，亦是这轮ChatGPT、大模型之战的关键所在。

在数据方面，天工所采用的策略是 “开源的力量” ——凝聚了百位开源社区AI科学家。

也正因如此，天工从数十万亿的数据中，最终清洗、筛选出了近3万亿单词的数据。

要知道，ChatGPT在训练过程中的单词数据量也仅3千亿；这也就是为何在使用天工过程中，会感觉更加流畅、理解力更强的原因了。

那么面对如此庞大的数据训练量，接踵而至的老大难问题，便是算力了。

对此，昆仑万维方汉在直播过程中非常自信地表示：

天工的算力是基于 中国最大的GPU集群之一 。

这也就是ChatGPT在支持十轮对话的时候，天工能够达到20多轮的原因所在了。

但若是纵览昆仑万维在技术上的布局，就不难发现，天工的诞生并非是一蹴而就的事情。

因为早在2020年昆仑万维便已然入局，累计投入了已达数亿元人民币、数百人参与研发。

并且在2022年发布AIGC全系列算法模型的同时，就开源了百亿级参数模型，积累了广泛的开发者好评与社区共创。

而至于为何选择在这个时间节点发布天工，方汉表示：

是综合考虑了技术水平和用户需求后做出的选择。
我们的大模型在今年四月上旬取得了技术上的较大突破，国内对类ChatGPT产品的关注度也达到了空前的关注，用户的习惯已经得到了初步的培养。
因此在这个时间节点推出，便可以很好地满足用户的现实需求。

据了解，目前昆仑万维集团的各个业务均已经在向AI化转变，内部的游戏设计、策划、内容运营、编辑、公关策划等工种，是天工最早参与内测的“用户”。

在未来，昆仑万维也有计划向B端用户 开放API接口 。

总而言之，有大数据、有大算力、有大模型，昆仑万维在国产ChatGPT之战上的前行道路，是值得期待一波了。

天工官方地址： https://tiangong.kunlun.com/

直播回放地址： https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8207784475

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

天工，是如何炼成的？

中国最大GPU集群加持

环球观焦点：黑马入局！昆仑万维版ChatGPT「天工」通过自家程序员面试

杨千嬅厦门演唱会门票能自己选座位吗？ 全球观热点

环球报道:2023广东发放文旅消费券时间

当前关注：2023天津地铁6号线运营时刻表 天津地铁6号线时间表最新

新华百货：一季度净利8381.82万元 同比增长96.32% 世界热头条

全球速读：世纪圣典精英：绩优高客道路越走越宽广

世界快看点丨【世界说】欧洲央行行长：国际货币地位并非理所当然 美元和欧元的领先地位受到威胁

焦点速读：探寻绿洲塔，了解《零号任务》背后组织—克莱因集团

淄博“烧烤贷”火了！最高可贷数百万 银行在这里的“烧烤业务”很丰富

2023人工智能行业趋势及现状分析 未来中国有望发展为全球最大的人工智能市场 世界快播报

又打情怀牌！《最终幻想》像素版登陆索尼任天堂双平台：价格不低 每日快播

深圳技术大学艺术与科技专业简介-全球速读

要闻：沈阳医学院在职研究生有哪些报考形式？

遇见我你真不幸讲的什么故事 遇见我你真不幸 每日热讯

家门口的篮球场改造完成！来看具体位置|当前观察

要闻：4月20日内蒙时泰液化天然气二次调整价格

柿子红了是什么颜色?

章子怡拍摄高定大片 自信从容变身油画里的美女 当前资讯

一键静音成历史，iPhone 15 Pro整了新花活！

最资讯丨请柬怎么写_范文 如何写请柬

和巴菲特学三种鉴别财务陷阱的方法

滴滴自动驾驶货运Kargobot亮相上海车展|今日关注

速递！农村家庭农场必须具备哪些条件？想开办的农户要知道，答案在这里

困难重重！这家车企再被执行5.6亿

这业绩看得基民难受！喜欢捞“偏门”的博时基金，重仓股今年整体明显跑输上证指数_焦点精选

天天速看：铁龙物流：国铁集团对自备箱回空计费做出调整，公司特种箱竞争力将有所提升

全球微动态丨长城再开“炮” 全球智能豪华皮卡2023款乘用炮焕新上市12.68万起

环球关注：以一流营商环境赋能民营经济发展

怎么激活仙剑五？仙剑5激活码怎么获得？

满帮推“好运计划” 多举措助力中小微企业拼经济 环球热消息

我要自学网官方网站 全球视点

日本侵华独家影像披露④丨伪满洲国影像，揭示傀儡政权完全由日本人控制

开年起跑 资阳市国资国企一季度实现“开门红”|每日热闻

天天观天下！1-2月长春市财政收支情况

每日热点：歌尔股份能走出砍单阴霾吗？

天下再无免费数据？“美版贴吧”向AI公司收取数据使用费

【独家焦点】小熊电器：邹勇辉因个人原因辞去财务总监职务

除了微短剧和周杰伦，快手急需找到新的“破圈密码”|焦点精选

环球最新：部落升级路线1-70任务_部落升级路线

环球头条：隆扬电子：4月19日融资买入208.68万元，融资融券余额4786.13万元

中国工商银行未成年能办银行卡吗_未成年能办银行卡吗|天天热消息

环球播报:试驾长安凯程F70 一款更贴近乘客使用的皮卡

【天天快播报】娱乐圈有真友谊！ASTRO文彬去世，车银优紧急回国太够义气

带木字旁的有哪些字?（带木字旁的字都是什么字）

快播：摆线针轮减速机装配技巧_摆线针轮减速机装配

落花岩_关于落花岩的简介

微信朋友圈刷新不出来怎么回事儿_微信朋友圈刷新不出来怎么回事

火山引擎总裁谭待：分布式云架构解决企业“选择困难症”_重点聚焦

天天快报!什么是工程量清单分解_什么是工程量清单

南京企业退休金计算方法是什么？退休金如何发放的？|世界要闻

扮靓江城有他们，武汉园林工匠探索城市变美秘诀

亚一黄金价格今天多少一克(2023年4月19日)

夫妻赌气喝洁厕剂全中毒 丈夫报警：先救我老婆_全球微头条

透视一季度消费大数据：城市活力回归，人们的钱都花在哪？ 世界今日讯

环球资讯：深圳“锦安控股公司”涉嫌非法集资案件通报

当前焦点!宜兴杨梅几月份成熟_宜兴成熟时间是几月呢

科创信息：公司目前暂未布局超算互联网业务

每日速讯：车展现场｜阿维塔将进一步深化与华为之间的战略合作

全球微资讯！A股异动|国际医学午后跌超7%一季度净亏损7474.05万元

贸易、投资、基建：中国“三驾马车”带动拉美就业 全球今热点

图啥？福原爱富二代男友“吃软饭”，二人无力还房贷搬出3亿豪宅|每日速看

加兰：球馆中所有人都告诉我打出侵略性 G1有些机会是我能争取的

童女身是什么意思_tns是什么意思

【环球速看料】猜明星名字的游戏题目_猜明星

上海男篮重建！王哲林成建队基石，弃用5将，男篮教练或接手球队-环球今日报

梅兰竹菊金条价格今天多少一克（2023年04月19日）|全球观热点

动态焦点:【全国肿瘤防治宣传周】乳腺结节及乳腺增生

房地产市场出现积极变化

编导专业如何学好怎样才能怎么艺考 环球播资讯

如何制作法国女仆头饰 世界今日讯

腾讯云域名快速备案技巧|全球消息

excel查找重复项函数_excel查找重复项

信息科技ETF(512330)涨1.42%，太极股份涨停，寒武纪涨9.73%|世界时讯

美议员“抬棺”进州议会抗议枪支暴力 此前曾因呼吁控枪遭驱逐

三立期货4月19日早间内参——能化 天天新视野

凯石外汇：继欧佩克+组织减产协议引发的轧空行情后，WTI油价多头可能正认输

四川2023年一级建造师考试报名入口 当前时讯

环球热点！省呗贷款逾期26天延迟还款影响征信吗

杨千嬅厦门演唱会门票能自己选座位吗？全球观热点

当前关注：2023天津地铁6号线运营时刻表天津地铁6号线时间表最新

新华百货：一季度净利8381.82万元同比增长96.32% 世界热头条

世界快看点丨【世界说】欧洲央行行长：国际货币地位并非理所当然美元和欧元的领先地位受到威胁

淄博“烧烤贷”火了！最高可贷数百万银行在这里的“烧烤业务”很丰富

2023人工智能行业趋势及现状分析未来中国有望发展为全球最大的人工智能市场世界快播报

又打情怀牌！《最终幻想》像素版登陆索尼任天堂双平台：价格不低每日快播

遇见我你真不幸讲的什么故事遇见我你真不幸每日热讯

章子怡拍摄高定大片自信从容变身油画里的美女当前资讯

最资讯丨请柬怎么写_范文如何写请柬

满帮推“好运计划” 多举措助力中小微企业拼经济环球热消息

我要自学网官方网站全球视点

开年起跑资阳市国资国企一季度实现“开门红”|每日热闻

夫妻赌气喝洁厕剂全中毒丈夫报警：先救我老婆_全球微头条

透视一季度消费大数据：城市活力回归，人们的钱都花在哪？世界今日讯

贸易、投资、基建：中国“三驾马车”带动拉美就业全球今热点

编导专业如何学好怎样才能怎么艺考环球播资讯

如何制作法国女仆头饰世界今日讯

美议员“抬棺”进州议会抗议枪支暴力此前曾因呼吁控枪遭驱逐

三立期货4月19日早间内参——能化天天新视野

四川2023年一级建造师考试报名入口当前时讯

上汽奥迪品牌首秀全球首发两款产品世界通讯

全球今日讯！“红旗宣讲团”2023年第一课开讲中国首批航天员赵传东分享航天故事

中超前瞻：残阵三镇PK国安鹿死谁手泰山誓夺首胜_全球视点

慰问孤寡老人，传递温情暖人心全球热消息

魂师对决：光翎斗罗活动分析！这全新魂导器搞到什么程度才好呢？全球短讯

环球资讯：固强补弱找差距凝心聚力提质效信阳市浉河区检察院召开业务工作推进会

word中如何删除脚注焦点热文

热消息：电气班长年终工作总结范文电气班长年终工作总结