李开复:目前最好的大模型智能,已达人类平均智力水平三倍

资讯3周前更新 AIGC学院
23 0

经过了2023年的创业元年和百模大战后,大模型新一轮的商业场景落地之战已经打响。

3月18日,澜舟科技发布“一横N纵”孟子大模型系列及产品,包括Mengzi3-13B大模型、孟子金融大模型、孟子编程大模型,及应用能力型产品AI文档理解、文档问答、文档辅助写作、机器翻译、澜舟智会、AI搜索等。

就在同日,同样是大模型明星公司月之暗面宣布在大模型长上下文窗口技术上取得新的突破,其自研的Kimi智能助手已支持200万字超长无损上下文,并于当日开启产品内测。

澜舟科技创始人兼CEO周明在现场向包括《每日经济新闻》记者在内的媒体表示,数字化浪潮中,以大模型为代表的人工智能正在重塑人类的未来。2024年将是大模型落地元年,如何利用大模型技术助力企业成长已成为业界关注的焦点。

“政府工作报告新鲜出炉,特别强调以人工智能+,驱动各行各业的转型升级。作为赛道中的创业公司,要把握好这个历史契机,通过落地,创造价值,拉动创新。”周明表示。

作为创新工场孵化的大模型创业公司,澜舟科技同时宣布与李开复的零一万物达成合作,李开复预测,3年之后,生成式AI的应用将成为用户增长最快的应用,全移动时代的应用将会成为过去式。

创业3年 聚焦垂直大模型

“今天完成了澜舟深耕大模型(含预训练模型)三年来的成果汇报,谢谢大家支持!”在澜舟科技的新品发布会结束后,周明在朋友圈这样感叹。

公开资料显示,澜舟科技于2021年6月正式成立,致力于自主研发大模型技术和行业应用,在去年3月发布了孟子GPT V1(MChat)大模型,今年1月孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。

周明介绍称,澜舟团队在近期完成了Mengzi3-13B的大模型训练,在常见公开数据集,如MMLU(多语言理解均值),Chinese-MMLU(中文-多语言理解均值),GSM8K(评估大模型数学运算能力的数据集),HUMAN-EVAL(一个用于评估人工智能模型生成文本质量的指标)等评估模型效果来看,该模型在各项基准测试中与相仿参数量大模型相比,英文能力提高了6.7%,中文能力提高了9.1%,中英文语言能力成绩领先,在编码和数学等两个方面也取得了上升的结果。3月30日Mengzi3-13B的模型将在GitHub(一个面向开源及私有软件项目的托管平台)、HuggingFace(一个人工智能社区)、魔搭和始智AI社区开源。

相比于通用大模型,澜舟科技从创业第一天就聚焦于行业/垂直大模型。据周明介绍,澜舟科技的体系为“一横N纵”,即以孟子大模型为基础,面向多个ToB场景发布垂直领域的产品。澜舟科技目前重点投入到了金融行业,辅助编程等领域,希望打造更加贴近行业场景的垂直大模型。

其中,澜舟科技的大模型产品包括AI文档理解,该产品涵盖专业的PDF文档解析能力和信息抽取能力。在与新华智云共建文化大模型,以及其他众多AI文档理解,信息提取类客户场景中均已使用。

除了文档理解、搜索和问答,周明也介绍了澜舟科技面向场景的可控AI写作助手-AI文档辅助写作。该产品支持用户上传多个文档作为参考资料,支持自定义多级题目和写作提纲,由大模型赋能自动化按要求生成完整的文章初稿,目前已经在联通客户项目落地,为其数智化投研平台提供了智能研报写作的能力。

“最好的大模型智能已达人类平均智力水平三倍”

作为创新工场孵化的大模型创业公司,澜舟科技与零一万物也宣布达成合作。在去年的大模型创业浪潮中,李开复带队创办了AI公司零一万物,此前已推出Yi-34B和Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。

在李开复看来,澜舟在基于大模型面向企业市场落地方面已经有了非常好的基础,零一万物在千亿级大模型、多模态方面会投入更多力量,未来两家创业公司能实现优势互补。

李开复表示,大模型的智力水平在两年前就已经比普通人水平“好一点”,目前,世界上最好的大模型已经是人类平均智力水平的3倍。李开复以“答题”举例,即在100道考题里,普通人平均只能答对33题,而“最好的AI大模型”可答对99道以上。

他同时指出,AI 2.0模型能力突飞猛进,通识理解已经超越人类专家。AI 2.0通过图灵测试并趋于成熟,揭示下一个平台级变革。新一代创新应用需要新的技术平台,基于强大的底层技术搭建出高效的开发工具,从而节约开发生态做创新产品的成本,促进包括新产品、新业态、新的商业模式的全新应用生态。

而对于AI 2.0未来的发展趋势,李开复如此总结:

最革命性的AI 2.0应用应该是AI-First/AI-Native:最终脱颖而出的应用属于那些敢于全力投入新技术的先驱者。大语言模型的引入为AI-First应用带来了巨大的推动力。

现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。

李开复表示,未来AI 2.0将超越对话,从聊天工具到智能生产力工具,在此趋势下,用户体验以及未来交互界面和商业模式都会发生大的变革。除此之外,AI 2.0将走向实体,大幅提振社会生产力,具身智能可以让机器人制造机器人,进一步实现AI 2.0+生产线智能规划。

李开复:目前最好的大模型智能,已达人类平均智力水平三倍

李开复发表《AI 2.0 平台变革进行式》主题演讲 图片来源:每经记者 赵雯琪 摄

2024年迎落地元年 大模型如何应对商业化挑战?

经过了过去一年的创业潮,大模型赛道神仙打架,头部企业也密集发布产品,一直延续至今年。

但对每一家公司来说,商业化落地都并非易事。今年以来,大模型市场派代表人物朱啸虎、周鸿祎接连向技术派“开火”,直言不看好通用大模型在国内的前景。

北京市海淀区副区长徐振涛提供的数据显示,北京市仅海淀区大模型企业、机构超90家,并且数量持续增长。通过备案的大模型36家,占全市的72%以上,截止到目前已经培育20家独角兽企业,占全市的60%,企业在人工智能领域,授权发明专利数量8.1万件,占全市的62%。这也意味着,大模型赛道愈发拥挤,竞争也依然激烈。

在周明看来,经过一年的发展,大模型将在今年迎来落地元年,而谈及如何做好大模型落地应用,周明表示,雷军所说的互联网七字法则“专注、极致、口碑和快”仍然适用,还要再加上“成本”,大模型创业不能不在意成本,一定要有造血的能力,形成大模型落地九字法则:“专注、极致、口碑、快、成本”。

针对大模型的行业落地适配问题,周明则提到了L1-L2-L3-L4的层次化分级服务体系,基于L1-通用大模型,在此基础上加入行业数据训练出L2-行业/垂直大模型,如金融、编程大模型。针对重要场景,在L1或者L2模型基础上finetune(微调),实现L3大模型。最后Agents(代理人)可以调用L1-L2-L3任何一层的模型形成完整的一个特定任务。

中关村数智人工智能智能产业联盟理事长崔宝秋则表示,大模型未来会触及、波及到每个人,对于大模型创业公司来说,抓住刚需是第一步,其次要了解自己的技术边界是什么,除此之外,大模型创业公司不要被大模型快速发展淹没,在进行商业落地、实际运用的探索时要提前想清楚自己的优势是什么。”崔宝秋表示。

“大模型创业所需要的生态环境非常重要,澜舟一方面聚焦自己擅长的能力和场景,另外一方面会注重与开源社区、与客户和合作伙伴携手共进。”周明表示。

(来源:每日经济新闻)

© 版权声明

相关文章

暂无评论

暂无评论...