乌镇峰会十年,“桨”声“心”影里的百度AI:大模型时代的领先者
在2023年世界互联网大会乌镇峰会这个国内规格最高的科技盛事上,生成式人工智能成为了瞩目的焦点。作为展现全球数字经济最新科技成果的舞台,乌镇峰会不仅见证了AI大模型的快速发展,还凸显了百度在其中的领先地位。
大模型已成为乌镇峰会的关键词。随着ChatGPT、文心一言等产品的爆红,AI大模型在科技行业掀起了滔天巨浪。预训练大模型、生成式人工智能成为了今年乌镇峰会的核心议题之一。
在世界互联网大会人工智能工作组与百度联合主办的“人工智能赋能产业发展”分论坛上,世界互联网大会人工智能工作组发布了由其编写的研究报告及共识文件,汇总产业界在金融、交通、教育等14个应用场景的相关案例,提出“发展负责任的生成式人工智能十条共识”。
AI大模型在乌镇峰会上的强势存在不只是在论坛上有所体现。作为乌镇峰会的官方核心活动,“世界互联网领先科技成果发布活动”在7年后全面升级成“世界互联网大会领先科技奖”。今年的获奖项目大都与AI有关,其中来自互联网企业的两个获奖项目均属于AI范畴:一个是位列“基础技术组”的“百度知识增强大语言模型关键技术”,另一个是属于“工程研发组”的“腾讯觅影数智医疗影像平台”,其中百度“知识增强大语言模型关键技术”是唯一获奖的大模型技术。
百度“知识增强大语言模型关键技术”领先在何处?据百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在现场介绍,“人工智能正在引领新一轮科技革命和产业变革,大语言模型让人们看到了通用人工智能的曙光。知识增强大语言模型关键技术,突破知识内化和外用技术,具备知识增强、检索增强和对话增强的独有技术优势,并通过模型与框架联合优化,突破了训练规模,提高了训练效率,提升了模型效果。”
今年3月百度发布知识增强大语言模型文心一言,其具备知识增强、检索增强和对话增强等技术优势。5月文心一言的基础模型升级至文心大模型3.5。8月31日文心一言率先全面开放。10月的世界大会上百度发布了文心大模型4.0,在理解、生成、逻辑、记忆四大能力都有显著提升,综合能力与GPT-4相比毫不逊色。
2023年,除早已入局大模型的百度外,阿里、华为等科技巨头以及多家创业公司均跑步入局大模型赛道,“百模大战”如火如荼。群雄逐鹿下,大模型赛道也出现了一些怪乱象,一些玩家在资本加持下临时上阵做大模型甚至一股脑“梭哈”,有的实力不济也做基础大模型“重复发明轮子”,有的“浑水摸鱼”为了市场炒作强推大模型,更有连核心技术都依靠第三方的“皮包型大模型公司”在凑热闹。其实在众声喧哗下,大模型真正重要的只有两件事:
第一件事是基础大模型的技术提升,说得更直白一点就是要有能担纲与GPT抗衡的基础大模型。在科技自主自立的大时代背景下,这一点至关重要;另一件事是大模型的落地,如果不能应用到实际场景中,大模型狂卷参数“军备竞赛”无意义,毕竟技术只有解决实实在在的问题才有价值。
发展大模型应该基础技术提升与产业场景落地并重,这正是百度的“大模型观”。
早在2019年百度就已在积累AI预训练模型技术并上线文心大模型,当年7月文心大模型升级至2.0,2021年12月正式发布全球首个知识增强千亿大模型鹏城-百度·文心,参数规模2600亿。
在行业因为ChatGPT关注大模型的前一年,百度就在布局大模型且坚持“不卷参数卷落地”,脚踏实地地推动大模型的落地且提出建设性方案。2022年5月,在WAVE SUMMIT2022深度学习开发者峰会上,百度公布飞桨文心大模型最新全景图,提出支撑大模型产业落地的3个关键路径并在业内首发基于文心大模型的行业大模型,构建了一套适宜产业应用的大模型体系,同时提供了配套的工具平台、推动开放生态促创新。
重视场景落地与重视基础技术并不矛盾,百度深知提升基础大模型技术水平的重要性。2023年百度文心大模型加快升级步伐,除不断汲取数据与知识提升智能水平