复旦邱锡鹏:最新版MOSS在中文能力上已超ChatGPT对话|模型|能力

发布时间:Apr 14, 2024 02:33 AM

今年2月,复旦大学发布了类ChatGPT的对话式大模型MOSS,两个月后MOSS正式开源,成为国内首个插件增强的开源对话语言模型。在7月7月举行的2023世界人工智能大会“大模型时代的通用人工智能产业发展机遇以及风险”分论坛上,复旦大学MOSS系统负责人邱锡鹏围绕“技术、实现与展望”分享了MOSS的最新研发进展。

邱锡鹏表示,近年来,AI领域的模型规模越来越大,几乎每6个月模型规模就翻一番,以10倍为量级增长。今年,随着ChatGPT走入全球视野,大语言模型的热度持续升温。但究竟多大才算“大语言模型”?学界目前并没有确切定论,只能说大约在百亿规模到万亿规模间,主要因为ChatGPT并未开源,也尚未对外公布其最新版参数。

但在人工智能研究领域,ChatGPT仍旧为学术研究提供了非常大的希望。“最初的AI大部分是‘弱人工智能’,就连AlphaGO也基本只能干下棋这一件事。”邱锡鹏说。而AGI,即通用人工智能,是几乎所有人工智能研究者的愿景。

被寄予厚望的ChatGPT发展速度确实很快。从2018年OpenAI公司发布第一版ChatGPT,到2020年训练出ChatGPT3,再到历经2年迭代后迎来ChatGPT4这一革命性产品,历时不过4、5年时间。

视线回到国内。邱锡鹏介绍,复旦对大模型的研究起步较早,在Transformer架构以及中文预训练模型的研发上有了比较丰富的积累。“ChatGPT出现后,很多人觉得国内和国外在大语言模型方面的差距正在拉大,但其实我们研发出MOSS后,证明并非只有OpenAI才能研发出对话式大模型,MOSS基本能通过我们的理解复现ChatGPT的能力。”

MOSS的基础架构为Transformer,第一版诞生于今年1月,具有和ChatGPT相同的内容,即“用户说什么MOSS都可以接话”,但在任务完成度上与ChatGPT尚存在差距。特别是在推理能力和知识能力上,第一代MOSS的判断容相对量小,“很多事实会记不住。”为此,复旦团队一方面持续扩大MOSS的模型规模,提高其整体能力,另一方面尝试将MOSS作为使用工具进行开发。

今年2月,复旦正式发布对话模型MOSS后,将一部分研发精力放在如何把使用工具的能力打通,于是在4月推出了开源插件版模型MOSS-Plugin。“目前MOSS还在持续迭代,如最新版MOSS已经能够在中文能力上基本超过ChatGPT。”邱锡鹏说。

大语言模型除了“聊天”,还具备哪些用途?邱锡鹏介绍,在具体的行业应用中,通过使用插件,大语言模型可自主搜集新闻和实时信息进行汇总,成为得力的个人助理。大语言模型还可进行数学运算,或者列一个方程让计算器来解答。此外,MOSS在预防“有害道德”方面也进行了优化,会避免回答有悖道德的问题,让人工智能具备较强的道德感。“大型语言模型的一大亮点,就是能把外来需求或复杂任务进行拆分,找到不同的工具来解决问题。”邱锡鹏说。

“大模型不能只有大公司才能‘玩得起’,高校、学生和普通爱好者都应该‘玩得起’大模型。”邱锡鹏表示,仅靠头部公司“砸钱”研发大模型,并不能助推该领域健康有序发展,因为大语言模型中涉及许多科学问题和学科类问题需要解决,在实现复杂推理、高效架构、知识融合和制定学习策略方面,有许多问题需要学术团队和广泛的研究者来支撑。

围绕MOSS,复旦团队将持续展开大模型方面的研究,涵盖能力强化、知识对齐、模态融合和开源开放等领域。目前,复旦MOSS团队正通过参与大型语言模型生态建设,在未来实现集对话模型、模型微调、AIGT检测、模型对比和模型评测等于一体的开源开放平台。

为何纷纷将上海郊区这个园区选为“梦开始的地方”?,留学生归国创业全域|创业|郊区
为何纷纷将上海郊区这个园区选为“梦开始的地方”?,留学生归国创业全域|创业|郊区

尽管只有28岁,但山东小伙薛云浩已是个“创业老兵”。从英国拉夫堡大学毕业回国后,他在外省市有过两次创业经历。第三次创业,他把目光投向了上海青浦。“园区又大又新,办公环境非常好!”这是薛云浩对上海青浦留学人员创业园的第一印象。入驻园区仅一个多月,他创立的上海拾刻有趣文化科技有限公司发展已迈入正轨,孵化的潮玩品牌即将面向市场。记者了解到,去年9月,位于虹桥商务区的青浦留创园正式开园,很快那里就成了“薛云浩”们的逐梦之地。不到一年,园区就吸引留创企业近50家,在园区打拼事业的近200名留学生中,绝大部分都是硕

预计投产后新增产值约50亿元,​莘庄工业区7个重大产业项目集中开工产业|制造业|项目
预计投产后新增产值约50亿元,​莘庄工业区7个重大产业项目集中开工产业|制造业|项目

6月30日,上海市莘庄工业区举行2023年重大产业项目集中开工仪式,福斯特、军健君泽、澳华内镜等7个制造业项目同时开工,涉及重大装备、生物医药、新材料及精细化工和生产性服务业领域。据了解,此次开工的7个项目,合计投资金额为18.68亿人民币,共计占地134.48亩。其中4个新拿地项目,3个存量改扩建项目,预计投产后新增税收约4亿元,新增产值约50亿元。7个项目全部符合闵行“4+4”产业定位。莘庄工业区此次在同一区域7个产业项目集中开工,让制造业成为园区经济发展关键驱动力,同时推动闵行制造业向着高端化、智

上海这一“工程”为何生生不息,30年方法|服务|上海
上海这一“工程”为何生生不息,30年方法|服务|上海

夏季,来自云南临沧的外卖骑手杨权又迎来一年中最艰苦的送餐季节,但他的内心却很踏实:中山公园兆丰广场门前的“暖新巢”新就业群体服务驿站,一年四季,不论严寒酷暑,都是他和同事们挡风遮雨的港湾。这是长宁区众多“暖新巢”中的一个。出生于澜沧江边的“90后”杨权又并不知道,繁华的上海市中心,曾有不少百姓居住在陋室简屋中,其中一些人还面临重病、失业等一时难以逾越的困苦。兆丰广场所在的长宁区华阳路街道就是其中一处。30年前,华阳基层干部们夜以继日走访,了解全部困难人群生活状况,并一一为之解难纾困。从此,一个以“了解人

​年轻人面临三种求职困境?上海金山举行高校毕业生就业创业主题日活动活动|创业|金山
​年轻人面临三种求职困境?上海金山举行高校毕业生就业创业主题日活动活动|创业|金山

6月19日下午,“雁归金山·职在湾区”2023年金山区高校毕业生就业创业主题日活动在海阔·东岸文化创意产业园举行,现场发布就业宝典、分享就业创业经历、优质企业路演招贤、就业工作成果展示、全面启动育苗仪式、举办专场招聘活动等一系列活动,吸引了大批重点企业、见习基地和高校学子到场。值得注意的是,当天的现场招聘会共有52家企业参加,提供岗位212个,招聘570人,薪资普遍在7000元至10000元区间;入场近300人,收到简历238份,初步达成就业意向75人。启动仪式上,《求职路上有“你”有“我”》小品表演,

中国航海博物馆户外空间首次免费夜间开放,航海重器展览上新海洋|中国|博物馆
中国航海博物馆户外空间首次免费夜间开放,航海重器展览上新海洋|中国|博物馆

6月13日,由上海市交通委员会和上海市海洋局指导,中国航海博物馆与上海市海洋管理事务中心共同主办的“探秘深蓝:中国海洋科考与深潜展”在中国航海博物馆正式开展。展览在博物馆第二临展厅展出,展期将持续至2023年10月8日。此次展览是继“蓝色‘船’说”之后,中国航海博物馆推出的“当代中国航海装备系列展”第二展。展览共分“综合科考”“专业科考”“特种科考”及“守护蔚蓝”四个部分,从科技、装备、自然等角度,重点展示当代中国海洋科考与深潜事业所取得的辉煌成就,阐释人与海洋的和谐共生,强化海洋意识教育,助力推动海洋文