随着人工智能大语言模型表现出接近人类的智能,高难度、综合性考试被越来越多地引入语言模型评测。OpenAI在GPT-4技术报告中,就通过各领域的考试对模型能力进行检验。今天是高考第一天,上海人工智能实验室、商汤科技联合香港中文大学、复旦大学及上海交通大学发布了千亿级参数大语言模型“书生·浦语”,它在中国高考等多项中文考试中取得的成绩超过ChatGPT。“书生·浦语”有1040亿参数,在包含1.6万亿token的多语种高质量数据集上训练而成。全面评测显示,这个大模型不仅在知识掌握、阅读理解、数学推理、多语翻译