盘古模型是干什么用的?
盘古模型是华为推出的基于自然语言处理(NLP)的超大规模预训练模型。
盘古NLP模型可用于内容生成、内容理解等。,并且首次采用了编解码架构,兼顾了NLP模型的理解能力和生成能力,保证了模型嵌入不同系统的灵活性。在下游应用中,只需要少量的样本和可学习的参数,就可以完成千亿级模型的快速微调和下游适配。
在2019中文语言理解评测权威标杆《CLUE》榜单中,盘古NLP模型综合排名、分类、阅读理解排名第一,创下三个榜单的世界历史新纪录;总排名得分83.046,多项子任务行业领先。是最接近人类理解水平的预训练模型(85.438+0)。
盘古模型的发展历史
2020年6月,165438+10月,盘古模式在华为云成功建立,也完成了与合作伙伴和高校的合作。2021年4月,盘古模型正式发布。
2023年3月,华为云官网显示,盘古系列AI模型中的NLP模型、CV模型、科学计算模型已标注上线。7月7日,在华为开发者大会2023上,华为常务董事、华为云CEO张平安宣布,华为云盘古模型3.0正式发布。
盘古大模型3.0是完全面向行业的大模型,包括L0基础大模型、L1行业大模型和L2场景模型,聚焦政务、金融、制造、医药、矿业、铁路、气象等行业。
以上内容参考:百度百科-盘古大模型