盘古NLP大模型被誉为最接近人类中文理解能力的AI大模型-排行榜大全

【本站】3月27日消息，华为云即将上线盘古系列AI大模型，该系列AI大模型中的NLP大模型、CV大模型、科学计算大模型(气象大模型)已经标记为即将上线状态。据悉，盘古大模型采用了深度学习和自然语言处理技术，并使用了大量的中文语料库进行训练。该模型拥有超过1千亿个参数，可以支持多种自然语言处理任务，包括文本生成、文本分类、问答系统等等。

盘古CV大模型首次兼顾了图像判别与生成能力，能同时满足底层图像处理与高层语义的理解需求。基于模型大小和运行速度需求，自适应抽取不同规模模型，AI应用开发快速落地。使用层次化语义对齐和语义调整算法，在浅层特征上获得了更好的可分离性，使小样本学习的能力获得了显著提升，达到业界第一。

据本站了解，盘古NLP大模型是被认为最接近人类中文理解能力的AI大模型。其首次使用Encoder-Decoder架构，兼顾NLP大模型的理解能力和生成能力，保证了模型在不同系统中的嵌入灵活性。下游应用中，仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。

盘古气象大模型，气象预报精度首次超过传统数值方法，速度提升1000倍。盘古气象大模型提供秒级天气预报，例如重力势、湿度、风速、温度，气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间聚合算法，盘古气象大模型在气象预报的关键要素(例如，重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法，同时速度相比传统方法提升1000倍以上。

盘古大模型究竟是什么? 盘古大模型是什么

1、2021年4月，华为云发布盘古系列超大规模预训练模型，包括30亿参数的全球最大视觉（CV）预训练模型之一，以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言（NLP）预训练模型。后续，华为云还将陆续发布多模态、科学计算等多领域预训练模型。

2、盘古的设计有三个核心准则：其一，超大神经网络，可以吸收海量的数据；其二，强壮的网络架构，能达到性能的极致；其三，优秀泛化能力，让全场景覆盖率达到10倍以上，达到全能冠军。

集成“自然语言处理+知识图谱”技术的“AI医生”，在儿科上岗了

让AI技术与基础医学理论结合，成为AI用于临床探索的新思路。目前这一新思路已被证实确有更大潜力——

最近，由广州市妇女儿童医疗中心教授夏慧敏和加州大学圣地亚哥分校教授张康领衔、人工智能公司依图科技等共同参与的科研团队设计出一套基于AI的疾病诊断系统，就将医学知识图谱加入其中，使AI可以像人类医生一样根据读取的电子病历来“诊病”。

结果也颇为乐观：用纳入系统的55种常见儿科疾病和部分危急重症作测试，AI的诊断水平可达到儿科主治医生的专业水准。

目前，这一研究成果《使用人工智能评估和准确诊断儿科疾病》已于2月中旬在线发表于《自然—医学》杂志。

将深度学习技术与专业医学知识图谱进行结合，是该人工智能辅诊平台的最大特色。依图医疗总裁倪浩在接受笔者采访时说，未来对临床数据进行学习、为医生提供更多的辅助诊断能力（病种），采用深度学习+知识图谱的方式“很可行”。

为了使AI辅诊平台拥有专业的儿科医学知识，科研团队让它学习了56.7万名儿童136万份电子文本病历中的诊断逻辑。这些来自广州市妇女儿童医疗中心2016年1月至2017年7月间的电子病历，覆盖了初始诊断包括儿科55种病例学中常见疾病的1.016亿个数据点。

除了将医疗知识进行整合，科研团队还利用依图科技的自然语言处理（NLP）技术构建了一个自然语言处理模型，以对这些电子病历进行注释——通过将病历变得标准化，该模型在未经过“培训”的情况下可以粗略地将临床信息进行分类。

“粗略分类是指，将整个电子病历当作输入，将专家诊断结果作为输出，以达到粗略的分类。但这样并没有真正理解疾病本身，也很难解释为何做出了这个诊断。”倪浩告诉笔者， NLP模型虽然突破了病历文本语言和计算机语言之间的障碍，但知识图谱才是让AI诊断平台获取专家能力的关键 。

这也是他们接下来的一项重要工作：由30余位高级儿科医师和10余位信息学研究人员组成的专家团队，手动给电子病历上的6183张图表进行注释、持续检验和迭代，以保证诊断的准确性。

通过资深医疗专家注释的图表对AI诊断平台进行“培训优化验证”后，研究人员发现，经过深度学习的NLP模型可以对电子病历进行很好的注释，在体检和主诉项目的注释上分别达到最高灵敏度和精确度。也就是说， 深度学习的NLP模型能够准确地读取电子病历中记录的信息，并可以准确作出符合临床标准的批注。而这也是整个研究中最为关键的部分。

“通过引入知识图谱将每种疾病的电子病历深入解构，使得NLP模型具备了理解电子病历的能力。例如手足口病与哪些特征密切相关，川崎病最相关的特征是什么，让模型在给出准确诊断的基础上，能够具备更好的医学可解释性。”倪浩解释说，“有了知识图谱，再用深度学习技术来解构电子病历，就能够真正理解临床数据。基于此，机器学习分类等算法就有用武之地，否则把电子病历当成‘黑盒子’，是无法构建高精度可解释的模型的。”

综合利用深度学习技术与医学知识图谱对电子病历数据进行解构，研究人员据此构建了高质量的智能病种库，这使得后续可以较容易地利用智能病种库建立各种诊断模型。

构建一个多层级的诊断模型，是研究人员把AI诊断平台打造成为儿科医生的第二步。倪浩介绍说，这一基于逻辑回归分类器创建的诊断模型，首先会按呼吸系统疾病、胃肠道疾病、全身性疾病等几大系统分，然后在每一类下面做细分—— 这是让AI模拟人类医生的诊疗路径，对目标患儿的数据进行逐级判定 。

结果显示，基于NLP模型准确读取的数据，AI诊断模型能够对儿科疾病作出精确诊断： 平均准确率达90%，对神经精神失调疾病的诊断准确率更是高达98%。

在对相应儿科疾病的划分和诊断上，该诊断模型同样表现不俗。系统对上呼吸道疾病和下呼吸道疾病的诊断准确率分别为89%和87%。同时，该系统对普通系统性疾病以及高危病症也有很高的诊断准确率，例如传染性单核细胞增多症准确率为90%，水痘为93%，玫瑰疹93%，流感94%，手足口病为97%和细菌性脑膜炎为93%。

这揭示出，该诊断系统可以根据NLP系统注释的临床数据信息对常见儿科疾病作出较高准确度的判断。

研究人员随后运用11926个临床病例比较了AI诊断系统和5个临床治疗组诊断儿科疾病的水平，其中参与研究的治疗组从事临床工作时间和资历逐渐增加。结果显示， AI诊断系统反映模型综合性能的F1评分均值高于2个年轻医生组成的治疗组，但稍逊于3个高年资医生组成的治疗组。

论文认为，这说明该AI诊断系统可以协助年轻治疗团队进行疾病诊断，提升团队诊疗水平。

今年1月1日，该系统在广州市妇女儿童医疗中心投入临床应用。 仅1月1日至1月21日短短20天，该院医生实际调用它开展辅助诊断30276次，诊断与临床符合率达到87.4%。广州市妇儿中心医务部主任孙新在体验该系统后表示，这套系统在对疾病进行分组分类方面“比较科学”。

上述论文发表后，《纽约时报》点评这项研究称，“前后访问了儿科医院18个月中数十万名中国就医儿童的数据，能有这么庞大的数据量用于研究，也是中国在全球人工智能和竞赛中的优势。”

“数据确实是我们此次研究成果的核心关键之一。”倪浩说，“不过，高质量标准数据来源于强大的联合团队，我们专门开发了数据标准系统，进行了大量的数据标注。”

论文通讯作者之一、广州市妇女儿童医疗中心教授夏慧敏表示，这篇文章的启示意义在于“通过系统学习文本病历，AI或将诊断更多疾病”。不过他提醒道， 当下还须清醒认识到，仍有很多基础性工作要做扎实，比如高质量数据的集成便是一个长期的过程。

笔者了解到，该医院在近3年里注重将数据标准化、结构化处理，实现了50多个诊断数据子系统的相互交流和互联互通，为该系统应用打下了基础。

“此外，A I学习了海量数据后，其诊断结果的准确性仍然需要更大范围的数据对其进行验证和比对。 ”夏慧敏说。

AI技术落地的4元素之中，场景也非常重要。论文的另一位通讯作者张康认为，该研究以儿科疾病为对象意义重大。

“对儿科疾病的诊断是医疗中的一大痛点。一些儿科疾病威胁程度较大需要尽快得到治疗，而儿童恰恰不善于表达病情，因此快速、准确地对儿科疾病进行诊断非常必要。”张康表示，当前儿科医生供不应求，论文中构建的AI诊断系统对于严重不足的医疗资源会有很大的辅助作用。

相关论文信息：DOI:10.1038/s41591-018-0335-9

盘古NLP大模型被誉为最接近人类中文理解能力的AI大模型

盘古大模型究竟是什么? 盘古大模型是什么

集成“自然语言处理+知识图谱”技术的“AI医生”，在儿科上岗了

大家都在看

相关文章推荐