生命科学领域首部AI辅助创作图书亮相上科大

发布时间2022-03-01文章来源 生命科学与技术学院作者责任编辑

信息时代,每年发表学术论文的数量呈井喷式增长。如何帮助研究人员快速了解科学进展前沿、帮助领域内的青年科研人员和学生快速掌握研究领域核心知识体系面临着重大挑战。为解决这一问题,学术出版机构施普林格-自然(Springer Nature)出版集团在近几年开发了一套基于人工智能辅助的文献知识总结系统Dimensions Autosummarizer(DA),以辅助研究人员进行图书出版。

近日,上海科技大学生命科学与技术学院刘冀珑课题组与图书信息中心联合施普林格-自然出版集团合作出版了生命科学领域中首部由DA系统辅助编写的图书CRISPR – A Machine-Generated Literature Overview。刘冀珑课题组2019级博士研究生张子恒为图书第一作者,图书信息中心王萍博士为共同作者,刘冀珑教授为图书通讯作者。



CRISPR技术即Clustered Regularly Interspaced Short Palindromic Repeats(规律间隔成簇短回文重复序列)的缩写,它是一种允许蛋白质、RNA和DNA精确结合的技术,并由此衍生出各种组合,例如蛋白质修饰、RNA修饰和DNA修饰,并从中衍生出更多的新技术。它被普遍用作基因编辑的一种手段,同时也可应用在细胞生物学、发育生物学等方面。CRISPR技术为基础研究提供了广泛的思路,也为转化研究、临床研究、工业研究开辟了崭新的空间。

2020年底,张子恒受刘冀珑邀请参加图书的编著工作。人工智能竟然能辅助进行文献总结和图书出版?抱着强烈的好奇心,他决定加入项目团队。“非常感谢刘老师提供机会,让我体验并见证了人工智能在图书创作和知识传播中所发挥的重大潜力。”

在近一年的时间里,刘冀珑负责整体项目把控和框架构建,王萍主要负责对数据库中文献的整理和筛选,张子恒则负责借助系统生成稿件。“刚开始以为这将是个庞大的工程,但是在完成简单的培训之后才发现,在人工智能的加持之下完成图书的编著变得简单了。”张子恒表示,“当然,前提是做好文献的整理归类和筛选等前期准备,而且这些工作帮助我在学术道路上快速进步。”


刘冀珑教授与项目团队成员讨论


该图书是DA系统在生命科学领域的首次成功尝试,也是上科大院所/课题组与学校学科情报服务的创新融合成果。创作团队以施普林格-自然出版物中的CRISPR相关文献作为原始数据,通过研究领域知识图谱计算结合人工校验,最终遴选出114篇文献,借助DA平台进行创作。基于知识图谱的启发和创作团队的讨论,图书系统全面地呈现了CRISPR技术的科研进展。

图书的顺利出版得到来自Springer Nature出版集团的黄梦初、Janina Krieger以及人工智能团队的帮助,也获得上科大生命学院及图书信息中心的大力支持。相信在不久的将来,基于人工智能辅助的文献知识总结系统将会为人类知识传播做出革命性的贡献。

图书链接:https://link.springer.com/book/10.1007/978-981-16-8504-0