加强文献数据库建设 别让科学研究从源头被截流
视觉中国供图
关注生命科学研究四要素②
文献数据库已成为从世界看中国、从中国看世界的信息交流平台,中国应有更多有分量的论文和有影响力的期刊,同时应建立属于自己的世界一流的权威文献数据库,才能在未来科学技术的竞争中掌握话语权。
天津大学生命科学学院教授
王泽方
近日,中国昆虫学会、中国实验动物学会等单位的一项调研发现,我国高等院校在购买数据方面的花费相当可观。上海地区2019年有4家高校购买资源的经费超过了3000万元,其中一家达到6000万元。
我国缺乏完备的文献数据库,不仅要支出大量科研经费购买文献数据,而且科学信息严重依赖国外,也为科学研究带来更多的不确定性风险。
“如今,文献数据库已成为从世界看中国、从中国看世界的信息交流平台,中国应有更多有分量的论文和有影响力的期刊,同时应建立属于自己的世界一流的权威文献数据库,才能在未来科学技术的竞争中掌握话语权。”天津大学生命科学学院教授王泽方表示。
常用文献库几乎都隶属国外出版集团
“几乎每个学科在开展一项研究前都要先做大量的文献调研。”王泽方介绍,以生命科学为例,目前在生命科学领域最常用的数据文献库比较集中,几乎都来自国外大型商业化出版集团。其中最大的是荷兰的爱思唯尔(Elsevier),这个集团出版了2500余种期刊,大名鼎鼎的《柳叶刀》《细胞》等期刊都属于该集团。此外爱思唯尔还出版3.9万余种电子书籍,拥有全世界最大的文摘和引文数据库斯高帕斯(Scopus)等,每年全球共有35万篇论文发表在爱思唯尔公司出版的期刊中。
此外施普林格·自然和约翰·威利父子出版公司也是为整个科研界提供顶尖服务的全球性出版集团,前者拥有世界上历史悠久的、最有名望的科学期刊《自然》,后者出版的期刊涉及化学、化工、生命、计算机工程、数学、物理等,是非常全面的大型出版社。
“除了上述数据文献来源,科学网(WebofScience)也是获取全球学术信息的重要数据库平台。”王泽方透露,“衡量期刊学术影响力的影响因子就是由科学网提出的。”
“此外,还有一些获取文献数据的补充途径,包括各专业组织或学会主办的平台或期刊。其中最为著名的是由美国国立医学图书馆提供的一个免费搜索引擎PubMed,它能提供全面的生物医学方面的论文以及摘要的检索服务,是目前互联网上使用最为广泛的免费搜索引擎。另外,美国科学促进会主办的著名期刊《科学》(Science)和美国科学院主办的《美国科学院院报》(PNAS)也是获取生命科学文献的重要途径之一。”王泽方说。
“除了英文数据库,常用的还有几个中文文献数据库,比如中国知网(CNKI)、万方数据库、国家科技图书文献中心等。”王泽方介绍,其中国家科技图书文献中心是一个虚拟的科技文献信息服务机构。
数据文献库对科研的意义非常重大
对目前生命科学研究领域大量依赖国外数据文献库的现状,王泽方无奈地表示:“生命科学领域的文献90%以上都出自这些英文数据库,大量的重磅科研成果大都发表在《科学》《自然》《细胞》和《柳叶刀》等重要期刊上,因此要想掌握学科内的最新动态,必须要经常查阅这些文献。”
“这样的后果会导致科学研究受制于人,从大处说,随时可能被‘卡脖子’,很多科研将无法开展;从小处说,很多规则都是对方制定,使用起来将处处受限。”王泽方说,“我们花费了大量的经费订阅数据库,但是并不能获得原始数据。同时在线人数也受到限制,超出使用人数,其他人就无法查阅数据,只能等待有人下线后再使用。”
此外,不是所有高校都有充足的科研经费购买所有重要数据库,这些高校的科研人员和学生的研究工作就会受到影响。有的高校可能会根据自己的优势学科,购买部分专业的数据库。其他专业的学生就需要靠文献传递的方式,通过其他高校或者其他途径获取文献,非常不方便。“久而久之就会造成教育资源不均衡,学科发展不平衡。”王泽方担忧地表示。
“更严重的是,数据库还是一个学术交流的平台,关乎知识产权竞争和学术话语权。”王泽方解释,由于某些著名期刊影响力大,在此发论文
代表着被学术界认可。因此科研人员会努力在这些期刊上发表科研成果。谁先发表出来,谁就抢占了这项研究的知识产权,这对于科研的意义非常重大。
如今几大国外大型出版集团垄断了科技文献数据库,他们随意提价已让学界与出版商矛盾频出。2018年底,美国加州大学与爱思唯尔未能就开放获取出版协议和订阅价格达成一致。谈判破裂后,爱思唯尔切断了加州大学对其旗下千余种期刊的访问权限。直到今年,双方才重新达成合作。这期间,加州大学35万余名师生只能通过求助所在校区的图书馆、在网络上寻找合法的开放获取副本、或者直接联系作者等方法来获取他们想读的新论文。
建立大型本土文献数据库势在必行
“国家已经意识到文献传播也就是知识产权传播的话语权与主动权的重要性,因此推出了‘中国科技期刊卓越行动计划’,旨在推动我国科技期刊高质量发展,加快建设世界一流科技期刊。”王泽方介绍,在国家政策的推动下,我国生命科学领域涌现出一批高水平期刊。
其中中国科学院上海生命科学研究院生物化学与细胞生物学研究所与中国细胞生物学学会共同主办的《细胞研究》(CellResearch),是一本以全英文形式出版、编辑和发行原创性研究论文、学科综述及快报的国际性学术月刊。
此外还有由高等教育出版社与中国生物物理学学会、中国科学院北京生命科学研究院联合主办,由施普林格负责海外发行的《蛋白和细胞》(Protein&Cell)杂志,是一本创立于2010年的本土期刊,主编由中国科学院院士饶子和担任。
“虽然目前我国在生命科学领域有了一些自己的高水平期刊杂志,但是要想做到海外四大数据库的规模还任重道远。”王泽方说。
纵观这些老牌出版集团的发展历史,爱思唯尔的前身可追溯到16世纪,而现代公司也兴起于1880年;施普林格·自然成立于1869年;约翰·威利父子出版公司成立于1807年,都有超过100年的历史。经过漫长的发展,这几大出版集团通过合并小的期刊杂志,不断发展壮大起来,都变成了超大的文献数据库。
“因为历史悠久,建设完善,这些出版集团边际效应非常低,维护成本很少,特别是网络化以后。”王泽方认为,与此同时,现在再进入这个行业,壁垒就变得非常高了,因为大量的版权已经掌握在这些出版集团手中,需要花大价钱购买,根本无法形成良性的竞争。
此外建立一个在全球具有影响力的期刊数据库,还有一个难点就是语言问题。“目前学术期刊的官方语言几乎都是英语,因此合并起来相对容易。而我们的很多期刊都是中文。”王泽方表示。
“未来通过政策引导和政府扶持,一定会加快中国文献数据库的建设。”王泽方建议,可以借鉴国外的商业运作模式,整合更多的社会资源。比如某一领域的数据文献对某家公司特别有价值,那么就可以由这家公司负责这一领域的文献数据库的建设。这样就可以集合社会资本,积少成多,最终建立起大型、完备的我国本土的文献数据库。