为什么发明"服务型"机构知识库?


发表为核心的"原教旨"机构知识库在中国的"水土不服"

       数字出版和计算机网络的发展,出版物的复制传播代替了传统印本的复印传播,而电子出版物版权和传播权立法的滞后,给学术出版的经营模式带来了巨大的影响,学术出版商不得不通过提高订阅价格来维持发展和利润,这也就造成了大学图书馆期刊购买费用危机(university libraries' journal budget crisis)[1]。另外作为论文作者,希望成果得到传播,如果因为读者无法承担论文阅读的高昂费用,访问/影响问题(Visit/Impact)就出现了。在这种形势下,科学家和图书馆不谋而合,发起了"开放存取(Open access)"[2]。
        开放存取主要通道分为金色道路(Golden OA)和绿色通道(Green OA)[1]。金色通道包括机构知识库(Institutional repository,IR)[3,4]和开放存取期刊(Open access Journal) [5]。机构知识库就是一个机构成员无需同行评议、免费发表、免费阅读的出版平台(也称为仓储平台)。机构知识库的代表Arxiv已成为世界上很多特立独行的科学家的出版平台首选,截止到2015年7月28日,Arxiv已存档105万篇论文[6]。国外众多科学家之所以青睐Arxiv,是因为Arxiv与其说是一个机构仓储,不如说是一个发表平台。Arxiv 为每一篇文章都提供一个DOI,可保证文章的长期永久存档和被引用,其上存档的论文被西方社会承认。重要的在Arxiv上存档论文无需经过"严格"和"漫长"的同行评议,可充分保障科学家的知识成果首发权。昨天外尔费米子发现首发权又因5天时差,造成中科院团队成果被《Nature》拒稿[7],早在2006年俄罗斯数学家佩雷尔曼因在Arxiv上存档的一篇庞加莱猜想证明思路的文章获得了2006年的菲尔茨奖[8],而随后在美国《亚洲数学评论》以专辑形式发布完整证明的曹怀东教授,虽然夺冠呼声很高,但终无缘获奖。
       由于中外文化的差异,机构知识库的无同行评议、无"等级"理念,在中国不被主流学术界接受,中国的主流学术家只承认在SCI、EI、核心期刊上发表的论文,教育部科研发展中心主办的"中国科技论文在线"[9]、科学院主管中国科学报社主办的"科学网"[10]也鲜见主流科学家的首发成果,让科学家在大学机构知识库首发成果的难度可想而知。当发生成果首发权争议时,才认识到知识库的价值,但过后依然我行我素。

改良后"成果典藏型"机构知识库核心价值难产生共鸣

       一些敏锐的图书馆人士在十年前开始了机构知识库在中国的引入、实践和探索[11-14],为机构知识库在中国的发展积累了有价值的实验数据和经验。遗憾的是,科学家在学校机构知识库上存档文章,缺乏源动力。目前机构知识库在中国大多已经演化为机构公开成果的典藏,可称之为"典藏型"机构知识库。
        典藏型机构库的价值是通过开放存取来提升学者和机构的学术影响力,记录机构科研学术历史。但科学家对此反应默然。发表论文时无法拒绝填写数据,但成果发表之后的存档则是基于责任;对于很多科学家来说,"发表"就是研究的"终点",传播是专业人员的工作,在机构知识库上存档是图书馆、档案馆的工作,很多知识分子在心理上有排斥情绪。
截止目前依然更新的典藏型机构知识库,大多是基于图书馆员的成果收集提交,而不是机构科学家的个人主动提交,直接后果就是可持续发展系于馆员的坚持,记录机构学术历史的价值也难于得到认可,"鸡肋"效应已现,机构成员主动参与机构知识库建设的积极性不高,一些机构知识库建成后后期更新停止,或者依靠图书馆馆员进行后期数据更新;机构知识库异化为公开商业学术数据库中机构成果"子集",独有资源缺乏。
        近期,随着机构成果机器人技术的成熟,基本解决了成果自动回溯的问题,记录机构学术历史的价值不再依赖于成果的人工提交,但依然能吸引大多师生的关注和主动参与。
总之,目前机构知识库在中国的发展遭遇了暂时的困难,亟需找到适合中国国情的机构知识库发展道路。

科研机构不同类型用户核心需求分析

       Arxiv之所以受欢迎,是因其无时滞、自由的发表对科学家的吸引,但这个功能在中国没有显性价值。找到机构知识库在中国的价值,才能实现可持续发展。
       机构知识库的用户可以分为科学家、科研管理人员和图书馆(学校层面),其核心需求如下图所示。

科学家显性需求

       目前社会对科学家的评判,主要凭其发表的论文、承担的项目、获得的奖励。
       要取得显性成果,需要信息服务、知识管理、团队协同、写作助手四方面的服务。
       信息服务包括关注期刊、专业资讯、个人成果收录和引用情况的订阅和推送。
       知识管理包括文献、文档、科学数据的管理,包括个人成果的自动收集、报表形成,满足项目申报和成果统计的要求。
       论文写作助手包括参考文献的自动形成,期刊、基金项目申报书范例和模板、论文相似度检测工具等。
       科研研究已经从单枪匹马发展到团队协同,科研项目需要团队成员协同完成。成员在科研过程中,收集、产生了很多资源和成果,如文献、笔记、实验报告、项目书等。遗憾的是,这些知识成果大多被保存在成员的个人计算机中,随着成员毕业、调任,这些资源会从团队流失。团队资源的积累、传承、再组织、检索、高效利用,可避免继任者重复劳动。大多团队负责人希望能规范团队科研活动,培养成员严谨的科研作风和习惯,但科研团队负责人大多是专家出身,缺乏实验规范、模板、范例、试验规程等管理经验的积累。

科研管理人员显性需求

       科研处管理部门需要机构科研成果产出的统计分析,在职称评定、项目报奖时及时得到相关成员的成果和学术影响等数据,需要在年底时对机构成员进行科研绩效计分。
       科研管理部门还需要对项目实施过程进行管理,包括项目申报、立项、中期检查、费用审核、结题验收等内容。
       对于学科办、科研处、规划处等职能部门,还需要提供机构学科发展现状、潜力进行分析,为学科发展提供数据支撑。

图书馆(学校)需求

       目前机构知识库的推动单位是图书馆。图书馆的主要职责是保证资源通道的畅通,实现机构数字资产的典藏和利用,为科研教学提供服务。
       目前很多图书馆都在探索在互联网和数字出版时代下的转型,而大学科研学术历史的记录是图书馆责无旁贷而且是图书馆的"强项",一个大学也需要一个科研学术的橱窗,来展现机构成果,并达到提升机构影响力的作用。