2025-06-08 06:56来源:本站
自然历史藏品中的丰富数据有助于找到应对气候变化、生物多样性丧失和流行病等全球挑战的办法。然而,目前收集的生物和地质多样性标本缺乏效率,这限制了科学家的成就。
特别是,以标本为中心的数据与来自不同数据库的数据(如生态和基因组数据)之间严重缺乏联系,这在研究人员试图处理来自多个集合的标本时构成了重大障碍。
现在,开放获取的《生物多样性数据期刊》上的一篇文章首次展示了进一步数字化和面向未来的生物多样性数据的新工作流程。这篇论文更新了关于跳跃蜘蛛的两个属的知识,并利用新的工作流程和格式描述了一个新发现的物种:数字标本doi和纳米出版物。
近年来,为了建立一个全球公认的持久标识符(pid)系统,以保证收藏标本的“唯一性”——物理的或数字的——随着时间的推移,已经启动了几项倡议。
您可以将PID视为一个标记,一个指向单个对象的标识符,并且只有一个,将其与世界上任何其他对象区分开来。你一定听说过诸如ISBN或ORCID这样的缩写词。这些分别是书籍和个别学者的个人id。对于数字化研究内容,使用最广泛的PID是DOI (digital Object Identifier,数字对象标识符),由DOI基金会提出。
DOI是一个字母数字代码,看起来像这样
例如,如果你在浏览器中输入“doi.org/10.15468/w6ubjx”,你将到达通过GBIF访问的比利时皇家自然科学研究所的软体动物收集数据库。这个特定的DOI永远不会指向其他任何东西,并且标识符在将来将保持不变,即使这个特定数据库的内容发生了变化。
分布式科学收藏系统(DiSSCo)旨在为欧洲自然史收藏中的所有单个数字标本提供DOI。关键不只是要准确地识别标本。当然,这是至关重要的,但是数字标本的DOI提供了许多其他优势,这些优势对于迪斯科舞厅和自然历史收藏品来说非常有趣。其中,有两个是革命性的。
首先,使用doi可以将数字标本链接到其他存储库(例如生态数据、基因组数据等)中关于同一标本的所有其他相关信息。
在创建连接不同数据类型的扩展数字标本时,数字标本doi对机构间科学工作做出了巨大贡献,填补了本文开头所描述的空白。现在,科学家们将处于一个更好的位置来真正交换和连接各个机构的数据。
其次,与大多数其他持久标识符相比,数字标本的DOI在其重定向到的URL之外存储了额外的元数据(例如名称、目录号)。这允许访问样本的一些信息,而不必检索完整的数据对象,也就是说,不必重定向到样本的HTML页面。
这些元数据有助于人工智能系统快速浏览数十亿个数字样本,并对它们执行不同的自动化工作,节省了我们(人类)宝贵的时间。
考虑到这一切,就更容易理解为什么能够使用doi在学术出版物中引用数字标本是重要的一步。到目前为止,我们可以在出版物中使用的唯一doi是数据集级别的doi,而不是单个标本级别的doi。
在上面的例子中,如果一位科学家要发表一篇关于比利时藏品中特定类型双壳类的文章,她或他在文章中唯一可用的DOI将是整个软体动物数据库的DOI -包含数百或数千个标本-而不是可能成为出版物焦点的特定牡蛎或扇贝的DOI。
在《生物多样性数据杂志》上发表的关于Chrysilla和Phintelloides属的文章是此类文章的第一次,它打开了使用doi引用数据集级对象和出版物中单个标本的大门。
你可以自己试试:把鼠标悬停在出版物中引用的doi上,你会得到一些基本信息,这可能会节省你访问标本所在机构页面的时间。
点击它,你会被带到disco的沙盒——未来的发现服务——在那里你会找到关于数字标本的所有信息。在那里,你还可以评论、注释标本等等,从而使科学以一种比现在更有活力、更有效的方式发展。