摘要
江苏省农作物种质资源库建于2008年,现已保存水稻、小麦、玉米等54种作物种质资源样本约5.5万份。面对当前庞大的保存规模和多样的种质类型,若仅依靠传统管理方法来独立记录各项工作流程信息和种质资源数据,不但会造成字段信息重复和数据冗余,也不利于库内资源整体情况的调查和共享服务情况的关联查询。科学有序的资源管理是促进种质有效共享的关键。本研究根据种质资源库的运行需求,运用Java Web、分布式数据库、工作流、可视化等技术,研究设计了集种质资源收集引进、保存监测、繁殖更新、鉴定评价和共享服务等功能于一体的全流程作物种质资源信息管理系统。通过对种质资源数据字段进行标准化定义,规范种质资源信息管理;明确种质资源管理工作流程和相关角色的任务职责,实现规范且可追溯的种质资源全生命周期管理;通过数据可视化技术,实现种质资源数据统计分析和挖掘,能极大地提高种质资源库管理工作效率,促进优异资源的安全保存和有效共享。
种质资源是种业的芯片,是支撑种业创新、保障种源安全和推动农业发展的重要物质基
科学有序的资源管理是实现种质有效共享的关键和基础。种质资源库管理是一项基础性工作,环节多、流程长、涉及的信息量大,面对当前庞大的保存规模和多样的保存方式,若仅依靠传统管理方法独立记录各项工作流程信息和种质资源数据,不但会造成字段信息重复和数据冗余,也不利于库内保存资源整体情况的调查和共享服务情况的关联查询。种质库管理封闭低效、资源信息分散重复、碎片化、孤岛现象普遍存
本研究根据江苏省农作物种质资源库的运行需求,通过大数据、可视化等新一代信息技术,研究设计集种质资源收集引进、保存监测、繁殖更新、鉴定评价和共享服务功能于一体的全流程作物种质资源信息管理系统,能有效提高种质库运行管理效率,促进优异资源的开放共享。
作物种质资源管理不同于一般仓储管理,除种质资源出入库管理以外,还包括种质活力检测、数量监测、共性特性数据管理和共享服务申请等多个功能,系统的操作流程也有其专业特性,因此本系统在设计构建时应遵循以下原
需建立一整套全生命周期的种质资源管理标准化数据档案和流程体系,包括不同类型的种质资源数据标准化字段、种质资源身份信息二维码标准、种质资源出入库及繁殖更新等标准化管理流程和可追溯的操作信息标准等,保证系统数据字段的统一和操作流程的有序。
本系统采用Web系统开发架构,系统分为数据存储层、服务层、应用层,其中数据存储层实现种质资源数据和库管数据的持久化存储,采用关系型数据库MySQL和分布式数据库MongoDB进行数据存储;服务层封装了系统中各种公共组件,为应用系统提供能力支撑,包括种质资源标准数据的管理、种质资源库管服务、可视化工作流引擎、数据可视化服务等;应用层通过微服务形式提供整个系统的各项业务应用,通过Web UI界面的形式提供服务,实现种质资源全生命周期管理和共享服务等,包括种质资源收集引进管理、资源预处理、种质资源库管理、种质监测管理、资源共享服务、数据可视化

图1 系统逻辑架构
Fig.1 System logical structure
根据作物种质资源管理制度和应用场景需求,本系统支持六类用户角色,主要职责描述如下:(1)系统管理员:负责系统后台配置管理、数据标准更新、库位编辑、工作流定义等;(2)种质收集员:负责种质资源的收集引进、预处理等;(3)种质库管理员:负责种质资源出入库和库内保存管理等;(4)质量管理员:负责种质资源质量管理,如日常活力监测、繁种更新等;(5)共享服务管理员:负责种质资源实物和信息的共享;(6)种质用户:外部普通用户,可通过系统浏览种质资源信息、申请种质实物等。
本系统主要包括管理后台和应用前台两部分:管理后台实现了系统配置管理功能,由系统管理员操作,包括数据标准管理、表单管理、工作流管理、库位管理、用户权限管理、数据可视化管理等;应用前台包括两个子系统:一是面向内部用户的前台应用,实现了种质资源一站式全生命周期信息管理和可视化功能;二是面向外部用户的种质资源信息共享服务前台,实现了种质资源的检索与申请功
系统管理后台总体功能结构如

图2 系统管理后台总体功能结构图
Fig.2 Function structure diagram of system management portal
数据标准管理模块负责维护种质资源的数据标准格式,主要功能包括种质分类管理、数据字典定义、基础信息和可扩展字段定义等。种质分类管理用于维护种质资源类目树,方便对种质资源类目进行分类选择和浏览,如一级分类目录为粮食作物、经济作物、蔬菜等,二级分类目录为水稻、小麦、玉米等,三级分类目录即为具体的某个种质资源。数据字典定义支持对系统中种质资源的各项标准数据字段进行规范化定义,可定义数据类型、数据枚举值、取值范围、字段描述等内容,如可定义“种质类型”字段的数据类型为字符型,数据枚举值为野生资源、地方品种、选育品种、品系、遗传材料和其他。基础信息字段定义负责设置种质资源共性数据字段和规范,并支持针对不同的种质资源类型设置特性数据字段及其规范。可扩展字段定义根据工作流程中数据录入和管理的需求动态增加新字段,并对新增数据字段进行定义和管理。
表单管理模块负责维护系统中所需要的表单结构定义,可灵活地创建各种入库单、出库单、盘库单等,支持新增和编辑表单中包含的数据字段,并能和数据字典中定义好的数据字段进行关联,支持设置表单的显示布局格式,字段展示大小、位置等,方便进行表单的展示和打印。
工作流管理模块负责实现种质资源库管理过程中各项业务工作流的配置,支持创建新的工作流程或修改现有流程定义。根据种质资源管理制度要求和业务场景需求,利用可视化拖拽式的流程设计器配置种质入库、出库、盘库、活力监测、繁种更新等多种工作流程,并对流程中的各项操作步骤、表单数据、各节点相互之间的流转关系进行详细定义,通过设置条件化节点、判断条件规则形成不同流程分支,可指定各节点关联的具体系统角色或操作人员,实现节点间的流转。同时,系统可在工作流中挂载绑定已定义的表单,从而实现工作过程中数据的填报和流转。
库位管理模块负责系统库位的配置,主要功能包括库位配置、货架管理、库位可视化布局配置等。库位配置支持对照种质资源库的物理库位实际情况,在系统中录入相应的库位信息,包括创建库位、设置库位编号、库位类型等,可对库位进行分区分级管理。货架管理支持在库位内部配置货架信息,包括配置货架的编号、位置、容量等。库位可视化布局配置支持通过可视化方式拖拽配置系统中库位、货架位置的图形布局,方便后续在出入库操作和检索等阶段进行可视化的库位展示,提高种质资源出入库效
权限管理模块负责系统的用户、角色和权限等配置,支持角色管理、用户管理、资源管理和权限分配。其中资源管理可定义系统菜单,配置需要进行权限管理的菜单树、页面操作项等。角色管理可定义系统中用户的角色类型,如系统管理员、种质收集员、种质库管理员、质量管理员、共享服务管理员、种质用户等。用户管理可创建和管理系统中的用户信息,同时支持面向角色或用户进行资源的权限分配管理,能灵活地定义每个角色和用户所具有的页面访问权限。
种质资源库管理工作流程比较复杂,涉及种质收集保存、日常监测、繁殖更新、鉴定评价、共享服务等多个工作流程,字段多、数量大,相关信息表达不直观。通过数据可视化管理模块,可使系统中的数据信息以更直观、更全面的形式呈现,能进一步挖掘数据隐藏信
系统应用前台提供了面向内部用户的Web应用功能,用于种质收集员、种质库管理员、质量管理员、共享服务管理员等角色的日常业务功能,系统功能结构如

图3 应用前台功能结构图
Fig.3 Function structure diagram of application portal
该模块主要实现种质资源收集引进相关信息的管理,种质收集员可在系统中对国内外种质资源的收集引进信息和检验检疫信息等进行录入。系统具备文档、图片等附件信息的上传功能,同时支持多字段组合检索,能够方便、快捷地查找到所需信
资源预处理模块主要实现种质资源入库前一系列处理过程的管理,包括种质资源接纳登记、查重去重、种子清选、入库活力检测等工作流程信息的记录和相关检测数据的录入,可查看和打印上述工作流程的相关表单。
该模块由种质库管理员负责操作,实现了种质资源出入库管理等核心系统功能,包括:(1)编码生成和打印:系统根据种质资源类别等信息生成种质资源的唯一编码,可设置标签打印格式,如标签布局、条码类型、文本内容等,并能连接标签打印机实现条码、二维码标签的打印。(2)种质资源建档:录入种质资源管理信息、资源共性描述数据、特性描述数据及扩展备注信息等,对种质资源建立完整的数据档案。(3)入库管理:创建入库申请单、正式入库清单等单据,系统根据后台预设好的工作流进行工作流转和处理;种质库管理员、质量管理员等多种角色操作人员可互相协作,完成入库前活力检测、种质干燥、含水量测定、包装称重、入库申请等一系列流程步骤,配置入库多级审核流程,确保种质资源的高质量入库。(4)出库管理:创建出库申请单、正式出库清单等单据,系统根据出库类型(对外供种、繁殖更新、活力检测等)在工作流中分角色逐级流
种质资源检索模块主要实现在整个系统数据库内灵活多样的种质资源检索功能,包括关键词检索、分类导航、标签管理和检索、组合条件检索、库位可视化检索。其中关键词检索可输入种质名称、种质类型、主要特性等关键词,通过“and(与)”、“or(或)”、“not(非)”等连接实现逻辑组合进行模糊搜索,检索结果按照相关度等进行排序。分类导航根据定义的种质资源分类目录树,对种质资源进行分类分层级的浏览,如按照粮食作物、经济作物、蔬菜等一级分类,水稻、小麦、玉米等二级分类逐级浏览查询。标签管理和检索支持在系统中配置种质资源的相关标签,如耐寒、抗病、高产等,通过单个标签或组合标签进行检索。组合条件检索支持复杂的多字段属性检索,将组合条件保存为常用查询条件,并针对每项特性字段设置查询值的取值范围或枚举选项列表,实现精准检索。库位可视化检索支持选择库位、货架等信息,查看库存资源清单和种质资源相关信息。
种质监测管理模块实现种质资源库存生命周期内的质量监测跟踪功能,由质量管理员负责维护,包括活力检测记录、种质活力预警、种质数量预警和繁殖更新管理。活力检测记录可实现库存种质资源的活力检测记录管理,支持创建和打印活力检测单,录入活力检测数据,并提供种质资源当前活力数据和历史活力检测记录的查询。种质活力预警采用种质活力监测数据采集和活力模型预测计算相结合的方式,对库存种质进行监测,智能触发活力检测提醒和活力不足的预警信息,提醒工作人员对相关种质资源进行繁殖更新,并自动生成繁殖更新任务清单启动后续任务处理工作
数据可视化展示模块实现了面向内部用户的数据报表展示功能,支持当前用户按目录展示已获取权限的数据报表,可选择指定报表浏览详细的数据可视化效果,同时可将常用的数据可视化报表添加到我的报表中,方便后续快捷选取。
面向外部用户的种质资源信息共享服务前台功能结构如

图4 信息共享服务前台功能结构图
Fig.4 Function structure diagram of information sharing service portal
主要面向外部用户提供种质资源检索服务,用户通过资源分类导航、关键词检索、组合条件检索等方式查找所需要的种质资源,并查看种质资源的共性描述数据、特性描述数据、资源图片及共享方式等信息。
作物种质资源一体化管理系统中主要的业务流程如

图5 系统业务流程
Fig.5 System business process
本系统根据种质资源库相关管理制度,建立合理、全面的种质资源管理和共享服务一体化工作流程,通过不同的用户角色和系统模块,管理和记录从种质资源收集引进、接纳登记、查重去重、活力检测、含水量测定、库号库位分配、包装称重、正式入库到日常保存监测、繁殖更新、鉴定评价、用户查询申请、种质共享出库等一系列的工作和经办信息。系统可直观、清晰地展示各个环节的待办工作,所有出入库种质处理流程可追踪,库内保存种质的出入库信息、繁殖更新信息、特征数据等都可关联查询,各项工作均责任到人并通过系统标准化执行,能极大地提高库管工作效率,保证种质资源管理工作的标准化和规范化,使种质资源管理和共享服务工作更加准确、有序和高效。
基于系统设计原则,为使系统具有更强的可扩展性和易用性,更好地满足不断完善和更新的种质资源库管理运行需求,本系统采用如下关键技术实现。
考虑不同种类的种质资源数据标准存在差异性和多样性,系统基于MongoDB分布式数据库技术实现种质资源数据的底层存储引擎,借助底层存储的Schema Free特性,可灵活的扩展需要的字段,并可进行复杂字段复杂结构的定义。通过分布式集群架构,系统支持海量种质资源数据的存储和高性能查询。基于微服务架构设计理论,系统提炼出独立的种质资源数据管理微服务模块,提供种质资源数据的标准化存取服
本系统运用工作流技术实现对种质资源管理业务中各个步骤及规则的灵活抽象和定义,支持动态创建各项业务管理流程。系统基于Flowable工作流引擎,采用业务流程建模标注BPMN2.0(Business Process Model and Notation Version 2.0)协议,通过可视化的拖拽方式灵活地实现流程定义。种质资源预处理流程定义可视化编辑效果如

图6 种质资源预处理流程定义
Fig.6 Germplasm resource preprocessing process definition
系统支持工作流和表单相结合,可以在业务流程中关联数据表单,当前流程步骤中的处理人可将相关信息录入到关联的数据表单中,可在工作流转执行过程中持久化保存各步骤附带的数据。系统可动态定义各项业务流程,如种质资源预处理流程、种质资源出入库流程、种质资源盘库流程等,并支持根据后续管理需要调整流程定义和表单数据字
本系统采用数据可视化技术实现多种形式的数据分析和可视化应用。系统基于D3.js开源JavaScript库实现种质资源库的三维可视化显示,可参照仓库、库位、货架的实际物理布局来配置系统中的仓库可视化模型,支持在浏览器中针对视角进行拖动、旋转、放大缩小等操作,能够更加直观地展示种质资源库的保存情况。当鼠标移动到货架上时,能直接显示当前货架编号(如M3-04-07)和该货架中已存放的种质资源信息。种质资源库三维可视化展示的示例效果如

图7 种质资源库三维可视化展示
Fig.7 3D visualization of germplasm repository
M3-04-07:货架编号
M3-04-07:Shelf number
系统还支持创建自定义报表,实现数据的可视化展示,支持外部数据源管理,通过SQL结构化查询语言方式编写相关的数据获取逻辑;采用开源可视化库AntV作为底层图表引擎,通过可视化编辑界面,拖拽所需要的图表形式,展示各类图表。系统能根据图表对数据的格式需求,自动完成所需要的数据格式的转换。AntV包含了一套完整的图表使用和设计规范,能满足丰富的业务场景和各类需求。同时,借助于AntV中的智能可视分析框架AVA AutoChart组件,报表引擎支持配置自动图表模式,系统能根据数据源自动推荐合适的图表并渲染,极大地提升系统的易用性和智能化用户体
本研究运用Java Web、分布式数据库、工作流等技术研究设计基于B/S架构的江苏作物种质资源一体化管理系统,整合库管系统和共享服务系统的主要功能,记录和管理从种质资源收集引进、保存监测、繁殖更新、鉴定评价和共享服务等全流程工作信息,构建融合数据采集、存储、加工、分析、展示的一体化数据平台。通过可视化技术研究,以图形化的方式模拟显示实际的存储空间结构,方便种质资源出入库管理,提高工作效率;采用分布式存储和模块化设计,确保所有信息都可以进行追溯,工作流程清晰,操作简便,安全性强,能极大地提高种质资源库管理工作效率,促进优异资源的安全保存和有效共享。
参考文献
武晶,郭刚刚,张宗文,王述民.作物种质资源管理:现状与展望.植物遗传资源学报,2022,23(3):627-635 [百度学术]
Wu J,Guo G G,Zhang Z W,Wang S M.Management of crop germplasm resource:Advances and perspectives. Journal of Plant Genetic Resources, 2022,23(3):627-635 [百度学术]
颜伟,杨欣,朱银,狄佳春,徐婷婷,蔡士宾.江苏省农业种质资源保护与利用平台建设现状与发展建议.江苏农业科学,2020,48(15):52-57 [百度学术]
Yan W,Yang X,Zhu Y,Di J C,Xu T T,Cai S B.Current situation and development suggestions of the Jiangsu provincial platform for conservation and utilization of agricultural germplasm.Jiangsu Agricultural Sciences,2020,48(15):52-57 [百度学术]
方沩,曹永生.中国作物种质资源信息系统.科研信息化技术与应用,2012,3(6):66-73 [百度学术]
Fang W,Cao Y S.Chinese crop germplasm resources information system.E-science Technology & Application,2012,3(6):66-73 [百度学术]
杨华,王国军,朱天生,林田,魏仕伟,石群芳,张前荣,王飞,刘鸿艳,罗利军,龙萍.上海农作物种质资源库管理信息系统建设.植物遗传资源学报,2019,20(2):459-465 [百度学术]
Yang H,Wang G J,Zhu T S,Lin T,Wei S W,Shi Q F,Zhang Q R,Wang F,Liu H Y,Luo L J,Long P.Construction of shanghai crop germplasm resources management information system.Journal of Plant Genetic Resources,2019,20(2):459-465 [百度学术]
孙兴莲,杨欣,丁思惠,李宗俊.江苏省农业种质资源数据服务平台的设计与构建.江苏农业科学,2021,49(13):192-197 [百度学术]
Sun X L,Yang X,Ding S H,Li Z J.Design and construction of Jiangsu agricultural germplasm resources coordination service cloud platform.Jiangsu Agricultural Sciences,2021,49(13):192-197 [百度学术]
杨欣,朱银,徐婷婷,汪巧玲,邹淑琼,颜伟.基于移动平台的农业种质资源信息共享服务系统研究.江苏农业科学,2018,46(23):267-270 [百度学术]
Yang X,Zhu Y,Xu T T,Wang Q L,Zou S Q,Yan W.Research on agricultural germplasm information system based on mobile platform.Jiangsu Agricultural Sciences,2018,46(23):267-270 [百度学术]
陈丽娜,司海平,方沩.贵州作物种质资源调查数据可视化研究.作物学报,2017,43(9):1300-1307 [百度学术]
Chen L N,Si H P,Fang W.Visualization study for investigation data of crop germplasm resources in Guizhou province.Acta Agronomica Sinica,2017,43(9):1300-1307 [百度学术]
杨欣,朱银,狄佳春,徐婷婷,汪巧玲,邹淑琼,颜伟.江苏农业种质资源平台运行管理信息系统建设.植物遗传资源学报,2021,22(2):309-316 [百度学术]
Yang X,Zhu Y,Di J C,Xu T T,Wang Q L,Zou S Q,Yan W.Construction of operation management information system for Jiangsu agricultural germplasm resources infrastructure. Journal of Plant Genetic Resources,2021,22(2):309-316 [百度学术]
杨欣,颜伟,朱银,许大光.江苏省农业种质资源中期库种子活力监测系统的初步设计.江苏农业科学,2014,42(9):368-370 [百度学术]
Yang X,Yan W,Zhu Y,Xu D G.Design of seed vigor monitoring system for Jiangsu agricultural germplasm medium-term gene bank.Jiangsu Agricultural Sciences,2014,42(9):368-370 [百度学术]
杨华,王国军,杨少友,林田,魏仕伟,蔡丽娜,王飞,刘鸿艳,罗利军,龙萍.上海农作物种质资源数据库的设计和构建.植物遗传资源学报,2020,21(2):477-482 [百度学术]
Yang H,Wang G J,Yang S Y,Lin T,Wei S W,Cai L N,Wang F,Liu H Y,Luo L J,Long P. Design and construction of Shanghai crop germplasm resource database.Journal of Plant Genetic Resources,2020,21(2):477-482 [百度学术]
卢新雄,陈叔平,刘旭,陈晓玲,曹永生,郑殿升,方嘉禾.农作物种质资源保存技术规程.北京:中国农业出版社, 2008 [百度学术]
Lu X X,Chen S P,Liu X,Chen X L,Cao Y S,Zheng D S,Fang J H.Technical regulation on conservation for crop germplasm resources.Beijing:China Agricultural Press, 2008 [百度学术]
司海平,刘俊辉,马新明,方沩,曹永生.农作物种质资源调查数据标准制定与共享.植物遗传资源学报,2012,13(5):704-708 [百度学术]
Si H P,Liu J H,Ma X M,Fang W,Cao Y S.Establishment of crop germplasm resources investigation data standards and sharing strategy.Journal of Plant Genetic Resources,2012,13(5):704-708 [百度学术]
陈广智,潘嵘,李磊.工作流建模技术综述及其研究趋势.计算机科学,2014,41(6):11-17 [百度学术]
Chen G Z,Pan R, Li L.Survey and research trends of workflow modeling techniques.Computer Science,2014,41(6):11-17 [百度学术]