美国肯特州立大学教授曾蕾以“智慧数据与数字人文视野下的图档博数据潜力及价值探索”为主题作的报告,向大家介绍了“智慧数据”的概念起源、具体内涵及其在数字人文领域的应用。她指出,图书馆、档案馆、博物馆等机构能提供大量的文化遗产数据,采用智慧数据方法处理能产生无法比拟的价值;智慧数据会促进数字人文领域的前进与变革,智慧数据的建设也将成为图书馆、档案馆、博物馆等机构最重要的新兴工作。
上海图书馆副馆长刘炜从基因序列谈起介绍了智慧数据的特点,他对“数据”、“信息”、“情报”、“知识”、“语义”、“智慧”等概念之间的关系做了阐释,创造性地提出了“数据”的新概念。刘炜指出“智慧数据”是有语义的、可计算的、能够行动的信息单元。智慧数据中的“智慧”来自自然智慧、人类智慧、社会智慧和机器智慧,而智慧数据的达成需要机器和人工共同努力。
中国科学院武汉文献情报中心主任张智雄做了题为“国史百科的丰富语义组织揭示”的报告。张智雄提出“丰富语义”和“丰富语义揭示”的概念,并以国史本体知识库的创建为例介绍了知识丰富语义揭示的具体过程。
中文信息学会语言与知识计算专业委员会副主任、东南大学教授漆桂林以“佛教知识图谱及问答”为主题作报告。他介绍了其所在团队将知识图谱、知识融合、智能问答等技术应用于佛教知识的尝试与探索。随后向大家展示了“佛教知识图谱”和“佛教考试机器人”两项数字人文研发成果。
敦煌研究院敦煌学信息中心副主任夏生平做了题为“古代丝绸之路文明再现——数字敦煌”的报告,介绍了自然气候变化和人类活动对敦煌这一珍贵文化遗产的侵蚀与破坏,指出数字化保存对遗产保护和文明传承的重要意义;并展示了敦煌研究院在这一方向做出的努力“数字敦煌”项目的开展过程与成果。
武汉大学信息资源研究中心信息集成与应用实验室主任洪亮表示,目前市场上诗词领域的智能应用不足,其所在团队从零开始自动地构建中文诗歌知识图谱,并向大家展示了其研发成果。洪亮提出,下一步研究的方向是更细粒度的知识抽取、自然语言查询、深度的数据分析和智能写诗机器人的开发。
研讨会还设计了圆桌论坛环节,并向参会者征集圆桌论坛讨论议题。来自国内外智慧数据、数字人文各个研究领域十余位专家代表对征集的数字人文的实现技术、语义标注工具的选择、图博档机构的数据化、数字人文研究者的责任与担当等议题进行了深入讨论。与会专家一致认为,数字人文已经得到普遍认可,越来越多的机构开始进行数字人文相关尝试,数字人文研究前途光明。而智慧数据这一新兴概念则是一面旗帜,将引领文化生产与记忆机构的资源组织、资源管理朝着更加先进、更加智慧、更加智能的方向发展。
据悉,研讨会由教育部人文社科重点研究基地武汉大学信息资源研究中心、武汉大学数字人文研究中心共同主办,武汉大学信息管理学院期刊中心、武汉大学信息管理学院信息检索与知识挖掘实验室协办。