基于地方志非结构化文本数据特征的模型设计要素探究
史志学刊 任璀洛
作者简介:任璀洛(1990-),男,湖南汨罗人,湖南省地方志编纂院、湖南省地方文献研究所网络工程师,研究方向为地方志创新研究、方志馆建设研究、旧志整理研究等。
摘 要 地方志综合记录一地各方面的信息,内容广博繁杂,但不同地方志文本之间没有一定的结构规律。数字方志是地方志事业的发展趋势和方向,要充分挖掘地方志蕴含的巨大能量,必须引入数据治理的方法和步骤,对地方志文本深入开展数据分析,其中尤为关键的是对地方志文本内容中的地情要素进行模型的设计与构建。(剩余11766字)