位置:
首页

>

>

建立图模型的关键步骤
时间:
图模型由节点和边组成。节点代表实体或概念,而边由属性或关系组成。
实体是指可区分且独立的事物,例如某个人,某个城市,某种植物,某种商品等。它是图模型中最基本的元素;概念是特征组合形成的知识单元主要是指集合,类别,对象类型和事物的类型,例如人,地理等。
属性主要是指实体或概念的特征或特性,例如一个人的国籍和生日。我们采用“哲学家”的观点。
以设计图形模型为例,如图5-13所示。 ▲图5-13逻辑示意图模型示例逻辑示意图模型的构建包括几个关键步骤,如图5-14所示。
▲图5-14建立企业图模型的步骤。第一步:业务场景定义业务场景确定信息覆盖范围和信息粒度的表示形式。
以支持业务连续性为例。由于不可抗力的影响,某些地区的供应商工厂无法正常生产和运输。
涉及的信息包括供应商信息,产能,组件和内部材料,合同和客户信息。根据用户输入的当前物料储备和合同状态,获取影响内部物料,产品,合同交付和客户的清单和范围。
这种应用涉及产品目录和配置的解释,并且需要从收集的信息中提取最少的购买组件。信息粒度是图模型构建中不可忽视的问题。
根据应用场景确定信息的粒度以及图模型的准确性和有效性。例如,手机包括品牌,型号,批次和整个手机。
在相同的信息范围内,粒度越细,图模型的应用范围越广,关系越丰富,但是冗余度越高,知识消耗的效率就越低。信息粒度的原理是“可以满足业务应用程序的最粗粒度”。
第二步:信息收集信息的选择应考虑两个方面。与应用场景直接相关的信息。
例如,为了确定不可抗力供应中断的影响范围,直接相关的信息包括物料信息,产品配置,合同信息等。它与应用场景间接相关,但可以帮助理解问题的信息。
这包括公司信息,专业领域信息,行业信息和开放域信息。第三步:图建模中的相同数据可以用几种模式定义。
好的模型可以减少数据冗余并提高实体识别的准确性。在建模过程中,有必要结合数据特征和应用场景来完成。
相同的数据可以从不同的角度绘制不同的图形模型。步骤4:注释实体,概念,属性和关系。
公司图模型中涉及的实体和概念可以分为三类:公共类别,例如人名,组织名称,地名,公司名称,时间等;公司类别,例如业务术语,公司部门等;行业类别,例如金融业,通信业等。步骤5:实体和概念的识别。
公司图模型中实体和概念的识别可以使用业务输入和数据资产中的现有信息作为种子,并使用命名实体识别(NER)的方法来扩展新的实体概念。确认后,它将包含在实体和概念库中。
步骤6:属性识别和关系识别。通常,基于业务知识在模式级别定义公司图模型中的属性和关系。
属性和关系相对稳定,并且没有很多扩展方案。企业图模型的存储技术必须全面考虑应用场景,图模型中节点和连接的数量,逻辑的复杂性,属性的复杂性以及性能要求。
通常建议使用混合存储方法,使用图形数据库存储关系,使用关系数据库或键值对存储属性。强调逻辑推理的应用场景使用RDF存储方法,而强调图计算的应用场景。
产品资料
行业信息