当前位置:首页 > 商业银行数据仓库浅析
商业银行数据仓库浅析
7 8 渠道 公共 CH CM 内部账 公共信息 企业客户 个人客户 内部组织 业务参数 公共事件 INN CHC CHE CHP IORG BP PE F_GL_INN_ F_CH_CHC_ F_CH_CHE_ F_CH_CHP_ F_CM_ORG_ F_CM_BP_ F_CM_PE_ 4.2.2 集成数据层(IDS)主题命名
序号 1 2 3 4 5 6 7 8 一级主题域中文命名 一级主题域英文命名 主题标识+汇总 CI I_CI_ 客户 存款 贷款 银行卡 中间业务 总账 渠道 公共 DP LN CR AG GL CH CM I_DP_ I_LN_ I_CR_ I_AG_ I_GL_ I_CH_ I_CM_ 4.2.3 实体/表命名
原则上,实体/表名称应使用易于理解、能准确描述该实体、表意义的业务术语,同时命名应遵循下述规则:
[1] 物理模型表名以英文命名,中文名与英文名含义应严格一致;
[2] 实体/表名不要使用不易理解的方言或有地域性/部门局限的业务术语,应使用统一的、正式的、全局范围内通用的官方业务术语; [3] 表名尽量参照原有的通用数据标准的中文名;
[4] 关于物理模型实体/表中<实体标识>的命名,如果实体表所属业务在行内有比较权威的源系统,且该系统的命名已经规范化,则尽量贴近权威源系统的命名,如:核心业务贴近FIS系统,尽量参照数据字典中表命名;
[5] 物理模型实体/表英文名全部使用字母大写。如果实体/表英文名由多个单词组成,单词之间用下划线分开;
29
商业银行数据仓库浅析
[6] 物理模型实体/表命名不超过30个字符,应尽量使用简练的英文拼写。个别超长的需要提出来,模型组统一综合考虑(主要考虑一些数据库(如TERADATA、ORACLE)定义的表名不能超过30个字符)。
[7] 历史实体中文名一般用“<当前实体中文名>”命名;英文名用“<当前实体名>”。
4.2.3.1 操作数据层(ODS)命名
[1] 格式为: O_源系统标识_源表名称
示例:核心系统客户信息表
O_FIS_CUSTMERS (注:ODS存储层_FIS核心系统标示_客户信息表) [2] 物理表统一增加字段:
DATA_DATE VARCHAR2(8)--数据日期YYYYMMDD LOAD_DATE DATE --加载日期 PROD_ID VARCHAR2(5) --数据源系统标识 SOURCE_DATA_TYPE VARCHAR2(1) –源数据类型 LOAD_TYPE VARCHAR2(1) --加载方式(全量或增量)
4.2.3.2 基础数据层(FDS)命名
[1] 格式为:F_主题标识_表标识_存储标识。
示例:企业贷款账户信息表 F_LN_LNE_ACC 示例:企业贷款账户信息历史表 F_LN_LNE_ACC_H [2] 物理表统一增加字段:
FDATE VARCHAR2(8) --数据日期/交易日期 SDATE VARCHAR2(8) --拉链表的开始日期 EDATE VARCHAR2(8) --拉链表的结束日期 [3] FDS物理表设计考虑如下字段信息:
机构信息 机构编码(开户机构 营业机构 账务机构均考虑下) 客户信息 客户号 (涉及到 关系档 主档 交易流水等) 卡信息: 卡号 (涉及到 交易流水信息)
30
商业银行数据仓库浅析
4.2.3.3 集成数据层(IDS)命名
格式为:I_主题标识_汇总标识
其中汇总标识可以为: <指标的主词>_<指标的类词>_<汇总维度>_<时间维度>。 示例:个人存款余额按账户月汇总表 I_DP_PER_AMT_ACCT_MONTH
取值说明:
类别 分区代码 主题标识 说明 汇总区分区代码 分析汇总区的业务主题分区 取值说明 全部取为:I 存款:DP; 贷款:LN; 银行卡:CR; 中间业务:AG 渠道:CH; 客户:CI; 总账:GL; 公共:CM; 如:活期存款:SA 企业客户:CIE 备注 IDS层 指标主词 该表存放的指标的关键词缩写 对“指标关键词”的进一步说明 指标类词 如:数量:NUM; 金额:AMT 交易:TX;不明确的:ALL 按机构: INST 按客户: CUST 按客户经理:CUM 其它维度选:ALL 年:YEAR; 月:MON 日:DAY; 季:QUAR 旬:TEND; 半月:HALFM 半年:HALFY 汇总维度 时间维度 汇总时间频度
? 数据类型规范
字段含义 日期类 (年月日) 时间类 (时分秒) 数据类型说明 日期类型数据。 时间类型的数据。 配置类型 定义为:date 定义为:char(6) 格式:HHMMSS 24小时格式 定义为:date 31
日期时间类(年月日时分日期及时间类型的数据。 秒) 商业银行数据仓库浅析
精确到毫秒的时间戳 (年月日时分秒毫秒) 9(15) COMP-3 CONVTIMESTAMP 太阳日,表示某年的第几天, 格式为:YYYYDDD YYYY表示年份;DDD表示该年 的第几天,取值范围从1到366; 将转换为正常的日期格式: YYYY-MM-DD 格式:YYYYMMT(年月旬),T=1 代表上旬,T=2代表中旬,T=3 代表下旬,例如:2010年10月 下旬表示为2010103。 表示“是/否”意义的指示器, 例如:外部产品标志,雇员标 志,等等。 包括长整数和短整数。 定义为:timestamp 太阳日 定义为:date 旬日期 定义为:char(7) 指示器 整数类数据 定义为:char(1) 具体含义:“1-是,0-否”。 定义为:number(12,0) 定义为:number(20,2) 或 number(20,3) (20 位数字字 符,其中包括小数点和两(三) 个小数位)。 定义为:number(16,2) 定义为:number(8,6) 定义为:number(15,10) 定义为:number(8,6) 金额类数据 所有金额类数据,例如:资产 评估价值,负债余额,等等。 一般数值类数据 利率 汇率 费率 占比(百分比类数据) 一般的、无特殊含义的数值 例如:不动产面积,等等。 利率数据。 汇率数据。 费率数据。 某种情况相对另一种情况的占 比,一般在0和1之间取值, 例如:市场占有率,资产折旧 率,等等。 两种情况之间的比率,可能会 出现大于1的情况。 记录描述性的文字。 定义为:number(8,6) 比率(百分比类数据) 一般字符串 定义为:number(16,8) varchar2(n)
4.2.4 属性/列命名
原则上,属性/列名称应使用易于理解、能准确描述该属性/列意义的业务术语,同时命名应遵循下述规则:
32
共分享92篇相关文档