• 91 探花 读DAMA数据照顾常识体系指南24数据集成见识(下)

  • 发布日期:2025-03-21 03:56    点击次数:69

    91 探花 读DAMA数据照顾常识体系指南24数据集成见识(下)

    1. 复制91 探花

    1.1. 复制手艺将分析和查询对主事务操作环境性能的影响降至最低

    1.2. 复制处分有商酌平淡监视数据集的更将来记,而不是数据集自己

    1.3. 顺次复制处分有商酌是准实时的,数据集的一个副本和另一个副本之间的改动有很小的蔓延

    1.4. 由于复制处分有商酌的自制是对源数据集的影响最小,传送的数据量也最小(十分显著),因此许多数据集成处分有商酌中齐使用了复制,即使是那些不包括汉典物理鉴识的处分有商酌亦然如斯

    1.5. 当源数据集和方针数据集是相互的精准副本时,复制用具的发挥最好

    1.6. 如若数据改动动作发生在多个副本站点时,那么数据复制处分有商酌不是最好的遴荐

    2. 归档

    2.1. 不常常使用的数据不错迁徙到对组织老本较低的备用数据结构或存储处分有商酌中

    2.2. ETL功能可用于归档数据并可能将其迁徙为归档环境中的数据结构

    2.3. 使用归档存储来自正在退役的运用要领的数据以及来自遥远未使用的坐褥系统的数据,不错擢升操作效果

    3. 企业音信形态/标准形态

    3.1. 标准化的数据模子是组织或数据交换团队使用的通用模子,用于顺次化数据分享的形态

    3.2. 标准形态的使用裁减了系统或组织之间数据迁徙量

    3.3. 每个系统齐只需要将数据迁徙为中央标准形态的数据,而不需要将数据迁徙为广博系统形态

    3.4. 开导和约定分享音信形态是一项进犯的任务,领有标准形态不错显耀裁减企业中数据互操作的复杂性,从而大大裁减援手老本

    4. 交互模子91 探花

    4.1. 点到点

    4.1.1. 分享数据系统之间的绝大多数交互齐是“点对点”的,它们径直互相传递数据4.1.2. 影响处理(Impacts to Processing)4.1.2.1. 如若源系统是操作型的,那么提供数据的职责量可能会影响往来处理4.1.3. 照顾接口(Managing Interfaces)4.1.3.1. 点对点交互模子所需的接口数目接近系统数目的平方数4.1.4. 潜在的不一致(Potential for Inconsistency)4.1.4.1. 当多个系统需要不同的版块或数据形态时,就会出现联想问题

    4.2. 中心辐照型

    4.2.1. 中心辐照型(Hub-and-Spoke)模子是点对点的替代有商酌,它将分享数据(物理或虚构)整合到运用要领不错使用的一个中央数据中心4.2.2. 数据中心提供一致的数据视图,对源系统性能的影响有限4.2.3. 数据中心甚而最小化了必须拜访的数据源系统和抽取的数目,从而减少对源系统资源的影响

    4.3. 发布与订阅

    4.3.1. 发布和订阅模子波及推送(发布)数据的系统和其他给与(订阅)数据的系统4.3.2. 当多个数据破钞者需要特定形态的数据集时,荟萃开导该数据集并使其对系数需要的东说念主齐可用,可确保系数参与者实时收到一致的数据集

    5. 数据集成和互操作架构见识

    5.1. 运用耦合

    5.1.1. 耦合刻画了两个系统交汇的进度5.1.2. 两个精湛耦合的系统平淡有一个同步接口,其中一个系统恭候另一个系统的反映5.1.3. 精湛耦合代表了运营上的风险:如若一方系统不行用,那么它们本色上齐不行用,况且两个系统的业务一语气性筹划必须保握一致5.1.4. 松耦合是一种优选的接口联想,其中在系统之间传送数据不需要恭候反映,而且一个系统不行用时,不会导致另一个系统无法使用

    5.2. 编排和历程阻挡

    5.2.1. 编排(Orchestration)是一个术语,用来刻画在一个系统中何如组织和奉行多个谈判历程5.2.2. 系数处理音信或数据报的系统,必须简略照顾这些历程的奉行章程,以保握一致性和一语气性5.2.3. 历程阻挡是确保数据的疗养、委派、抽取和装载的准确和圆善的组件5.2.4. 数据库行为日记5.2.5. 批量功课日记5.2.6. 警报5.2.7. 相当日记5.2.8. 功课依赖图,包含救助有商酌、顺次酬谢5.2.9. 功课的时钟信息,如依赖功课的定时、生机的功课长度、经营(可用)的窗口时期

    5.3. 企业运用集成

    5.3.1. 在企业运用集成模子(Enterprise Application Integration, EAI)中,软件模块之间仅通过界说精湛的接口调用(运用要领编程接口-API)进行交互

    5.4. 企业劳动总线

    5.4.1. 企业劳动总线(Enterprise Service Bus, ESB)是一个系统,它充任系统之间的中介,在它们之间传送音信。运用要领不错通过ESB现存的功能封装发送和给与的音信或文献5.4.2. 企业劳动总线(Enterprise Service Bus, ESB)是用于在多个系统之曲折近实时分享数据的数据集成处分有商酌,其数据中心是一个虚构见识,代表组织中数据分享的顺次和标准形态

    5.5. 面向劳动的架构

    5.5.1. 大多数锻练的企业数据集成战略齐领受面向劳动的架构(Service-Oriented Architecture, SOA)念念想5.5.2. 运用要领无谓与其他运用要领径直交互或了解其他运用要领的里面职责5.5.3. SOA援手运用要领的独处性和组织替换系统的才调,而无需对与之交互的系统进行要紧改动5.5.4. SOA的方针是在独处的软件模块之间界说精湛的交互5.5.4.1. 每个模块可供其他软件模块或个东说念主破钞者奉行功能(提供劳动)5.5.5. SOA的要道见识是提供了独处的劳动:该劳动莫得调用运用要领的事先常识,劳动的收场是调用运用要领的黑匣子5.5.6. SOA不错通过Web劳动、音信传送、RESTful API等多种手艺来收场5.5.6.1. 平淡算作不错供运用系统或个东说念主破钞者调用的API(运用要领编程接口)收场劳动5.5.6.2. 一个界说精湛的API注册表包含了可用的选项、需要提供的参数以及提供的收尾信息

    5.6. 复杂事件处理

    5.6.1. 事件处理是一种追踪和分析(处理)谈判发惹事件的信息流(数据流),并从中得出论断的方法5.6.2. 复杂事件处理(Complex Event Processing, CEP)将多个开首的数据进行淹没,通过识别出有真谛的事件(如契机或要挟),为这些事件成就规则来引诱事件处理及路由,进而量度行动或行为,并凭证量度的收尾自动触发实时反映5.6.2.1. 组织不错使用复杂事件处理来量度行动或行为,并凭证量度的收尾自动触发实时反映5.6.2.2. 当测量值朝上预定的时期、温度或其他值的阈值时,事件也不错界说为状况的变化5.6.3. CEP存在好多数据挑战5.6.3.1. 未必局件发生的概率让在发惹事件时检索必要的疏淡数据变得不切本色5.6.3.2. 高效的处理平淡条目事先在CEP引擎的内存中预存一些数据5.6.4. 复杂事件处理需要一个简略集成各式类型数据的环境5.6.4.1. 由于量度平淡波及大批各式类型的数据,是以复杂事件处理常常与大数据谈判

    5.7. 数据联邦和虚构化

    5.7.1. 当数据存在于不同的数据存储库时,还不错通过除物理集成之外的式样来团聚5.7.2. 非论各自结构何如,数据联邦(Data Federation)提供拜访各个独处数据存储库组合的权限5.7.3. 数据虚构化(Data Virtualization)使鉴识式数据库以及多个异构数据存储简略算作单个数据库来拜访和稽查

    5.8. 数据即劳动

    5.8.1. 软件即劳动(SaaS)是一种委派和许可模式5.8.2. 许可运用要领提供劳动,但软件和数据位于软件供应商阻挡的数据中心,而不是取得许可组织的数据中心5.8.3. 数据即劳动(DaaS)的一个界说是从供应商取得许可并按需由供应商提供数据,而不是存储和爱戴在被许可组织数据中心的数据

    5.9. 云化集成

    三级小说

    5.9.1. 云化集成,也称为集成平台即劳动或IPaaS,是算作云劳动委派的一种系统集成形态5.9.2. 用它处理数据、历程、面向劳动架构(SOA)和运用集成5.9.3. 集成不错分为里面集成和企业间集成(B2B)5.9.3.1. 里面集成需求是通过里面中间件平台提供劳动,况且平淡使用劳动总线(ESB)来照顾系统之间的数据交换5.9.3.2. 企业间集成是通过电子数据交换(EDI)网关、升值集合(VAN)或市集完成

    6. 数据交换顺次

    6.1. 数据交换顺次是数据元素结构的崇拜规则

    6.2. 数据交换标准是组织或数据交换团队使用的通用模子,用于顺次化数据分享形态

    6.3. 交换模式界说了任何系统或组织交换数据所需的数据迁徙结构

    6.3.1. 数据需要映射到交换标准中

    6.4. 国度信拒却换模子(NIEM)

    6.4.1. 是为在好意思国政府机构之间交换文献和往来而开导的数据交换顺次6.4.2. 方针是使信息的发送者和给与者对该信息的含义有一个共同的、明确的邻接6.4.3. 与NIEM的一致性确保了基本的信息集被很好地邻接91 探花,况且在不同的社区中具有疏导的一致性的含义,从而收场互操作性