首页 > 硕士 > 工学 > 正文

多根模型研究及在分布式环境下的应用

Research of Multi-Root Tree and It’s Applications in Distributed Environment

作者: 专业:计算机应用技术 导师:王秀坤 年度:2010 学位:硕士  院校: 大连理工大学

Keywords

Multi-root Tree, Data Diagram, Pattern Graph, Data Extraction

        随着分布式技术,并行计算的发展,现有的关系模型很难适应分布式的计算环境。关系模型严谨的数学描述,在集中式的环境下有着大量的广泛的应用,面对分布式的环境就显得力不从心。多根树的这种模型结构早在1989年就被中国学者提出,同时期很多的外国研究人员也提出了类似的结构,很多的这方面的研究也被应用于各种领域,取得了一定成效。多根树的数据模型具有明显的层次,节点间也具有明显的关联,形式上就可以很好的描述分布式的环境。本文的主要工作包括:首先对关系模型下的模式图和数据图进行研究,描述了如何将关系模型转化成模式图,给出了模式图和数据图的定义,及二者之间的联系。接着探讨的多模数据模型的性质和数据操作,研究了如何将模式图和数据图转化为多根树,如何用多根树结构来抽象描述分布式数据库的组织结构,介绍了模式图和数据图转化的方法和限制的条件,研究了关系模型下的与模式有关和与模式无关的两种情形下的数据提取操作,进一步探讨了多根树下的单个控制条件和多控制条件下的数据提取操作,数据合并操作。紧接着深入研究了关系模型下的语义相关的数据提取操作,分析了不同的数据操作策略的优劣,同时分析了多根树的提取操作的方法,分析了方法的可行性和优劣点,利用多根树的数据操作对关系模型的操作进行优化,添加人工干预等手段。最后本文将所做的研究跟实际的水路方案编制系统结合,将多根树的数据提取方法应用在基于关系数据库的分布式系统中,综合考虑数据的分布和数据一致性,并重点验证了数据提取的效率,找到提取操作的瓶颈,给出相应的优化策略,从而看到了多根树模型在分布式环境下应用的广阔前景。
    With the development of the distributed technology and the parallel computing, we found that the relational model was difficult to adapt to the distributed environment. Relational model is widely used in a centralized environment, but it is inadequate for the distributed environment. Multi-root tree was proposed in 1989 by the Chinese scholars. Many researchers also proposed the similar structure. A lot of researches have been applied in various fields and achieved some success. Multi-root tree is a significant hierarchical model and it can be a good description of the distributed environment.The main work includes:first, studies the relational model’s schema graph and data graph, describes how to turn the relational model into a schema graph, and shows the definition of the data graph and the schema graph. Then we explores the nature of the multi-root tree, studies how to transform the schema graph and the data graph into multi-root tree and how to use multi-root tree to descript the distributed database. Also we describe conversion’s methods and limits, study the data extraction operation of the relational model with the conditions that model related and unrelated, and further discusses the data extraction operation under a single control conditions and multiple conditions, data merge operation. Then further studies of the data extraction operation of relational model with the semantically related data, analysis different operating strategies, the extraction method of multi-root tree and the feasibility and advantages and disadvantages of these methods. We use the multi-root tree operation to optimize the operation of the relational model and add artificial intervention and other means.Finally, we combine with the project that waterway system, apply the data extraction method in the system, ensuring the data distribution and data consistency, and focus on validation the efficiency of the data extraction. We find the bottleneck and also give the corresponding optimization strategy. Then we show the broad application prospects of the multi-root tree.
        

多根模型研究及在分布式环境下的应用

摘要4-5
Abstract5
1 绪论9-12
    1.1 选题背景及研究意义9
    1.2 国内外研究现状9-10
    1.3 本文的主要工作10-12
2 相关概念和技术简介12-21
    2.1 分布式数据库简介12-14
        2.1.1 分布式数据库定义12
        2.1.2 分布式数据库特点12-13
        2.1.3 分布式数据库优势13-14
    2.2 分布式数据库体系结构与模式14-18
        2.2.1 分布式系统结构14-15
        2.2.2 分布式数据库模式结构15-16
        2.2.3 分布式数据库设计16-18
    2.3 数据提取18-21
        2.3.1 ETL的数据提取18-19
        2.3.2 网页或文本的数据提取19-20
        2.3.3 分布式数据库的数据提取20-21
3 树模型的研究21-31
    3.1 多根树定义21-25
        3.1.1 树的定义21-22
        3.1.2 多根树的定义22-23
        3.1.3 多根树的性质23-24
        3.1.4 多根树的操作24-25
    3.2 关系模型25-27
        3.2.1 关系模型概念25-26
        3.2.2 模式图26
        3.2.3 数据图26-27
    3.3 关系模型与多根树27-29
        3.3.1 模式图转化成多根树28
        3.3.2 数据图转化成多根树28-29
    3.4 分布式数据库与多根树29-31
4 多根树模型数据操作方法研究31-41
    4.1 关系模型下数据操作31-36
        4.1.1 语义相关31-32
        4.1.2 与模式相关的数据提取32-34
        4.1.3 与模式无关的数据提取34-36
    4.2 多根树的数据操作方法36-39
        4.2.1 一个控制节点的多根提取36-38
        4.2.2 多控制节点的多根提取38-39
    4.3 多根数据合并39-40
    4.4 人工干预提取40-41
5 多根树模型的应用41-57
    5.1 系统简介与应用分析41
    5.2 数据更新方法41-46
        5.2.1 主流产品的复制策略42-43
        5.2.2 主COPY更新策略43-44
        5.2.3 多COPY任意更新策略44
        5.2.4 本系统采用的更新方法44-46
    5.3 数据操作方法46-52
        5.3.1 可控模式抽取实现46-48
        5.3.2 数据合并实现48-49
        5.3.3 数据提取实现49-51
        5.3.4 数据导入实现51-52
    5.4 测试验证52-57
        5.4.1 测试环境53-54
        5.4.2 实验过程及分析54-57
结论57-58
参考文献58-60
攻读硕士学位期间发表学术论文情况60-61
致谢61-63
        下载全文需50


本文地址:

上一篇:催化裂化装置应用IFP技术扩能改造
下一篇:基于GPU加速的真实感渲染系统研究与实现

分享到: 分享多根模型研究及在分布式环境下的应用到腾讯微博           收藏
评论排行
公告 
相关硕士文献推荐