• 一种数据处理流程代码的生成方法

    • 摘要:

      本发明涉及一种数据处理流程代码的生成方法,属于云计算的数据集成领域.本方法为:1)将可视化的数据处理流程Ω抽取为一逻辑模型实例;所述数据处理流程为一有向无环图结构流程,其包括流程名、版本、数据处理节点、节点连接信息;2)将逻辑模型实例转换为数据处理流程物理模型实例,所述物理模型实例为一有向无环图结构;3)根据数据处理流程物理模型实例生成数据处理流程的MapReduce代码.本发明降低了用户开发难度、加快了数据分析的进度;此外通过本发明,用户可以对数据处理流程进行参数调优配置,代码优化和流程逻辑自动优化等,极大提高流程的执行效率.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201010578933.0

    • 申请日期:

      2010.12.03

    • 公开/公告号:

      CN102033748A

    • 公开/公告日:

      2011-04-27

    • 发明人:

      叶丹 易小华 刘杰 虞海江 徐罡

    • 申请人:

      中国科学院软件研究所

    • 主分类号:

      G06F9/44(2006.01)I,G,G06,G06F,G06F9

    • 分类号:

      G06F9/44(2006.01)I,G,G06,G06F,G06F9,G06F9/44

    • 主权项:

      一种数据处理流程代码的生成方法,其步骤为:1)将可视化的数据处理流程Ω抽取为一逻辑模型实例;所述数据处理流程为一有向无环图结构流程,其包括流程名、版本、数据处理节点、节点连接信息;2)将逻辑模型实例转换为数据处理流程物理模型实例,所述物理模型实例为一有向无环图结构;3)根据数据处理流程物理模型实例生成数据处理流程的MapReduce代码.