本发明涉及一种数据处理流程代码的生成方法,属于云计算的数据集成领域.本方法为:1)将可视化的数据处理流程Ω抽取为一逻辑模型实例;所述数据处理流程为一有向无环图结构流程,其包括流程名、版本、数据处理节点、节点连接信息;2)将逻辑模型实例转换为数据处理流程物理模型实例,所述物理模型实例为一有向无环图结构;3)根据数据处理流程物理模型实例生成数据处理流程的MapReduce代码.本发明降低了用户开发难度、加快了数据分析的进度;此外通过本发明,用户可以对数据处理流程进行参数调优配置,代码优化和流程逻辑自动优化等,极大提高流程的执行效率.
发明专利
CN201010578933.0
2010.12.03
CN102033748A
2011-04-27
叶丹 易小华 刘杰 虞海江 徐罡
中国科学院软件研究所
G06F9/44(2006.01)I,G,G06,G06F,G06F9
G06F9/44(2006.01)I,G,G06,G06F,G06F9,G06F9/44
一种数据处理流程代码的生成方法,其步骤为:1)将可视化的数据处理流程Ω抽取为一逻辑模型实例;所述数据处理流程为一有向无环图结构流程,其包括流程名、版本、数据处理节点、节点连接信息;2)将逻辑模型实例转换为数据处理流程物理模型实例,所述物理模型实例为一有向无环图结构;3)根据数据处理流程物理模型实例生成数据处理流程的MapReduce代码.