分组帮助文档

        分组步骤是根据指定字段将数据先进行分组再聚合后,输出到流中。步骤配置信息如图1所示。java

                                    

                                                                                     图1 步骤配置信息缓存

 

        下文详细解释各控件的含义:函数

        一、转换步骤名称:步骤的名称,在单一转换中,名称必须惟一。学习

        二、包括全部的行:勾选此项,激活第三、四、5个控件,将在输入流中的行集新增一列聚合字段输出到流中;若不选此项,只输出控件8和控件9所设置的字段。spa

        3.临时目录临时文件的存储路径 。能够用变量来获取,插件默认的变量是“%%java.io.tmpdir%%”,这个变量是获取操做系统缓存的临时目录,不一样操做系统的缓存临时目录不同,在Windows的缓存目录为:C:\Users\登陆用户~1\AppData\Local\Temp\;Linux:/tmp。操作系统

        4.临时文件前缀:设置一个可识别的前缀,以便文件在临时文件目录中时对其进行标识。 插件

        5.增长行号,每组从新开始:若勾选此项,将新增一列行号,且输入的数据行集进行分组后的每一组都将独享一个行号序列。blog

        6.行号列名:指定行号列的字段名称。字符串

        7.总返回一个结果行:勾选此项,当在没有输入行的状况下,也至少生成一行,这样在计数汇集的状况下,能够得到正确结果。get

        8.构成分组的字段:指定分组的字段。

        9.聚合: 

        (1)名称:指定聚合以后结果数据的字段名称。

        (2)字段:指定进行聚合的字段。

        (3)类型:指定聚合的函数。

        (4)值:只有在类型选择为“使用指定字符连接同组字符串”时,该值会成为一个分隔符将同组数据分隔。如图2所示:

                                                

                                                                                                    图2

        

        文章原创首发于:https://ckettle.ccsaii.com.cn/help/StepPluginType/GroupBy?s=csdn

        更多CKettle内容,欢迎点击上述连接学习。