代码之家 › 专栏 › 技术社区 › Averell

如何将EMR流作业日志复制到S3并清理EMR核心节点磁盘上的日志

flink-streaming amazon-emr yarn streaming logging

Averell · 技术社区 · 6 年前

我在AWS EMR 5.20上运行一个Flink(v1.7.1)流媒体作业,我希望所有任务管理器和作业管理器的工作日志都在S3中。根据Flink团队的建议使用Logback。

定期复制到S3
按时或按大小滚动(因为可能有大量日志)

我试过的是:

在创建EMR集群时启用到S3的日志记录
yarn.log-aggregation-enable、yarn.nodemanager.remote-app-log-dir、yarn.log-aggregation.retain-seconds、yarn.log-aggregation-enable,
logback.xml中配置的滚动日志:

    <appender name="ROLLING" class="ch.qos.logback.core.rolling.RollingFileAppender">
        <file>${log.file}</file>
        <rollingPolicy class="ch.qos.logback.core.rolling.SizeAndTimeBasedRollingPolicy">
            <fileNamePattern>%d{yyyy-MM-dd HH}.%i.log</fileNamePattern>
            <maxFileSize>30MB</maxFileSize>    
            <maxHistory>3</maxHistory>
            <totalSizeCap>50MB</totalSizeCap>
        </rollingPolicy>
        <encoder>
            <pattern>%d{yyyy-MM-dd HH:mm:ss.SSS} [%thread] %-5level %logger{60} %X{sourceThread} - %msg%n</pattern>
        </encoder>
    </appender>

到目前为止,我得到的/观察到的是:

(1) 有助于定期将日志文件复制到S3
(2) 直到现在对我来说还是没用的。日志仅在流作业结束且未观察到滚动时聚合。
(3) 取得了一些成果,但尚未接近要求:
- 滚动日志在某个缓存文件夹中( /mnt/yarn/usercache/hadoop/appcache/application_1549236419773_0002/container_1549236419773_0002_01_000002 )
- 在通常的纱线日志文件夹中只有最后一个滚动日志文件可用( /mnt/var/log/hadoop纱线/容器/应用程序_1549236419773_0002/容器_1549236419773_0002_01_000002
- S3中只有最后一个滚动日志文件可用

简而言之,在我得到的3个需求中,我只能选择(1)或(2&3)。

你能帮我做这个吗?

谢谢,并致以最良好的问候,

1 回复 | 直到 5 年前

kkrugler 6 年前

据我所知,将日志自动备份到EMR支持的S3只会在作业结束时工作,因为它基于AWS最初为批处理作业实现的后台日志加载程序。也许有一种方法可以让它工作,我只是从来没有听说过。

我自己也没试过,但如果必须的话,我可能会尝试以下方法:

S3fs .
设置 logrotate (或等效)自动复制和清除日志文件。

如果 S3fs系列 如果出现问题,则可以执行更多脚本并直接使用 aws s3

推荐文章

L. Viktor · 通过超时以恒定可用性更新集合

6 年前

Soheil Pourbafrani · Apache Flink-org的类文件。阿帕奇。弗林克。流式处理。api。斯卡拉。找不到数据流

6 年前

Brutal_JL · flink ReduceFunction的默认触发器是什么?

6 年前

Lage Ragnarsson · Flink Kafka源时间戳提取器的类加载

6 年前

Rolf Lobo · 使用线程在消费流中使用Flink producer in循环运行Flink消费程序

7 年前

Simon · 过滤器Flink元组

7 年前

wittyameta · 阿帕奇·弗林克:我如何在不重新启动工作的情况下重新加载更新后的jar?

7 年前

Amit Dass · Apache Flink:如何使用表API查询关系数据库?

7 年前

user4078581 · Apache Flink:不能将writeAsCsv()与子类tuple的数据流一起使用

7 年前

averas · 将低延迟流与Flink中的多个元数据流相结合(丰富)

7 年前