代码之家  ›  专栏  ›  技术社区  ›  Brenda So

LLVM opt mem2reg无效

  •  12
  • Brenda So  · 技术社区  · 7 年前

    int foo(int aa, int bb, int cc){
        int sum = aa + bb;
        return sum/cc;
    }
    

    我编译了源代码并生成了2。所有文件,一个未优化,一个带有mem2reg优化器传递:

    clang -emit-llvm -O0 -c test.c -o test.bc
    llvm-dis test.bc
    opt -mem2reg -S test.ll -o test-mem2reg.ll
    

    二者都ll文件为我提供了以下输出:

    ModuleID = 'test.bc'
    source_filename = "test.c"
    target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
    target triple = "x86_64-unknown-linux-gnu"
    
    ; Function Attrs: noinline nounwind optnone uwtable
    define i32 @foo(i32 %aa, i32 %bb, i32 %cc) #0 {
    entry:
      %aa.addr = alloca i32, align 4
      %bb.addr = alloca i32, align 4
      %cc.addr = alloca i32, align 4
      %sum = alloca i32, align 4
      store i32 %aa, i32* %aa.addr, align 4
      store i32 %bb, i32* %bb.addr, align 4
      store i32 %cc, i32* %cc.addr, align 4
      %0 = load i32, i32* %aa.addr, align 4
      %1 = load i32, i32* %bb.addr, align 4
      %add = add nsw i32 %0, %1
      store i32 %add, i32* %sum, align 4
      %2 = load i32, i32* %sum, align 4
      %3 = load i32, i32* %cc.addr, align 4
      %div = sdiv i32 %2, %3
      ret i32 %div
    }
    
    attributes #0 = { noinline nounwind optnone uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
    
    !llvm.module.flags = !{!0}
    !llvm.ident = !{!1}
    
    !0 = !{i32 1, !"wchar_size", i32 4}
    !1 = !{!"clang version 6.0.0 (trunk 314616)"}
    

    2 回复  |  直到 5 年前
        1
  •  35
  •   Tiny Wings    7 年前

    最近,当用-O0编译时,clang开始添加 optnone mem2reg 通过为了防止这种情况,请添加 -Xclang -disable-O0-optnone 发出叮当声。

        2
  •  9
  •   Bruno De Fraine    5 年前

    另一个答案已经指出 -O0 -O 选项),您的函数用 optnone 属性降低优化级别的另一个影响是似乎没有生成TBAA元数据,这也会影响以后的优化。

    所以要准备一个文件 opt ,我发现最好保持您的优化级别,并通过该选项 -Xclang -disable-llvm-passes (此选项的帮助文本为“与-emit llvm一起使用,通过根本不运行任何llvm过程,从前端获取原始llvm IR”)。

    完整调用变成:

    clang -S -emit-llvm -O -Xclang -disable-llvm-passes source.c
    
    推荐文章