[llvm-dev] MCJit Runtine Performance

With LLVM 3.7, We have noticed that the MemCpy pass will attempt to copy LLVM struct using moves that are as large as possible. For example, a struct of 3 floats is copied using a 64-bit and a 32-bit move. It is therefore important that such a struct be aligned on 8-byte boundary, not just 4 bytes! Else, one runs the risk of triggering store-forwarding failure pipelining stalls (which we did encountered really badly with one of our internal performance benchmark). It is therefore important that the SROA pass correctly eliminates the load/store to the alloca memory regions.

[llvm-dev] MCJit Runtine Performance

Morten Brodersen via llvm-dev

Keno Fischer via llvm-dev

Hal Finkel via llvm-dev

Lang Hames via llvm-dev

Keno Fischer via llvm-dev

Lang Hames via llvm-dev

Morten Brodersen via llvm-dev

Lang Hames via llvm-dev

Morten Brodersen via llvm-dev

Hal Finkel via llvm-dev

Morten Brodersen via llvm-dev

Rafael Espíndola

Morten Brodersen via llvm-dev

Hal Finkel via llvm-dev

Morten Brodersen via llvm-dev

Morten Brodersen via llvm-dev

Rafael Espíndola

Keno Fischer via llvm-dev

Morten Brodersen via llvm-dev

Jim Grosbach via llvm-dev

Larry Gritz via llvm-dev

Lang Hames via llvm-dev

Benoit Belley via llvm-dev

Tim Northover via llvm-dev

Morten Brodersen via llvm-dev

Morten Brodersen via llvm-dev

Paweł Bylica

Matt Godbolt via llvm-dev

Lang Hames via llvm-dev

Morten Brodersen via llvm-dev