LLVM编译器中PGO的用法

赤玉

已于 2024-08-03 10:37:18 修改

阅读量692

点赞数 10

CC 4.0 BY-SA版权

分类专栏： LLVM 文章标签：性能优化 c语言 c++

于 2024-08-03 10:17:49 首次发布

本文链接：https://blog.csdn.net/qq_44083568/article/details/140886465

作用

PGO是LLVM编译器的一种优化技术，它通过运行程序以收集性能数据（主要是基本块的执行频率），利用这些数据来指导编译器进行更有效的优化。

方法

简单来说就是三步：

第一步，在编译时加上-fprofile-generate编译选项进行第一次编译。

第二步，运行第一次编译的程序得到性能数据。

第三步，使用性能数据指导编译器进行第二次编译获得优化后的程序。

本次采用的编译器是LLVM 17.0.0。

第一次编译

clang  -fprofile-generate   test.c  -o  test

运行第一次编译的程序

#生成binary并执行，会生成*.profraw文件
./test

这一步将会生成*.profraw的文件，其中包含了test程序的性能数据，根据不同的输入可以生成多个性能数据文件

使用性能数据进行第二次编译

在编译之前首先要把得到的性能数据文件做合并（单个文件也要做转化）

#将*.profraw文件转为*.profdata文件
llvm-profdata merge -sparse *.profraw -o code.profdata

进行第二次编译

clang  -fprofile-use=code.profdata   test.c  -o  test_pro

此时生成的binary相比于不加此优化的binary应该有更好的性能

在spec cpu2006的基准测试429.mcf上的测试结果

binary	第一次（runtime）	第二次（runtime）	第三次（runtime）

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

赤玉

关注关注

10
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Visual Studio 中应用 LLVM

chinabinlang的专栏

08-02

3473

一： vs2017 ： vs2017 自带了 clang-cl，clang 版本较低；可以手动替换 vs 目录中的 clang，但是可以编译，却无法调试，或者还有别的不兼容；在 vs2017应用 LLVM，现有一个简答方法：简单说明：关闭所有 Visual Studio； 1：安装LLVM Compiler Toolchain； 2：安装 LLVM 可以参考：https:...

Android使用PGO优化native库运行速度

weixin_41191739的博客

07-21

772

Profile-guided optimization (PGO)，配置文件引导的优化，基于插桩或采样从程序运行时生成配置文件，使编译器对内联和代码布局做优化，可以获得免费的性能提升。在安卓中使用的教程较少，实际操作时会遇到一些问题，在这里记录一下使用插桩的方式。 1. 使用-fprofile-generate编译和链接经过插桩的动态库添加编译参数 android { ... defaultConfig { ... externalNat

参与评论您还未登录，请先登录后发表或查看评论

【LLVM】学习使用PGO优化

weixin_45207619的博客

06-26

1118

笔者在查看PGO优化时看到了本站的，其中代码和命令行部分贴上了序号，且命令行带上了$符号，不便于读者调试。遂将代码重新整理到gitee，在此。

编译器工具链（四）——配置文件引导优化（PGO）

weixin_54911557的博客

01-12

1612

配置文件引导优化（PGO）的质量取决于程序在收集配置文件时运行的测试向量。但即使在有限的测试场景下，配置文件引导优化（PGO）仍然在某些情况下是有益的，例如，即使是完全不同的测试用例，程序的启动顺序依旧不会发生很大的变化。如果编译器可以了解不同程序点的执行频率，就可以在编译过程中做出更好的优化决策。许多编译优化都是基于程序静态分析得到的。的采样分析器会在程序执行时使用基于硬件的计数器来记录某些特殊事件。需要注意的是，并不是所有的硬件都支持所有的事件，也不是所有的Linux perf功能都支持RISC-V。

编译器 编译过程 compiling 动态链接库 Linking 接口ABI LTO PGO inline bazel增量编译

万有文的博客

05-25

937

编译器有能力让不同 target 的 cpp 文件的不同编译选项，有区分地生效。但无法控制其它cpp文件对头文件的使用，因此头文件为主体的开源项目，经常不得不很小心地去处理各种使用情况。

使用Intel编译器(5)PGO(8)编译器其它工具

。。。。

12-21

1217

参考手册： http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011Update/compiler_c/index.htm 说明：本系列文章为个人笔记，如有不正确之处，请参考官方相关文档，如果错误发现，我会尽量更新修改。另外，以下内容不保证对于所有版本的编译器都正确，编译器的实现也

Golang 程序性能优化利器 PGO 详解（二）：收集样本数据和编译

路多辛的所思所想

08-13

941

在软件开发过程中，性能优化是不可或缺的一部分。无论是在Web服务、数据处理系统还是实时通信中，良好的性能都是至关重要的。Golang 从1.20版版本开始引入的 Profile Guided Optimization（PGO）机制能够帮助更好地优化 Go 程序的性能。上篇文章讲解了 Golang PGO 的概念和使用方法，并且使用简单的示例演示了 PGO 的使用方法，本文详细讲解一下 PGO 相关的知识点。

【揭秘LLVM】：成为编译器前端与后端的桥梁专家

LLVM作为一款广泛使用的编译器基础设施，其前端设计哲学、中间表示（IR）优化策略和后端架构优化流程在编译器设计中起到了关键作用。文章详细探讨了LLVM在跨平台编译、模块化、代码生成与优化等领域的应用，并分析了...

llvm_profile_materials

04-04

- **LLVM Profile Guided Optimization (PGO)**：如何使用LLVM进行PGO，收集profile数据，以及如何将这些数据用于编译器优化决策。 - **LLVM Profiling Infrastructure**：LLVM如何实现profiling，包括收集、存储和...

Go1.20 那些事：PGO、编译速度、错误处理等新特性，你知道多少？

EDDYCJY的博客

02-06

771

大家好，我是煎鱼。最近 Go1.20 在 2 月初已经正式发布，来的挺早的，以往都是拖到月底的，我翻了好几篇，发现最后还是做了不少功能取舍，被迫放了某些新特性（例如：arena 等）的鸽子！怀疑 Go 团队 2 月份是有什么事要干，或者打算休假？又或是担心裁员影响工作交接？今天快速温习与我们关联性多些的新特性，看看升不升 1.20。编译速度提高之前 Go1.18 正式发布了泛型，有欢喜也有忧。这虽...

使用Intel编译器(5)PGO(5)PGO工具之代码覆盖工具(code coverage)2

。。。。

12-08

2104

【LLVM】PGO学习（2）

最新发布

weixin_45207619的博客

06-26

242

接上篇，发现了一个很有趣的点，当只运行了一次true分支，不运行false分支时，编译器不会将两个分支合并，当两个分支都运行时，编译器会将两个分支合并，具体见上一篇文章。也可以在我的代码库，运行make run，输入1 0之后查看只运行一次true分支，不运行false分支的结果。比较好奇如果运行了一次false分支，不运行true分支，会将两条分支的内容进行交换吗？

使用Intel编译器(5)PGO(1)PGO了解和使用

。。。。

12-06

7128

LLVM 如何利用 Profile Guided Optimization (PGO)信息

zhangxiang0503的博客

11-03

2189

LLVM PGO Profile Guided Optimization

Go和C++通用性能优化黑魔法——PGO！

QcloudCommunity的博客

10-19

1631

????导读我们在进行性能优化的时候，往往会应用各种花式的优化手段：优化算法复杂度（从 O(N) 优化到 O(logN) ），优化锁的粒度或者无锁化，应用各种池化技术：内存池、连接池、线程池、协程池等。压缩技术、预拉取、缓存、批量处理、SIMD，内存对齐等等手段后，其实还有一种手段就是 Profile-Guided Optimization （PGO）。本文会介绍 PGO 的原理，以及 Go/C++ 语...

使用Intel编译器(5)PGO(2)PGO性能的提升和一些tips

。。。。

12-06

1793

j link linux内核_微软探索 LTO+PGO 以优化 Linux 内核，使编译器性能提升了 5~20%

weixin_39622562的博客

12-21

646

当越来越多的软件厂商采用链接时优化(LTO, link-time optimizations)和配置文件引导优化(PGO, profile-guided optimizations)来利用编译器榨取性能的时候，微软工程师正在为自用的 Linux 内核探索 LTO+PGO，以实现更好的 Linux 性能。在 Linux 内核上使用链接时优化并不是新概念，过去已有多家厂商发布了针对 Linux 内核的...

使用Intel编译器(5)PGO(6)PGO工具之profmerge&proforder

。。。。

12-20

1523

用 PGO 对C++程序执行性能进行优化

余璜的技术博客

08-16

4121

”I just tried out PGO (profile-guided optimization) on my program using GCC 4.3 on Linux. The result was quite amazing. Sped up my program (a chess engine, 100% CPU) by almost 18%-20% (repeated a few times)“