當(dāng)前位置 主頁 > 技術(shù)大全 >
`perf`(Performance analysis tools for Linux)是Linux官方的性能分析器,它存在于內(nèi)核源碼目錄的tools/perf中,原名為Linux性能計數(shù)器(Performance Counters for Linux,PCL),現(xiàn)名為Linux性能事件(Linux Performance Events,LPE)
作為Linux內(nèi)核自帶的系統(tǒng)性能優(yōu)化工具,`perf`憑借其強(qiáng)大的功能和與內(nèi)核的緊密結(jié)合,成為了開發(fā)者們不可或缺的利器
一、perf的安裝與基礎(chǔ)使用 在大多數(shù)Linux發(fā)行版中,`perf`是內(nèi)核的一部分,但需要通過軟件包管理器進(jìn)行安裝
安裝命令因發(fā)行版的不同而有所差異: Debian/Ubuntu: bash sudo apt update sudo apt install linux-tools-common linux-tools-$(uname -r) Fedora/RHEL/CentOS: bash sudo dnf install perf Arch Linux: bash sudo pacman -S perf 安裝完成后,可以通過運(yùn)行`perf --version`來確認(rèn)`perf`是否安裝成功
`perf`提供了許多子命令,每個子命令都專注于特定的性能分析任務(wù)
以下是一些常見的用法: 1.分析CPU使用情況(perf stat): `perf stat`用于統(tǒng)計一個命令的執(zhí)行過程中,硬件和軟件事件發(fā)生的次數(shù)
例如,可以用它來查看程序執(zhí)行期間的CPU周期、指令、緩存訪問等硬件計數(shù)
bash perf stat ls 輸出將包括程序執(zhí)行期間的事件統(tǒng)計信息,如CPU周期、指令數(shù)、緩存未命中次數(shù)和分支未命中次數(shù)等
2.查看程序的熱點(diǎn)函數(shù)(perf record和`perf report`): `perf record`用于記錄程序的性能數(shù)據(jù),特別是CPU性能數(shù)據(jù)(如函數(shù)的執(zhí)行頻率)
`perf report`則用于分析這些數(shù)據(jù),查看程序的熱點(diǎn)函數(shù)
bash perf record ./my_program perf report 這將記錄`my_program`的執(zhí)行數(shù)據(jù),并生成一個`perf.data`文件
然后,`perfreport`會打開一個文本用戶界面(TUI),顯示執(zhí)行數(shù)據(jù)的分析報告,包括各個函數(shù)的執(zhí)行頻率(如CPU周期占比),幫助識別程序的熱點(diǎn)函數(shù)
3.分析系統(tǒng)上的所有進(jìn)程(perf top): `perf top`類似于`top`,但它分析的是系統(tǒng)上所有進(jìn)程的實(shí)時性能數(shù)據(jù),顯示當(dāng)前占用CPU最多的函數(shù)或事件
這有助于了解哪些程序或函數(shù)正在消耗最多的系統(tǒng)資源
4.跟蹤系統(tǒng)調(diào)用(perf trace): `perf trace`是一個類似于`strace`的工具,它可以跟蹤進(jìn)程的系統(tǒng)調(diào)用并統(tǒng)計其頻率和開銷
例如,跟蹤`ls`命令的系統(tǒng)調(diào)用: bash perf trace ls 輸出將顯示`ls`過程中發(fā)生的所有系統(tǒng)調(diào)用及其耗時
5.分析內(nèi)核事件(perf sched): `perf sched`可以用來分析內(nèi)核中的調(diào)度事件,了解進(jìn)程的調(diào)度行為,分析系統(tǒng)中是否存在調(diào)度延遲等問題
二、perf的高級用法與性能調(diào)優(yōu) 除了基本用法外,`perf`還支持許多高級功能,這些功能在性能調(diào)優(yōu)中尤為重要
1.采樣指定硬件事件: `perf`可以專門采樣某些硬件事件(例如緩存未命中、分支預(yù)測失敗等),從而針對性地分析程序的性能問題
例如,記錄程序的緩存未命中情況: bash perf record -e cache-misses ./my_program 這將記錄程序執(zhí)行期間的緩存未命中次數(shù),有助于分析緩存性能問題
2.對指定PID進(jìn)行性能分析: 如果想對正在運(yùn)行的某個進(jìn)程進(jìn)行性能分析,可以使用`-p`選項(xiàng)指定進(jìn)程ID
這對分析后臺運(yùn)行的進(jìn)程非常有用
bash
perf record -p 例如:
bash
perf sched record
perf sched latency
通過分析調(diào)度延遲,可以找出導(dǎo)致系統(tǒng)調(diào)度不均衡的原因
4.程序性能瓶頸分析:
在發(fā)現(xiàn)一個程序的執(zhí)行時間比預(yù)期長時,可以使用`perfrecord`和`perf report`來分析程序的性能瓶頸 通過分析函數(shù)的CPU使用情況,找出最耗時的部分,進(jìn)而進(jìn)行優(yōu)化
5.CPU資源爭用分析:
當(dāng)系統(tǒng)負(fù)載較高時,可以使用`perftop`查看哪些進(jìn)程或者函數(shù)占用了最多的CPU資源 這有助于定位系統(tǒng)性能瓶頸,分析高CPU占用的原因
三、perf的優(yōu)勢與局限性
`perf`作為Linux內(nèi)核自帶的性能分析工具,具有顯著的優(yōu)勢:
- 性能消耗小:perf在采樣和分析過程中,對系統(tǒng)性能的影響較小,能夠確保分析的準(zhǔn)確性
- 生成文件小:perf生成的性能數(shù)據(jù)文件相對較小,便于存儲和傳輸
- report速度快:perf的分析報告生成速度快,能夠迅速提供性能問題的關(guān)鍵信息
- 與內(nèi)核緊密結(jié)合:perf能夠最先應(yīng)用到加入內(nèi)核的新特性,確保與內(nèi)核的兼容性
然而,`perf`也存在一些局限性:
- 不遵守X86 Calling Convention的函數(shù)無法獲取堆棧信息:對于某些特定的函數(shù),perf可能無法獲取完整的堆棧信息
- 內(nèi)聯(lián)函數(shù)無法獲取堆棧信息:對于內(nèi)聯(lián)函數(shù),`perf`同樣可能無法獲取堆棧信息,這會影響分析的準(zhǔn)確性
- 需要處理器支持:perf的某些功能需要處理器的支持,如果處理器不支持,則無法使用這些功能
此外,在使用`perf`時,還需要注意一些常見問題 例如,非root用戶運(yùn)行`perf`時,可能會出現(xiàn)內(nèi)存映射頁面大小超過系統(tǒng)限制的問題 此時,可以通過調(diào)整`/proc/sys/kernel/perf_event_mlock_kb`的值來解決
四、總結(jié)
`perf`是Linux內(nèi)核中強(qiáng)大的性能分析工具,能夠?qū)PU事件、系統(tǒng)調(diào)用、線程調(diào)度、硬件計數(shù)器等多種系統(tǒng)層面進(jìn)行全面的性能分析 通過掌握`perf`的基本用法和高