探索 Go 語言中 Opentelemetry 與 Prometheus 集成,導(dǎo)出 HTTP 服務(wù)指標(biāo)監(jiān)控,并最終將 Prometheus 指標(biāo)可視化到 Grafana 中。
分布式鏈路跟蹤(
Distributed Tracing
)的概念最早是由 Google 提出來的,發(fā)展至今技術(shù)已經(jīng)比較成熟,也是有一些協(xié)議標(biāo)準(zhǔn)可以參考。目前在
Tracing
技術(shù)這塊比較有影響力的是兩大開源技術(shù)框架:Netflix 公司開源的
OpenTracing
和 Google 開源的
OpenCensus
。兩大框架都擁有比較高的開發(fā)者群體。為形成統(tǒng)一的技術(shù)標(biāo)準(zhǔn),兩大框架最終磨合成立了
OpenTelemetry
項目,簡稱
otel
。otel 有鏈路追蹤和監(jiān)控告警兩大塊,關(guān)于監(jiān)控告警,可以查看另一篇文章:
Go 鏈路追蹤入門 Opentelemetry
Prometheus
源自 SoundCloud,擁有一整套開源系統(tǒng)監(jiān)控和警報工具包,是支持
OpenTelemetry
的系統(tǒng)之一,是
CNCF
的第二個項目。
Grafana 是一個開源的分析和可視化平臺,它允許你查詢、可視化和警報來自各種數(shù)據(jù)源的數(shù)據(jù)。它提供了一個用戶友好的界面,用于創(chuàng)建和共享儀表板、圖表和警報。Grafana 支持廣泛的數(shù)據(jù)源,其中就包括
Prometheus
這里為了簡單入門,盡量簡單的介紹一些抽象概念,結(jié)合著代碼理解,如果不能理解也沒關(guān)系,代碼寫著寫著自然就明白了:
Meter Provider
用于接口化管理全局的
Meter
創(chuàng)建,相當(dāng)于全局的監(jiān)控指標(biāo)管理工廠。
Meter
用于接口化創(chuàng)建并管理全局的
Instrument
,不同的
Meter
可以看做是不同的程序組件。
Instrument
用于管理不同組件下的各個不同類型的指標(biāo),例如
http.server.request.total
Measurements
對應(yīng)指標(biāo)上報的具體的
DataPoint
指標(biāo)數(shù)據(jù),是一系列的數(shù)值項。
Metric Reader
用于實現(xiàn)對指標(biāo)的數(shù)據(jù)流讀取,內(nèi)部定義了具體操作指標(biāo)的數(shù)據(jù)結(jié)構(gòu)。
OpenTelemetry
官方社區(qū)提供了多種靈活的
Reader
實現(xiàn),例如
PeridRader、ManualReader
等。
Metric Exporter
Exporter
用于暴露本地指標(biāo)到對應(yīng)的第三方廠商,例如:
Promtheus、Zipkin
等。
OpenTelemetry metrics
有許多不同指標(biāo)類型,可以把它想象成類似于
int, float
這種的變量類型:
Counter:
只增不減的指標(biāo),比如
http
請求總數(shù),字節(jié)大小;
Asynchronous Counter: 異步 Counter;
UpDownCounter:
可增可減的指標(biāo),比如
http
活動連接數(shù);
Asynchronous UpDownCounter: 異步 Counter;
Gauge:
可增可減的指標(biāo),瞬時計量的值,比如
CPU
使用,它是異步的;
Histogram :分組聚合指標(biāo),這個較為難以理解一些,可以移步 此處 查看,當(dāng)然,后文也會有一個詳細的例子來使用它。
廢話了一堆,終于可以實戰(zhàn)了。我們先以
http
請求總數(shù)為例來走一遍整個采集指標(biāo)流程。安裝擴展:
go get github.com/prometheus/client_golang
go get go.opentelemetry.io/otel/exporters/prometheus
go get go.opentelemetry.io/otel/metric
go get go.opentelemetry.io/otel/sdk/metric
打開
main.go
,編寫以下代碼:
package main
import (
"context"
"fmt"
"log"
"net/http"
"os"
"os/signal"
"github.com/prometheus/client_golang/prometheus/promhttp"
"go.opentelemetry.io/otel/exporters/prometheus"
api "go.opentelemetry.io/otel/metric"
"go.opentelemetry.io/otel/sdk/metric"
)
const meterName = "oldme_prometheus_testing"
var (
requestHelloCounter api.Int64Counter
)
func main() {
ctx := context.Background()
// 創(chuàng)建 prometheus 導(dǎo)出器
exporter, err := prometheus.New()
if err != nil {
log.Fatal(err)
}
// 創(chuàng)建 meter
provider := metric.NewMeterProvider(metric.WithReader(exporter))
meter := provider.Meter(meterName)
// 創(chuàng)建 counter 指標(biāo)類型
requestHelloCounter, err = meter.Int64Counter("requests_hello_total")
if err != nil {
log.Fatal(err)
}
go serveMetrics()
ctx, _ = signal.NotifyContext(ctx, os.Interrupt)
<-ctx.Done()
}
func serveMetrics() {
log.Printf("serving metrics at localhost:2223/metrics")
http.Handle("/metrics", promhttp.Handler())
http.Handle("/index", http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {
// 記錄 counter 指標(biāo)
requestHelloCounter.Add(r.Context(), 1)
_, _ = w.Write([]byte("Hello, Otel!"))
}))
err := http.ListenAndServe(":2223", nil) //nolint:gosec // Ignoring G114: Use of net/http serve function that has no support for setting timeouts.
if err != nil {
fmt.Printf("error serving http: %v", err)
return
}
}
在我們的代碼中,我們定義一個名字為
requests_hello_total
的
Int64Counter
指標(biāo)類型,
Int64Counter
代表這是一個只增不減的
int64
數(shù)值,用作記錄請求總數(shù)正好合適。運行我們的程序,如果不出錯的話,訪問
http://localhost:2223/index
可以看到
Hello, Otel!
。并且我們訪問
http://localhost:2223/metrics
可以看到指標(biāo)數(shù)據(jù):
這里數(shù)據(jù)還沒有進行可視化,我們先把流程走通,多訪問幾次
http://localhost:2223/index
可以看到
requests_hello_total
會增加:
接下來我們采集一下
Histogram
指標(biāo),統(tǒng)計在
0.1, 0.2, 0.5, 1, 2, 5
秒以內(nèi)的
http
請求數(shù),在
main.go
中加上相關(guān)代碼,可以直接復(fù)制過去:
package main
import (
"context"
"fmt"
"log"
"math/rand"
"net/http"
"os"
"os/signal"
"time"
"github.com/prometheus/client_golang/prometheus/promhttp"
"go.opentelemetry.io/otel/exporters/prometheus"
api "go.opentelemetry.io/otel/metric"
"go.opentelemetry.io/otel/sdk/metric"
)
const meterName = "oldme_prometheus_testing"
var (
requestHelloCounter api.Int64Counter
requestDurationHistogram api.Float64Histogram
)
func main() {
ctx := context.Background()
// 創(chuàng)建 prometheus 導(dǎo)出器
exporter, err := prometheus.New()
if err != nil {
log.Fatal(err)
}
// 創(chuàng)建 meter
provider := metric.NewMeterProvider(metric.WithReader(exporter))
meter := provider.Meter(meterName)
// 創(chuàng)建 counter 指標(biāo)類型
requestHelloCounter, err = meter.Int64Counter("requests_hello_total")
if err != nil {
log.Fatal(err)
}
// 創(chuàng)建 Histogram 指標(biāo)類型
requestDurationHistogram, err = meter.Float64Histogram(
"request_hello_duration_seconds",
api.WithDescription("記錄 Hello 請求的耗時統(tǒng)計"),
api.WithExplicitBucketBoundaries(0.1, 0.2, 0.5, 1, 2, 5),
)
if err != nil {
log.Fatal(err)
}
go serveMetrics()
go goroutineMock()
ctx, _ = signal.NotifyContext(ctx, os.Interrupt)
<-ctx.Done()
}
func serveMetrics() {
log.Printf("serving metrics at localhost:2223/metrics")
http.Handle("/metrics", promhttp.Handler())
http.Handle("/index", http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {
// 記錄 counter 指標(biāo)
requestHelloCounter.Add(r.Context(), 1)
// 計算請求處理時間
startTime := time.Now()
// 模擬請求處理時間
time.Sleep(time.Duration(rand.Intn(3)) * time.Second)
defer func() {
duration := time.Since(startTime).Seconds()
requestDurationHistogram.Record(r.Context(), duration)
}()
_, _ = w.Write([]byte("Hello, Otel!"))
}))
err := http.ListenAndServe(":2223", nil) //nolint:gosec // Ignoring G114: Use of net/http serve function that has no support for setting timeouts.
if err != nil {
fmt.Printf("error serving http: %v", err)
return
}
}
// 隨機模擬若干個協(xié)程
func goroutineMock() {
for {
go func() {
// 等待若干秒
var s = time.Duration(rand.Intn(10))
time.Sleep(s * time.Second)
}()
time.Sleep(1 * time.Millisecond)
}
}
走到這里,代碼層面結(jié)束了,已經(jīng)成功一半了,代碼開源在
Github
。之后我們就可以安裝
Prometheus
服務(wù)端和
Grafana
來進行數(shù)據(jù)可視化。
Prometheus
有多種安裝方式,我這里依舊采用
Docker
安裝,當(dāng)然,你也可以使用其他方式安裝,具體安裝方式可以參考其他文章,后續(xù)
Grafana
同理,不在贅述,在
Prometheus.yml
中填寫
targets
我們的地址:
scrape_configs:
- job_name: "prometheus"
static_configs:
- targets: ["localhost:2223"]
Prometheus
會自動去
{{target}}/metrics
中拉取我們的指標(biāo)。之后在瀏覽器打開
Promethues
的地址,例如我的是:http://localhost:9090,如果全部正常的話可以在
status:targets
中看見我們的指標(biāo):
在
Promethues
的首頁查詢
requests_hello_total
指標(biāo)可以看到可視化的圖表:
我的
Grafana
安裝好了,登錄進去后是這樣的(我更改后默認(rèn)顏色):
在
Data source
中添加
Prometheus
服務(wù)器,然后在
Dashboard
中添加我們想要監(jiān)控的指標(biāo),即可看到更美觀的圖表:
使用VSCode搭建UniApp + TS + Vue3 + Vite項目
閱讀在MDK開發(fā)環(huán)境下自定義安裝與切換不同編譯器版本的方法
閱讀一步一步將PlantUML類圖導(dǎo)出為自定義格式的XMI文件
閱讀musl libc 與 glibc 在 .NET 應(yīng)用程序中的兼容性
閱讀受 LabelImg 啟發(fā)的基于 web 的圖像標(biāo)注工具,基于 Vue 框架
閱讀光影精靈10 Win1+Ubuntu18.04 雙系統(tǒng) 踩坑記錄
閱讀LoRA模型:小型Stable Diffusion模型的微調(diào)技術(shù)
閱讀肉夾饃(Rougamo)編譯時AOP組件介紹及IoC/DI擴展
閱讀LOTO示波器統(tǒng)計曲線和故障分析pass/fail測試
閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]
湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2024 haote.com 好特網(wǎng)