selftest/bpf/benchs: Add bpf_loop benchmark

author Joanne Koong <joannekoong@fb.com>

Tue, 30 Nov 2021 03:06:22 +0000 (19:06 -0800)

committer Alexei Starovoitov <ast@kernel.org>

Tue, 30 Nov 2021 18:56:28 +0000 (10:56 -0800)
author Joanne Koong <joannekoong@fb.com>
Tue, 30 Nov 2021 03:06:22 +0000 (19:06 -0800)
committer Alexei Starovoitov <ast@kernel.org>
Tue, 30 Nov 2021 18:56:28 +0000 (10:56 -0800)
diff --git a/tools/testing/selftests/bpf/Makefile b/tools/testing/selftests/bpf/Makefile

index 35684d61aaebcdaaad49b86c1cae8f4896632072..a6c0e92c86a192153219a51820bba61df98bb2e6 100644 (file)
--- a/tools/testing/selftests/bpf/Makefile
+++ b/tools/testing/selftests/bpf/Makefile
@@ -531,6 +531,7 @@ $(OUTPUT)/bench_trigger.o: $(OUTPUT)/trigger_bench.skel.h
  $(OUTPUT)/bench_ringbufs.o: $(OUTPUT)/ringbuf_bench.skel.h \
                             $(OUTPUT)/perfbuf_bench.skel.h
  $(OUTPUT)/bench_bloom_filter_map.o: $(OUTPUT)/bloom_filter_bench.skel.h
+$(OUTPUT)/bench_bpf_loop.o: $(OUTPUT)/bpf_loop_bench.skel.h
  $(OUTPUT)/bench.o: bench.h testing_helpers.h $(BPFOBJ)
  $(OUTPUT)/bench: LDLIBS += -lm
  $(OUTPUT)/bench: $(OUTPUT)/bench.o \
@@ -540,7 +541,8 @@ $(OUTPUT)/bench: $(OUTPUT)/bench.o \
                  $(OUTPUT)/bench_rename.o \
                  $(OUTPUT)/bench_trigger.o \
                  $(OUTPUT)/bench_ringbufs.o \
-                $(OUTPUT)/bench_bloom_filter_map.o
+                $(OUTPUT)/bench_bloom_filter_map.o \
+                $(OUTPUT)/bench_bpf_loop.o
         $(call msg,BINARY,,$@)
         $(Q)$(CC) $(LDFLAGS) $(filter %.a %.o,$^) $(LDLIBS) -o $@
  
diff --git a/tools/testing/selftests/bpf/bench.c b/tools/testing/selftests/bpf/bench.c

index c75e7ee287465a801a4467c819026ea94fce2550..3d6082b97a56f259432913b985d36f47c3824a8f 100644 (file)
--- a/tools/testing/selftests/bpf/bench.c
+++ b/tools/testing/selftests/bpf/bench.c
@@ -134,6 +134,39 @@ void hits_drops_report_final(struct bench_res res[], int res_cnt)
                total_ops_mean, total_ops_stddev);
  }
  
+void ops_report_progress(int iter, struct bench_res *res, long delta_ns)
+{
+       double hits_per_sec, hits_per_prod;
+
+       hits_per_sec = res->hits / 1000000.0 / (delta_ns / 1000000000.0);
+       hits_per_prod = hits_per_sec / env.producer_cnt;
+
+       printf("Iter %3d (%7.3lfus): ", iter, (delta_ns - 1000000000) / 1000.0);
+
+       printf("hits %8.3lfM/s (%7.3lfM/prod)\n", hits_per_sec, hits_per_prod);
+}
+
+void ops_report_final(struct bench_res res[], int res_cnt)
+{
+       double hits_mean = 0.0, hits_stddev = 0.0;
+       int i;
+
+       for (i = 0; i < res_cnt; i++)
+               hits_mean += res[i].hits / 1000000.0 / (0.0 + res_cnt);
+
+       if (res_cnt > 1)  {
+               for (i = 0; i < res_cnt; i++)
+                       hits_stddev += (hits_mean - res[i].hits / 1000000.0) *
+                                      (hits_mean - res[i].hits / 1000000.0) /
+                                      (res_cnt - 1.0);
+
+               hits_stddev = sqrt(hits_stddev);
+       }
+       printf("Summary: throughput %8.3lf \u00B1 %5.3lf M ops/s (%7.3lfM ops/prod), ",
+              hits_mean, hits_stddev, hits_mean / env.producer_cnt);
+       printf("latency %8.3lf ns/op\n", 1000.0 / hits_mean * env.producer_cnt);
+}
+
  const char *argp_program_version = "benchmark";
  const char *argp_program_bug_address = "<bpf@vger.kernel.org>";
  const char argp_program_doc[] =
@@ -171,10 +204,12 @@ static const struct argp_option opts[] = {
  
  extern struct argp bench_ringbufs_argp;
  extern struct argp bench_bloom_map_argp;
+extern struct argp bench_bpf_loop_argp;
  
  static const struct argp_child bench_parsers[] = {
         { &bench_ringbufs_argp, 0, "Ring buffers benchmark", 0 },
         { &bench_bloom_map_argp, 0, "Bloom filter map benchmark", 0 },
+       { &bench_bpf_loop_argp, 0, "bpf_loop helper benchmark", 0 },
         {},
  };
  
@@ -373,6 +408,7 @@ extern const struct bench bench_bloom_update;
  extern const struct bench bench_bloom_false_positive;
  extern const struct bench bench_hashmap_without_bloom;
  extern const struct bench bench_hashmap_with_bloom;
+extern const struct bench bench_bpf_loop;
  
  static const struct bench *benchs[] = {
         &bench_count_global,
@@ -404,6 +440,7 @@ static const struct bench *benchs[] = {
         &bench_bloom_false_positive,
         &bench_hashmap_without_bloom,
         &bench_hashmap_with_bloom,
+       &bench_bpf_loop,
  };
  
  static void setup_benchmark()
diff --git a/tools/testing/selftests/bpf/bench.h b/tools/testing/selftests/bpf/bench.h

index 624c6b11501f9a3a5f53e1c5b86015a2544724a5..50785503756b6c875350024adaafce6a6b05ed5a 100644 (file)
--- a/tools/testing/selftests/bpf/bench.h
+++ b/tools/testing/selftests/bpf/bench.h
@@ -59,6 +59,8 @@ void hits_drops_report_progress(int iter, struct bench_res *res, long delta_ns);
  void hits_drops_report_final(struct bench_res res[], int res_cnt);
  void false_hits_report_progress(int iter, struct bench_res *res, long delta_ns);
  void false_hits_report_final(struct bench_res res[], int res_cnt);
+void ops_report_progress(int iter, struct bench_res *res, long delta_ns);
+void ops_report_final(struct bench_res res[], int res_cnt);
  
  static inline __u64 get_time_ns() {
         struct timespec t;
diff --git a/tools/testing/selftests/bpf/benchs/bench_bpf_loop.c b/tools/testing/selftests/bpf/benchs/bench_bpf_loop.c

new file mode 100644 (file)

index 0000000..d0a6572
--- /dev/null
+++ b/tools/testing/selftests/bpf/benchs/bench_bpf_loop.c
@@ -0,0 +1,105 @@
+// SPDX-License-Identifier: GPL-2.0
+/* Copyright (c) 2021 Facebook */
+
+#include <argp.h>
+#include "bench.h"
+#include "bpf_loop_bench.skel.h"
+
+/* BPF triggering benchmarks */
+static struct ctx {
+       struct bpf_loop_bench *skel;
+} ctx;
+
+static struct {
+       __u32 nr_loops;
+} args = {
+       .nr_loops = 10,
+};
+
+enum {
+       ARG_NR_LOOPS = 4000,
+};
+
+static const struct argp_option opts[] = {
+       { "nr_loops", ARG_NR_LOOPS, "nr_loops", 0,
+               "Set number of loops for the bpf_loop helper"},
+       {},
+};
+
+static error_t parse_arg(int key, char *arg, struct argp_state *state)
+{
+       switch (key) {
+       case ARG_NR_LOOPS:
+               args.nr_loops = strtol(arg, NULL, 10);
+               break;
+       default:
+               return ARGP_ERR_UNKNOWN;
+       }
+
+       return 0;
+}
+
+/* exported into benchmark runner */
+const struct argp bench_bpf_loop_argp = {
+       .options = opts,
+       .parser = parse_arg,
+};
+
+static void validate(void)
+{
+       if (env.consumer_cnt != 1) {
+               fprintf(stderr, "benchmark doesn't support multi-consumer!\n");
+               exit(1);
+       }
+}
+
+static void *producer(void *input)
+{
+       while (true)
+               /* trigger the bpf program */
+               syscall(__NR_getpgid);
+
+       return NULL;
+}
+
+static void *consumer(void *input)
+{
+       return NULL;
+}
+
+static void measure(struct bench_res *res)
+{
+       res->hits = atomic_swap(&ctx.skel->bss->hits, 0);
+}
+
+static void setup(void)
+{
+       struct bpf_link *link;
+
+       setup_libbpf();
+
+       ctx.skel = bpf_loop_bench__open_and_load();
+       if (!ctx.skel) {
+               fprintf(stderr, "failed to open skeleton\n");
+               exit(1);
+       }
+
+       link = bpf_program__attach(ctx.skel->progs.benchmark);
+       if (!link) {
+               fprintf(stderr, "failed to attach program!\n");
+               exit(1);
+       }
+
+       ctx.skel->bss->nr_loops = args.nr_loops;
+}
+
+const struct bench bench_bpf_loop = {
+       .name = "bpf-loop",
+       .validate = validate,
+       .setup = setup,
+       .producer_thread = producer,
+       .consumer_thread = consumer,
+       .measure = measure,
+       .report_progress = ops_report_progress,
+       .report_final = ops_report_final,
+};
diff --git a/tools/testing/selftests/bpf/benchs/run_bench_bpf_loop.sh b/tools/testing/selftests/bpf/benchs/run_bench_bpf_loop.sh

new file mode 100755 (executable)

index 0000000..d4f5f73
--- /dev/null
+++ b/tools/testing/selftests/bpf/benchs/run_bench_bpf_loop.sh
@@ -0,0 +1,15 @@
+#!/bin/bash
+# SPDX-License-Identifier: GPL-2.0
+
+source ./benchs/run_common.sh
+
+set -eufo pipefail
+
+for t in 1 4 8 12 16; do
+for i in 10 100 500 1000 5000 10000 50000 100000 500000 1000000; do
+subtitle "nr_loops: $i, nr_threads: $t"
+       summarize_ops "bpf_loop: " \
+           "$($RUN_BENCH -p $t --nr_loops $i bpf-loop)"
+       printf "\n"
+done
+done
diff --git a/tools/testing/selftests/bpf/benchs/run_common.sh b/tools/testing/selftests/bpf/benchs/run_common.sh

index 9a16be78b18099600e204193c20dec641f0c26f2..6c5e6023a69f8dd7e74fc086b37d61d3d0b96b6a 100644 (file)
--- a/tools/testing/selftests/bpf/benchs/run_common.sh
+++ b/tools/testing/selftests/bpf/benchs/run_common.sh
@@ -33,6 +33,14 @@ function percentage()
         echo "$*" | sed -E "s/.*Percentage\s=\s+([0-9]+\.[0-9]+).*/\1/"
  }
  
+function ops()
+{
+       echo -n "throughput: "
+       echo -n "$*" | sed -E "s/.*throughput\s+([0-9]+\.[0-9]+ ± [0-9]+\.[0-9]+\sM\sops\/s).*/\1/"
+       echo -n -e ", latency: "
+       echo "$*" | sed -E "s/.*latency\s+([0-9]+\.[0-9]+\sns\/op).*/\1/"
+}
+
  function total()
  {
         echo "$*" | sed -E "s/.*total operations\s+([0-9]+\.[0-9]+ ± [0-9]+\.[0-9]+M\/s).*/\1/"
@@ -52,6 +60,13 @@ function summarize_percentage()
         printf "%-20s %s%%\n" "$bench" "$(percentage $summary)"
  }
  
+function summarize_ops()
+{
+       bench="$1"
+       summary=$(echo $2 | tail -n1)
+       printf "%-20s %s\n" "$bench" "$(ops $summary)"
+}
+
  function summarize_total()
  {
         bench="$1"
diff --git a/tools/testing/selftests/bpf/progs/bpf_loop_bench.c b/tools/testing/selftests/bpf/progs/bpf_loop_bench.c

new file mode 100644 (file)

index 0000000..9dafdc2
--- /dev/null
+++ b/tools/testing/selftests/bpf/progs/bpf_loop_bench.c
@@ -0,0 +1,26 @@
+// SPDX-License-Identifier: GPL-2.0
+/* Copyright (c) 2021 Facebook */
+
+#include "vmlinux.h"
+#include <bpf/bpf_helpers.h>
+
+char _license[] SEC("license") = "GPL";
+
+u32 nr_loops;
+long hits;
+
+static int empty_callback(__u32 index, void *data)
+{
+       return 0;
+}
+
+SEC("fentry/__x64_sys_getpgid")
+int benchmark(void *ctx)
+{
+       for (int i = 0; i < 1000; i++) {
+               bpf_loop(nr_loops, empty_callback, NULL, 0);
+
+               __sync_add_and_fetch(&hits, nr_loops);
+       }
+       return 0;
+}
author	Joanne Koong <joannekoong@fb.com>
	Tue, 30 Nov 2021 03:06:22 +0000 (19:06 -0800)
committer	Alexei Starovoitov <ast@kernel.org>
	Tue, 30 Nov 2021 18:56:28 +0000 (10:56 -0800)
tools/testing/selftests/bpf/Makefile		patch \| blob \| history
tools/testing/selftests/bpf/bench.c		patch \| blob \| history
tools/testing/selftests/bpf/bench.h		patch \| blob \| history
tools/testing/selftests/bpf/benchs/bench_bpf_loop.c	[new file with mode: 0644]	patch \| blob
tools/testing/selftests/bpf/benchs/run_bench_bpf_loop.sh	[new file with mode: 0755]	patch \| blob
tools/testing/selftests/bpf/benchs/run_common.sh		patch \| blob \| history
tools/testing/selftests/bpf/progs/bpf_loop_bench.c	[new file with mode: 0644]	patch \| blob