drivers/perf: hisi: Schedule perf session according to locality
authorYicong Yang <yangyicong@hisilicon.com>
Tue, 15 Aug 2023 13:10:10 +0000 (21:10 +0800)
committerWill Deacon <will@kernel.org>
Wed, 16 Aug 2023 13:27:43 +0000 (14:27 +0100)
The PCIe PMUs locate on different NUMA node but currently we don't
consider it and likely stack all the sessions on the same CPU:

[root@localhost tmp]# cat /sys/devices/hisi_pcie*/cpumask
0
0
0
0
0
0

This can be optimize a bit to use a local CPU for the PMU.

Signed-off-by: Yicong Yang <yangyicong@hisilicon.com>
Link: https://lore.kernel.org/r/20230815131010.2147-1-yangyicong@huawei.com
Signed-off-by: Will Deacon <will@kernel.org>
drivers/perf/hisilicon/hisi_pcie_pmu.c

index e10fc7cb9493a96f4f340b6fa823198bbce8ceab..5a00adb2de8c9d0e9ae5723932cec21b6af48fd2 100644 (file)
@@ -665,8 +665,8 @@ static int hisi_pcie_pmu_online_cpu(unsigned int cpu, struct hlist_node *node)
        struct hisi_pcie_pmu *pcie_pmu = hlist_entry_safe(node, struct hisi_pcie_pmu, node);
 
        if (pcie_pmu->on_cpu == -1) {
-               pcie_pmu->on_cpu = cpu;
-               WARN_ON(irq_set_affinity(pcie_pmu->irq, cpumask_of(cpu)));
+               pcie_pmu->on_cpu = cpumask_local_spread(0, dev_to_node(&pcie_pmu->pdev->dev));
+               WARN_ON(irq_set_affinity(pcie_pmu->irq, cpumask_of(pcie_pmu->on_cpu)));
        }
 
        return 0;
@@ -676,14 +676,23 @@ static int hisi_pcie_pmu_offline_cpu(unsigned int cpu, struct hlist_node *node)
 {
        struct hisi_pcie_pmu *pcie_pmu = hlist_entry_safe(node, struct hisi_pcie_pmu, node);
        unsigned int target;
+       cpumask_t mask;
+       int numa_node;
 
        /* Nothing to do if this CPU doesn't own the PMU */
        if (pcie_pmu->on_cpu != cpu)
                return 0;
 
        pcie_pmu->on_cpu = -1;
-       /* Choose a new CPU from all online cpus. */
-       target = cpumask_any_but(cpu_online_mask, cpu);
+
+       /* Choose a local CPU from all online cpus. */
+       numa_node = dev_to_node(&pcie_pmu->pdev->dev);
+       if (cpumask_and(&mask, cpumask_of_node(numa_node), cpu_online_mask) &&
+           cpumask_andnot(&mask, &mask, cpumask_of(cpu)))
+               target = cpumask_any(&mask);
+       else
+               target = cpumask_any_but(cpu_online_mask, cpu);
+
        if (target >= nr_cpu_ids) {
                pci_err(pcie_pmu->pdev, "There is no CPU to set\n");
                return 0;