sched/irq: Add IRQ utilization tracking

author Vincent Guittot <vincent.guittot@linaro.org>

Thu, 28 Jun 2018 15:45:09 +0000 (17:45 +0200)

committer Ingo Molnar <mingo@kernel.org>

Sun, 15 Jul 2018 21:51:21 +0000 (23:51 +0200)
author Vincent Guittot <vincent.guittot@linaro.org>
Thu, 28 Jun 2018 15:45:09 +0000 (17:45 +0200)
committer Ingo Molnar <mingo@kernel.org>
Sun, 15 Jul 2018 21:51:21 +0000 (23:51 +0200)
diff --git a/kernel/sched/core.c b/kernel/sched/core.c

index fe365c9a08e98392d17a0f54ac1c7209db5f90b2..38107a95baca3533896c84dcd627859e2149e215 100644 (file)
--- a/kernel/sched/core.c
+++ b/kernel/sched/core.c
@@ -17,6 +17,8 @@
  #include "../workqueue_internal.h"
  #include "../smpboot.h"
  
+#include "pelt.h"
+
  #define CREATE_TRACE_POINTS
  #include <trace/events/sched.h>
  
@@ -185,7 +187,7 @@ static void update_rq_clock_task(struct rq *rq, s64 delta)
  
  #if defined(CONFIG_IRQ_TIME_ACCOUNTING) || defined(CONFIG_PARAVIRT_TIME_ACCOUNTING)
         if ((irq_delta + steal) && sched_feat(NONTASK_CAPACITY))
-               sched_rt_avg_update(rq, irq_delta + steal);
+               update_irq_load_avg(rq, irq_delta + steal);
  #endif
  }
  
diff --git a/kernel/sched/fair.c b/kernel/sched/fair.c

index f096275c7df2e9424217a495ff77ff63d508cf77..c2782b29c79f5298e15290bfd5431329208bb000 100644 (file)
--- a/kernel/sched/fair.c
+++ b/kernel/sched/fair.c
@@ -7290,7 +7290,7 @@ static inline bool cfs_rq_has_blocked(struct cfs_rq *cfs_rq)
         return false;
  }
  
-static inline bool others_rqs_have_blocked(struct rq *rq)
+static inline bool others_have_blocked(struct rq *rq)
  {
         if (READ_ONCE(rq->avg_rt.util_avg))
                 return true;
@@ -7298,6 +7298,11 @@ static inline bool others_rqs_have_blocked(struct rq *rq)
         if (READ_ONCE(rq->avg_dl.util_avg))
                 return true;
  
+#if defined(CONFIG_IRQ_TIME_ACCOUNTING) || defined(CONFIG_PARAVIRT_TIME_ACCOUNTING)
+       if (READ_ONCE(rq->avg_irq.util_avg))
+               return true;
+#endif
+
         return false;
  }
  
@@ -7362,8 +7367,9 @@ static void update_blocked_averages(int cpu)
         }
         update_rt_rq_load_avg(rq_clock_task(rq), rq, 0);
         update_dl_rq_load_avg(rq_clock_task(rq), rq, 0);
+       update_irq_load_avg(rq, 0);
         /* Don't need periodic decay once load/util_avg are null */
-       if (others_rqs_have_blocked(rq))
+       if (others_have_blocked(rq))
                 done = false;
  
  #ifdef CONFIG_NO_HZ_COMMON
@@ -7432,9 +7438,10 @@ static inline void update_blocked_averages(int cpu)
         update_cfs_rq_load_avg(cfs_rq_clock_task(cfs_rq), cfs_rq);
         update_rt_rq_load_avg(rq_clock_task(rq), rq, 0);
         update_dl_rq_load_avg(rq_clock_task(rq), rq, 0);
+       update_irq_load_avg(rq, 0);
  #ifdef CONFIG_NO_HZ_COMMON
         rq->last_blocked_load_update_tick = jiffies;
-       if (!cfs_rq_has_blocked(cfs_rq) && !others_rqs_have_blocked(rq))
+       if (!cfs_rq_has_blocked(cfs_rq) && !others_have_blocked(rq))
                 rq->has_blocked_load = 0;
  #endif
         rq_unlock_irqrestore(rq, &rf);
diff --git a/kernel/sched/pelt.c b/kernel/sched/pelt.c

index 8b78b6320cdafd2f506799e42525a2ccb99455ae..ead6d8b4a8b84fead75424af56597a67d03cceb5 100644 (file)
--- a/kernel/sched/pelt.c
+++ b/kernel/sched/pelt.c
@@ -357,3 +357,43 @@ int update_dl_rq_load_avg(u64 now, struct rq *rq, int running)
  
         return 0;
  }
+
+#if defined(CONFIG_IRQ_TIME_ACCOUNTING) || defined(CONFIG_PARAVIRT_TIME_ACCOUNTING)
+/*
+ * irq:
+ *
+ *   util_sum = \Sum se->avg.util_sum but se->avg.util_sum is not tracked
+ *   util_sum = cpu_scale * load_sum
+ *   runnable_load_sum = load_sum
+ *
+ */
+
+int update_irq_load_avg(struct rq *rq, u64 running)
+{
+       int ret = 0;
+       /*
+        * We know the time that has been used by interrupt since last update
+        * but we don't when. Let be pessimistic and assume that interrupt has
+        * happened just before the update. This is not so far from reality
+        * because interrupt will most probably wake up task and trig an update
+        * of rq clock during which the metric si updated.
+        * We start to decay with normal context time and then we add the
+        * interrupt context time.
+        * We can safely remove running from rq->clock because
+        * rq->clock += delta with delta >= running
+        */
+       ret = ___update_load_sum(rq->clock - running, rq->cpu, &rq->avg_irq,
+                               0,
+                               0,
+                               0);
+       ret += ___update_load_sum(rq->clock, rq->cpu, &rq->avg_irq,
+                               1,
+                               1,
+                               1);
+
+       if (ret)
+               ___update_load_avg(&rq->avg_irq, 1, 1);
+
+       return ret;
+}
+#endif
diff --git a/kernel/sched/pelt.h b/kernel/sched/pelt.h

index 0e4f912461ade1c3300bebb77f2ca322a1c278f9..d2894db28955bf682b5d7300be35404de284c8ae 100644 (file)
--- a/kernel/sched/pelt.h
+++ b/kernel/sched/pelt.h
@@ -6,6 +6,16 @@ int __update_load_avg_cfs_rq(u64 now, int cpu, struct cfs_rq *cfs_rq);
  int update_rt_rq_load_avg(u64 now, struct rq *rq, int running);
  int update_dl_rq_load_avg(u64 now, struct rq *rq, int running);
  
+#if defined(CONFIG_IRQ_TIME_ACCOUNTING) || defined(CONFIG_PARAVIRT_TIME_ACCOUNTING)
+int update_irq_load_avg(struct rq *rq, u64 running);
+#else
+static inline int
+update_irq_load_avg(struct rq *rq, u64 running)
+{
+       return 0;
+}
+#endif
+
  /*
   * When a task is dequeued, its estimated utilization should not be update if
   * its util_avg has not been updated at least once.
@@ -51,6 +61,12 @@ update_dl_rq_load_avg(u64 now, struct rq *rq, int running)
  {
         return 0;
  }
+
+static inline int
+update_irq_load_avg(struct rq *rq, u64 running)
+{
+       return 0;
+}
  #endif
  
  
diff --git a/kernel/sched/sched.h b/kernel/sched/sched.h

index 9028f268f8674cc58a1a6a52cc25c21ed08513f5..b26d0c9948ddd53b67200d9f024905491397cd83 100644 (file)
--- a/kernel/sched/sched.h
+++ b/kernel/sched/sched.h
@@ -857,6 +857,9 @@ struct rq {
         u64                     age_stamp;
         struct sched_avg        avg_rt;
         struct sched_avg        avg_dl;
+#if defined(CONFIG_IRQ_TIME_ACCOUNTING) || defined(CONFIG_PARAVIRT_TIME_ACCOUNTING)
+       struct sched_avg        avg_irq;
+#endif
         u64                     idle_stamp;
         u64                     avg_idle;
author	Vincent Guittot <vincent.guittot@linaro.org>
	Thu, 28 Jun 2018 15:45:09 +0000 (17:45 +0200)
committer	Ingo Molnar <mingo@kernel.org>
	Sun, 15 Jul 2018 21:51:21 +0000 (23:51 +0200)
kernel/sched/core.c		patch \| blob \| history
kernel/sched/fair.c		patch \| blob \| history
kernel/sched/pelt.c		patch \| blob \| history
kernel/sched/pelt.h		patch \| blob \| history
kernel/sched/sched.h		patch \| blob \| history