sched/fair: Initiate a new task's util avg to a bounded value

author Yuyang Du <yuyang.du@intel.com>

Tue, 29 Mar 2016 20:30:56 +0000 (04:30 +0800)

committer Ingo Molnar <mingo@kernel.org>

Thu, 31 Mar 2016 08:49:46 +0000 (10:49 +0200)
author Yuyang Du <yuyang.du@intel.com>
Tue, 29 Mar 2016 20:30:56 +0000 (04:30 +0800)
committer Ingo Molnar <mingo@kernel.org>
Thu, 31 Mar 2016 08:49:46 +0000 (10:49 +0200)
diff --git a/kernel/sched/core.c b/kernel/sched/core.c

index b5cf01d2368e361f1cd78244e4a22f993881b258..11594230ef4de23bc6bf2d4a7da0eab0b6f4ae1a 100644 (file)
--- a/kernel/sched/core.c
+++ b/kernel/sched/core.c
@@ -2431,6 +2431,8 @@ void wake_up_new_task(struct task_struct *p)
          */
         set_task_cpu(p, select_task_rq(p, task_cpu(p), SD_BALANCE_FORK, 0));
  #endif
+       /* Post initialize new task's util average when its cfs_rq is set */
+       post_init_entity_util_avg(&p->se);
  
         rq = __task_rq_lock(p);
         activate_task(rq, p, 0);
diff --git a/kernel/sched/fair.c b/kernel/sched/fair.c

index 4bb5ace60dc8411bfd3222d2584bce54e136ac40..b8cc1c35cd7c188e3d7cd1c3bb990fa286ff53e0 100644 (file)
--- a/kernel/sched/fair.c
+++ b/kernel/sched/fair.c
@@ -682,17 +682,68 @@ void init_entity_runnable_average(struct sched_entity *se)
         sa->period_contrib = 1023;
         sa->load_avg = scale_load_down(se->load.weight);
         sa->load_sum = sa->load_avg * LOAD_AVG_MAX;
-       sa->util_avg = scale_load_down(SCHED_LOAD_SCALE);
-       sa->util_sum = sa->util_avg * LOAD_AVG_MAX;
+       /*
+        * At this point, util_avg won't be used in select_task_rq_fair anyway
+        */
+       sa->util_avg = 0;
+       sa->util_sum = 0;
         /* when this task enqueue'ed, it will contribute to its cfs_rq's load_avg */
  }
  
+/*
+ * With new tasks being created, their initial util_avgs are extrapolated
+ * based on the cfs_rq's current util_avg:
+ *
+ *   util_avg = cfs_rq->util_avg / (cfs_rq->load_avg + 1) * se.load.weight
+ *
+ * However, in many cases, the above util_avg does not give a desired
+ * value. Moreover, the sum of the util_avgs may be divergent, such
+ * as when the series is a harmonic series.
+ *
+ * To solve this problem, we also cap the util_avg of successive tasks to
+ * only 1/2 of the left utilization budget:
+ *
+ *   util_avg_cap = (1024 - cfs_rq->avg.util_avg) / 2^n
+ *
+ * where n denotes the nth task.
+ *
+ * For example, a simplest series from the beginning would be like:
+ *
+ *  task  util_avg: 512, 256, 128,  64,  32,   16,    8, ...
+ * cfs_rq util_avg: 512, 768, 896, 960, 992, 1008, 1016, ...
+ *
+ * Finally, that extrapolated util_avg is clamped to the cap (util_avg_cap)
+ * if util_avg > util_avg_cap.
+ */
+void post_init_entity_util_avg(struct sched_entity *se)
+{
+       struct cfs_rq *cfs_rq = cfs_rq_of(se);
+       struct sched_avg *sa = &se->avg;
+       long cap = (long)(scale_load_down(SCHED_LOAD_SCALE) - cfs_rq->avg.util_avg) / 2;
+
+       if (cap > 0) {
+               if (cfs_rq->avg.util_avg != 0) {
+                       sa->util_avg  = cfs_rq->avg.util_avg * se->load.weight;
+                       sa->util_avg /= (cfs_rq->avg.load_avg + 1);
+
+                       if (sa->util_avg > cap)
+                               sa->util_avg = cap;
+               } else {
+                       sa->util_avg = cap;
+               }
+               sa->util_sum = sa->util_avg * LOAD_AVG_MAX;
+       }
+}
+
  static inline unsigned long cfs_rq_runnable_load_avg(struct cfs_rq *cfs_rq);
  static inline unsigned long cfs_rq_load_avg(struct cfs_rq *cfs_rq);
  #else
  void init_entity_runnable_average(struct sched_entity *se)
  {
  }
+void post_init_entity_util_avg(struct sched_entity *se)
+{
+}
  #endif
  
  /*
@@ -8384,6 +8435,7 @@ int alloc_fair_sched_group(struct task_group *tg, struct task_group *parent)
                 init_cfs_rq(cfs_rq);
                 init_tg_cfs_entry(tg, cfs_rq, se, i, parent->se[i]);
                 init_entity_runnable_average(se);
+               post_init_entity_util_avg(se);
         }
  
         return 1;
diff --git a/kernel/sched/sched.h b/kernel/sched/sched.h

index ec2e8d23527e6c92a4fe1b5ef45dfb9ac1e242a8..a7cbad7b3ad28be6877549b9fcfb02a3d8e8f242 100644 (file)
--- a/kernel/sched/sched.h
+++ b/kernel/sched/sched.h
@@ -1313,6 +1313,7 @@ extern void init_dl_task_timer(struct sched_dl_entity *dl_se);
  unsigned long to_ratio(u64 period, u64 runtime);
  
  extern void init_entity_runnable_average(struct sched_entity *se);
+extern void post_init_entity_util_avg(struct sched_entity *se);
  
  #ifdef CONFIG_NO_HZ_FULL
  extern bool sched_can_stop_tick(struct rq *rq);
author	Yuyang Du <yuyang.du@intel.com>
	Tue, 29 Mar 2016 20:30:56 +0000 (04:30 +0800)
committer	Ingo Molnar <mingo@kernel.org>
	Thu, 31 Mar 2016 08:49:46 +0000 (10:49 +0200)
kernel/sched/core.c		patch \| blob \| history
kernel/sched/fair.c		patch \| blob \| history
kernel/sched/sched.h		patch \| blob \| history