лет назад: 8 · a110078dab
--- a/examples/sched_ctx/parallel_tasks_reuse_handle.c
+++ b/examples/sched_ctx/parallel_tasks_reuse_handle.c
@@ -17,6 +17,7 @@
 
				 

			
 
				 #include <starpu.h>

			
 
				 #include <omp.h>

			
 
				+#include <pthread.h>

			
 
				 

			
 
				 #ifdef STARPU_QUICK_CHECK

			
 
				 #define NTASKS 64

			
@@ -28,6 +29,8 @@
 
				 #define LOOPS  10

			
 
				 #endif

			
 
				 

			
 
				+#define N_NESTED_CTXS 2

			
 
				+

			
 
				 struct context

			
 
				 {

			
 
				 	int ncpus;

			
@@ -38,6 +41,7 @@ struct context
 
				 /* Helper for the task that will initiate everything */

			
 
				 void parallel_task_prologue_init_once_and_for_all(void * sched_ctx_)

			
 
				 {

			
 
				+	fprintf(stderr, "%p: %s -->\n", (void*)pthread_self(), __func__);

			
 
				 	int sched_ctx = *(int *)sched_ctx_;

			
 
				 	int *cpuids = NULL;

			
 
				 	int ncpuids = 0;

			
@@ -50,6 +54,7 @@ void parallel_task_prologue_init_once_and_for_all(void * sched_ctx_)
 
				 

			
 
				 	omp_set_num_threads(ncpuids);

			
 
				 	free(cpuids);

			
 
				+	fprintf(stderr, "%p: %s <--\n", (void*)pthread_self(), __func__);

			
 
				 	return;

			
 
				 }

			
 
				 

			
@@ -101,25 +106,24 @@ void parallel_task_init()
 
				 						  0);

			
 
				 

			
 
				 	/* Initialize nested contexts */

			
 
				-	/* WARNING : the number of contexts must be a divisor of the number of available cpus*/

			
 
				-

			
 
				-	contexts = malloc(sizeof(struct context)*2);

			
 
				-	int cpus_per_context = main_context.ncpus/2;

			
 
				+	contexts = malloc(sizeof(struct context)*N_NESTED_CTXS);

			
 
				+	int cpus_per_context = main_context.ncpus/N_NESTED_CTXS;

			
 
				 	int i;

			
 
				-	for(i = 0; i < 2; i++)

			
 
				+	for(i = 0; i < N_NESTED_CTXS; i++)

			
 
				 	{

			
 
				-		fprintf(stderr, "ncpus %d for context %d \n",cpus_per_context, i);

			
 
				 		contexts[i].ncpus = cpus_per_context;

			
 
				+		if (i == N_NESTED_CTXS-1)

			
 
				+			contexts[i].ncpus += main_context.ncpus%N_NESTED_CTXS;

			
 
				 		contexts[i].cpus = main_context.cpus+i*cpus_per_context;

			
 
				 	}

			
 
				 

			
 
				-	for(i = 0; i < 2; i++)

			
 
				+	for(i = 0; i < N_NESTED_CTXS; i++)

			
 
				 		contexts[i].id = starpu_sched_ctx_create(contexts[i].cpus,

			
 
				 							 contexts[i].ncpus,"nested_ctx",

			
 
				 							 STARPU_SCHED_CTX_NESTED,main_context.id,

			
 
				 							 0);

			
 
				 

			
 
				-	for (i = 0; i < 2; i++)

			
 
				+	for (i = 0; i < N_NESTED_CTXS; i++)

			
 
				 	{

			
 
				 		parallel_task_init_one_context(&contexts[i].id);

			
 
				 	}

			
@@ -131,7 +135,7 @@ void parallel_task_init()
 
				 void parallel_task_deinit()

			
 
				 {

			
 
				 	int i;

			
 
				-	for (i=0; i<2;i++)

			
 
				+	for (i=0; i<N_NESTED_CTXS;i++)

			
 
				 		starpu_sched_ctx_delete(contexts[i].id);

			
 
				 	free(contexts);

			
 
				 	free(main_context.cpus);

			
@@ -174,7 +178,7 @@ int main(int argc, char **argv)
 
				 		return 77;

			
 
				 	STARPU_CHECK_RETURN_VALUE(ret, "starpu_init");

			
 
				 

			
 
				-	if (starpu_cpu_worker_get_count() < 2)

			
 
				+	if (starpu_cpu_worker_get_count() < N_NESTED_CTXS)

			
 
				 	{

			
 
				 		starpu_shutdown();

			
 
				 		return 77;