~hc/RK356X_SDK_RELEASE.git

..	..	@@ -14,74 +14,28 @@
14	14	#include "rga_iommu.h"
15	15	#include "rga_debugger.h"
16	16
17		-struct rga_job *
18		-rga_scheduler_get_pending_job_list(struct rga_scheduler_t *scheduler)
19		-{
20		- unsigned long flags;
21		- struct rga_job *job;
22		-
23		- spin_lock_irqsave(&scheduler->irq_lock, flags);
24		-
25		- job = list_first_entry_or_null(&scheduler->todo_list,
26		- struct rga_job, head);
27		-
28		- spin_unlock_irqrestore(&scheduler->irq_lock, flags);
29		-
30		- return job;
31		-}
32		-
33		-struct rga_job *
34		-rga_scheduler_get_running_job(struct rga_scheduler_t *scheduler)
35		-{
36		- unsigned long flags;
37		- struct rga_job *job;
38		-
39		- spin_lock_irqsave(&scheduler->irq_lock, flags);
40		-
41		- job = scheduler->running_job;
42		-
43		- spin_unlock_irqrestore(&scheduler->irq_lock, flags);
44		-
45		- return job;
46		-}
47		-
48		-struct rga_scheduler_t rga_job_get_scheduler(struct rga_job job)
49		-{
50		- return job->scheduler;
51		-}
52		-
53	17	static void rga_job_free(struct rga_job *job)
54	18	{
55	19	free_page((unsigned long)job);
56	20	}
57	21
58		-void rga_job_session_destroy(struct rga_session *session)
	22	+static void rga_job_kref_release(struct kref *ref)
59	23	{
60		- struct rga_scheduler_t *scheduler = NULL;
61		- struct rga_job job_pos, job_q;
62		- int i;
	24	+ struct rga_job *job;
63	25
64		- unsigned long flags;
	26	+ job = container_of(ref, struct rga_job, refcount);
65	27
66		- for (i = 0; i < rga_drvdata->num_of_scheduler; i++) {
67		- scheduler = rga_drvdata->scheduler[i];
	28	+ rga_job_free(job);
	29	+}
68	30
69		- spin_lock_irqsave(&scheduler->irq_lock, flags);
	31	+static int rga_job_put(struct rga_job *job)
	32	+{
	33	+ return kref_put(&job->refcount, rga_job_kref_release);
	34	+}
70	35
71		- list_for_each_entry_safe(job_pos, job_q, &scheduler->todo_list, head) {
72		- if (session == job_pos->session) {
73		- list_del(&job_pos->head);
74		-
75		- spin_unlock_irqrestore(&scheduler->irq_lock, flags);
76		-
77		- rga_job_free(job_pos);
78		-
79		- spin_lock_irqsave(&scheduler->irq_lock, flags);
80		- }
81		- }
82		-
83		- spin_unlock_irqrestore(&scheduler->irq_lock, flags);
84		- }
	36	+static void rga_job_get(struct rga_job *job)
	37	+{
	38	+ kref_get(&job->refcount);
85	39	}
86	40
87	41	static int rga_job_cleanup(struct rga_job *job)
..	..	@@ -90,7 +44,7 @@
90	44	pr_err("(pid:%d) job clean use time = %lld\n", job->pid,
91	45	ktime_us_delta(ktime_get(), job->timestamp));
92	46
93		- rga_job_free(job);
	47	+ rga_job_put(job);
94	48
95	49	return 0;
96	50	}
..	..	@@ -165,6 +119,7 @@
165	119	return NULL;
166	120
167	121	INIT_LIST_HEAD(&job->head);
	122	+ kref_init(&job->refcount);
168	123
169	124	job->timestamp = ktime_get();
170	125	job->pid = current->pid;
..	..	@@ -232,16 +187,18 @@
232	187	return ret;
233	188	}
234	189
	190	+ set_bit(RGA_JOB_STATE_RUNNING, &job->state);
	191	+
235	192	/* for debug */
236	193	if (DEBUGGER_EN(MSG))
237	194	rga_job_dump_info(job);
238	195
239	196	return ret;
240		-
241	197	}
242	198
243		-static void rga_job_next(struct rga_scheduler_t *scheduler)
	199	+void rga_job_next(struct rga_scheduler_t *scheduler)
244	200	{
	201	+ int ret;
245	202	struct rga_job *job = NULL;
246	203	unsigned long flags;
247	204
..	..	@@ -261,51 +218,33 @@
261	218	scheduler->job_count--;
262	219
263	220	scheduler->running_job = job;
	221	+ set_bit(RGA_JOB_STATE_PREPARE, &job->state);
	222	+ rga_job_get(job);
264	223
265	224	spin_unlock_irqrestore(&scheduler->irq_lock, flags);
266	225
267		- job->ret = rga_job_run(job, scheduler);
	226	+ ret = rga_job_run(job, scheduler);
268	227	/* If some error before hw run */
269		- if (job->ret < 0) {
270		- pr_err("some error on rga_job_run before hw start, %s(%d)\n",
271		- __func__, __LINE__);
	228	+ if (ret < 0) {
	229	+ pr_err("some error on rga_job_run before hw start, %s(%d)\n", __func__, __LINE__);
272	230
273	231	spin_lock_irqsave(&scheduler->irq_lock, flags);
274	232
275	233	scheduler->running_job = NULL;
	234	+ rga_job_put(job);
276	235
277	236	spin_unlock_irqrestore(&scheduler->irq_lock, flags);
278	237
	238	+ job->ret = ret;
279	239	rga_request_release_signal(scheduler, job);
280	240
281	241	goto next_job;
282	242	}
	243	+
	244	+ rga_job_put(job);
283	245	}
284	246
285		-static void rga_job_finish_and_next(struct rga_scheduler_t *scheduler,
286		- struct rga_job *job, int ret)
287		-{
288		- ktime_t now;
289		-
290		- job->ret = ret;
291		-
292		- if (DEBUGGER_EN(TIME)) {
293		- now = ktime_get();
294		- pr_info("hw use time = %lld\n", ktime_us_delta(now, job->hw_running_time));
295		- pr_info("(pid:%d) job done use time = %lld\n", job->pid,
296		- ktime_us_delta(now, job->timestamp));
297		- }
298		-
299		- rga_mm_unmap_job_info(job);
300		-
301		- rga_request_release_signal(scheduler, job);
302		-
303		- rga_job_next(scheduler);
304		-
305		- rga_power_disable(scheduler);
306		-}
307		-
308		-void rga_job_done(struct rga_scheduler_t *scheduler, int ret)
	247	+struct rga_job rga_job_done(struct rga_scheduler_t scheduler)
309	248	{
310	249	struct rga_job *job;
311	250	unsigned long flags;
..	..	@@ -314,16 +253,34 @@
314	253	spin_lock_irqsave(&scheduler->irq_lock, flags);
315	254
316	255	job = scheduler->running_job;
	256	+ if (job == NULL) {
	257	+ pr_err("core[0x%x] running job has been cleanup.\n", scheduler->core);
	258	+
	259	+ spin_unlock_irqrestore(&scheduler->irq_lock, flags);
	260	+ return NULL;
	261	+ }
317	262	scheduler->running_job = NULL;
318	263
319	264	scheduler->timer.busy_time += ktime_us_delta(now, job->hw_recoder_time);
	265	+ set_bit(RGA_JOB_STATE_DONE, &job->state);
320	266
321	267	spin_unlock_irqrestore(&scheduler->irq_lock, flags);
	268	+
	269	+ if (scheduler->ops->read_back_reg)
	270	+ scheduler->ops->read_back_reg(job, scheduler);
322	271
323	272	if (DEBUGGER_EN(DUMP_IMAGE))
324	273	rga_dump_job_image(job);
325	274
326		- rga_job_finish_and_next(scheduler, job, ret);
	275	+ if (DEBUGGER_EN(TIME)) {
	276	+ pr_info("hw use time = %lld\n", ktime_us_delta(now, job->hw_running_time));
	277	+ pr_info("(pid:%d) job done use time = %lld\n", job->pid,
	278	+ ktime_us_delta(now, job->timestamp));
	279	+ }
	280	+
	281	+ rga_mm_unmap_job_info(job);
	282	+
	283	+ return job;
327	284	}
328	285
329	286	static void rga_job_scheduler_timeout_clean(struct rga_scheduler_t *scheduler)
..	..	@@ -391,13 +348,20 @@
391	348	}
392	349
393	350	scheduler->job_count++;
	351	+ set_bit(RGA_JOB_STATE_PENDING, &job->state);
394	352
395	353	spin_unlock_irqrestore(&scheduler->irq_lock, flags);
396	354	}
397	355
398	356	static struct rga_scheduler_t rga_job_schedule(struct rga_job job)
399	357	{
	358	+ int i;
400	359	struct rga_scheduler_t *scheduler = NULL;
	360	+
	361	+ for (i = 0; i < rga_drvdata->num_of_scheduler; i++) {
	362	+ scheduler = rga_drvdata->scheduler[i];
	363	+ rga_job_scheduler_timeout_clean(scheduler);
	364	+ }
401	365
402	366	if (rga_drvdata->num_of_scheduler > 1) {
403	367	job->core = rga_job_assign(job);
..	..	@@ -411,14 +375,12 @@
411	375	job->scheduler = rga_drvdata->scheduler[0];
412	376	}
413	377
414		- scheduler = rga_job_get_scheduler(job);
	378	+ scheduler = job->scheduler;
415	379	if (scheduler == NULL) {
416	380	pr_err("failed to get scheduler, %s(%d)\n", __func__, __LINE__);
417	381	job->ret = -EFAULT;
418	382	return NULL;
419	383	}
420		-
421		- rga_job_scheduler_timeout_clean(scheduler);
422	384
423	385	return scheduler;
424	386	}
..	..	@@ -557,26 +519,13 @@
557	519	request->current_mm = NULL;
558	520	}
559	521
560		-static int rga_request_alloc_release_fence(struct dma_fence **release_fence)
561		-{
562		- struct dma_fence *fence;
563		-
564		- fence = rga_dma_fence_alloc();
565		- if (IS_ERR(fence)) {
566		- pr_err("Can not alloc release fence!\n");
567		- return IS_ERR(fence);
568		- }
569		-
570		- *release_fence = fence;
571		-
572		- return rga_dma_fence_get_fd(fence);
573		-}
574		-
575		-static int rga_request_add_acquire_fence_callback(int acquire_fence_fd, void *private,
	522	+static int rga_request_add_acquire_fence_callback(int acquire_fence_fd,
	523	+ struct rga_request *request,
576	524	dma_fence_func_t cb_func)
577	525	{
578	526	int ret;
579	527	struct dma_fence *acquire_fence = NULL;
	528	+ struct rga_pending_request_manager *request_manager = rga_drvdata->pend_request_manager;
580	529
581	530	if (DEBUGGER_EN(MSG))
582	531	pr_info("acquire_fence_fd = %d", acquire_fence_fd);
..	..	@@ -591,16 +540,31 @@
591	540	ksys_close(acquire_fence_fd);
592	541
593	542	ret = rga_dma_fence_get_status(acquire_fence);
594		- if (ret == 0) {
595		- ret = rga_dma_fence_add_callback(acquire_fence, cb_func, private);
596		- if (ret < 0) {
597		- if (ret == -ENOENT)
598		- return 1;
	543	+ if (ret < 0) {
	544	+ pr_err("%s: Current acquire fence unexpectedly has error status before signal\n",
	545	+ __func__);
	546	+ return ret;
	547	+ } else if (ret > 0) {
	548	+ /* has been signaled */
	549	+ return ret;
	550	+ }
599	551
	552	+ /*
	553	+ * Ensure that the request will not be free early when
	554	+ * the callback is called.
	555	+ */
	556	+ mutex_lock(&request_manager->lock);
	557	+ rga_request_get(request);
	558	+ mutex_unlock(&request_manager->lock);
	559	+
	560	+ ret = rga_dma_fence_add_callback(acquire_fence, cb_func, (void *)request);
	561	+ if (ret < 0) {
	562	+ if (ret != -ENOENT)
600	563	pr_err("%s: failed to add fence callback\n", __func__);
601		- return ret;
602		- }
603		- } else {
	564	+
	565	+ mutex_lock(&request_manager->lock);
	566	+ rga_request_put(request);
	567	+ mutex_unlock(&request_manager->lock);
604	568	return ret;
605	569	}
606	570
..	..	@@ -742,6 +706,70 @@
742	706	mutex_unlock(&request_manager->lock);
743	707	}
744	708
	709	+void rga_request_session_destroy_abort(struct rga_session *session)
	710	+{
	711	+ int request_id;
	712	+ struct rga_request *request;
	713	+ struct rga_pending_request_manager *request_manager;
	714	+
	715	+ request_manager = rga_drvdata->pend_request_manager;
	716	+ if (request_manager == NULL) {
	717	+ pr_err("rga_pending_request_manager is null!\n");
	718	+ return;
	719	+ }
	720	+
	721	+ mutex_lock(&request_manager->lock);
	722	+
	723	+ idr_for_each_entry(&request_manager->request_idr, request, request_id) {
	724	+ if (session == request->session) {
	725	+ pr_err("[tgid:%d pid:%d] destroy request[%d] when the user exits",
	726	+ session->tgid, current->pid, request->id);
	727	+ rga_request_put(request);
	728	+ }
	729	+ }
	730	+
	731	+ mutex_unlock(&request_manager->lock);
	732	+}
	733	+
	734	+static int rga_request_timeout_query_state(struct rga_request *request)
	735	+{
	736	+ int i;
	737	+ unsigned long flags;
	738	+ struct rga_scheduler_t *scheduler = NULL;
	739	+ struct rga_job *job = NULL;
	740	+
	741	+ for (i = 0; i < rga_drvdata->num_of_scheduler; i++) {
	742	+ scheduler = rga_drvdata->scheduler[i];
	743	+
	744	+ spin_lock_irqsave(&scheduler->irq_lock, flags);
	745	+
	746	+ if (scheduler->running_job) {
	747	+ job = scheduler->running_job;
	748	+ if (request->id == job->request_id) {
	749	+ if (test_bit(RGA_JOB_STATE_DONE, &job->state) &&
	750	+ test_bit(RGA_JOB_STATE_FINISH, &job->state)) {
	751	+ spin_unlock_irqrestore(&scheduler->irq_lock, flags);
	752	+ return request->ret;
	753	+ } else if (!test_bit(RGA_JOB_STATE_DONE, &job->state) &&
	754	+ test_bit(RGA_JOB_STATE_FINISH, &job->state)) {
	755	+ spin_unlock_irqrestore(&scheduler->irq_lock, flags);
	756	+ pr_err("hardware has finished, but the software has timeout!\n");
	757	+ return -EBUSY;
	758	+ } else if (!test_bit(RGA_JOB_STATE_DONE, &job->state) &&
	759	+ !test_bit(RGA_JOB_STATE_FINISH, &job->state)) {
	760	+ spin_unlock_irqrestore(&scheduler->irq_lock, flags);
	761	+ pr_err("hardware has timeout.\n");
	762	+ return -EBUSY;
	763	+ }
	764	+ }
	765	+ }
	766	+
	767	+ spin_unlock_irqrestore(&scheduler->irq_lock, flags);
	768	+ }
	769	+
	770	+ return request->ret;
	771	+}
	772	+
745	773	static int rga_request_wait(struct rga_request *request)
746	774	{
747	775	int left_time;
..	..	@@ -752,8 +780,7 @@
752	780
753	781	switch (left_time) {
754	782	case 0:
755		- pr_err("%s timeout", __func__);
756		- ret = -EBUSY;
	783	+ ret = rga_request_timeout_query_state(request);
757	784	goto err_request_abort;
758	785	case -ERESTARTSYS:
759	786	ret = -ERESTARTSYS;
..	..	@@ -800,9 +827,15 @@
800	827	struct dma_fence_cb *_waiter)
801	828	{
802	829	struct rga_fence_waiter waiter = (struct rga_fence_waiter )_waiter;
	830	+ struct rga_request request = (struct rga_request )waiter->private;
	831	+ struct rga_pending_request_manager *request_manager = rga_drvdata->pend_request_manager;
803	832
804		- if (rga_request_commit((struct rga_request *)waiter->private))
	833	+ if (rga_request_commit(request))
805	834	pr_err("rga request commit failed!\n");
	835	+
	836	+ mutex_lock(&request_manager->lock);
	837	+ rga_request_put(request);
	838	+ mutex_unlock(&request_manager->lock);
806	839
807	840	kfree(waiter);
808	841	}
..	..	@@ -832,8 +865,6 @@
832	865	rga_request_get(request);
833	866	mutex_unlock(&request_manager->lock);
834	867
835		- rga_job_cleanup(job);
836		-
837	868	spin_lock_irqsave(&request->lock, flags);
838	869
839	870	if (job->ret < 0) {
..	..	@@ -847,6 +878,8 @@
847	878	finished_count = request->finished_task_count;
848	879
849	880	spin_unlock_irqrestore(&request->lock, flags);
	881	+
	882	+ rga_job_cleanup(job);
850	883
851	884	if ((failed_count + finished_count) >= request->task_count) {
852	885	spin_lock_irqsave(&request->lock, flags);
..	..	@@ -1003,18 +1036,21 @@
1003	1036	{
1004	1037	int ret = 0;
1005	1038	unsigned long flags;
	1039	+ struct dma_fence *release_fence;
1006	1040
1007	1041	spin_lock_irqsave(&request->lock, flags);
1008	1042
1009	1043	if (request->is_running) {
1010		- pr_err("can not re-config when request is running");
1011	1044	spin_unlock_irqrestore(&request->lock, flags);
	1045	+
	1046	+ pr_err("can not re-config when request is running\n");
1012	1047	return -EFAULT;
1013	1048	}
1014	1049
1015	1050	if (request->task_list == NULL) {
1016		- pr_err("can not find task list from id[%d]", request->id);
1017	1051	spin_unlock_irqrestore(&request->lock, flags);
	1052	+
	1053	+ pr_err("can not find task list from id[%d]\n", request->id);
1018	1054	return -EINVAL;
1019	1055	}
1020	1056
..	..	@@ -1026,46 +1062,71 @@
1026	1062
1027	1063	rga_request_get_current_mm(request);
1028	1064
	1065	+ /* Unlock after ensuring that the current request will not be resubmitted. */
1029	1066	spin_unlock_irqrestore(&request->lock, flags);
1030	1067
1031	1068	if (request->sync_mode == RGA_BLIT_ASYNC) {
1032		- ret = rga_request_alloc_release_fence(&request->release_fence);
1033		- if (ret < 0) {
1034		- pr_err("Failed to alloc release fence fd!\n");
1035		- return ret;
	1069	+ release_fence = rga_dma_fence_alloc();
	1070	+ if (IS_ERR(release_fence)) {
	1071	+ pr_err("Can not alloc release fence!\n");
	1072	+ ret = IS_ERR(release_fence);
	1073	+ goto error_put_current_mm;
1036	1074	}
1037		- request->release_fence_fd = ret;
	1075	+ request->release_fence = release_fence;
1038	1076
1039	1077	if (request->acquire_fence_fd > 0) {
1040	1078	ret = rga_request_add_acquire_fence_callback(
1041		- request->acquire_fence_fd,
1042		- (void *)request,
	1079	+ request->acquire_fence_fd, request,
1043	1080	rga_request_acquire_fence_signaled_cb);
1044	1081	if (ret == 0) {
1045		- return ret;
1046		- } else if (ret == 1) {
	1082	+ /* acquire fence active */
	1083	+ goto export_release_fence_fd;
	1084	+ } else if (ret > 0) {
	1085	+ /* acquire fence has been signaled */
1047	1086	goto request_commit;
1048	1087	} else {
1049	1088	pr_err("Failed to add callback with acquire fence fd[%d]!\n",
1050	1089	request->acquire_fence_fd);
1051		- goto error_release_fence_put;
	1090	+ goto err_put_release_fence;
1052	1091	}
1053	1092	}
1054		-
1055	1093	}
1056	1094
1057	1095	request_commit:
1058	1096	ret = rga_request_commit(request);
1059	1097	if (ret < 0) {
1060	1098	pr_err("rga request commit failed!\n");
1061		- goto error_release_fence_put;
	1099	+ goto err_put_release_fence;
	1100	+ }
	1101	+
	1102	+export_release_fence_fd:
	1103	+ if (request->release_fence != NULL) {
	1104	+ ret = rga_dma_fence_get_fd(request->release_fence);
	1105	+ if (ret < 0) {
	1106	+ pr_err("Failed to alloc release fence fd!\n");
	1107	+ rga_request_release_abort(request, ret);
	1108	+ return ret;
	1109	+ }
	1110	+
	1111	+ request->release_fence_fd = ret;
1062	1112	}
1063	1113
1064	1114	return 0;
1065	1115
1066		-error_release_fence_put:
1067		- rga_dma_fence_put(request->release_fence);
1068		- request->release_fence = NULL;
	1116	+err_put_release_fence:
	1117	+ if (request->release_fence != NULL) {
	1118	+ rga_dma_fence_put(request->release_fence);
	1119	+ request->release_fence = NULL;
	1120	+ }
	1121	+
	1122	+error_put_current_mm:
	1123	+ spin_lock_irqsave(&request->lock, flags);
	1124	+
	1125	+ rga_request_put_current_mm(request);
	1126	+ request->is_running = false;
	1127	+
	1128	+ spin_unlock_irqrestore(&request->lock, flags);
	1129	+
1069	1130	return ret;
1070	1131	}
1071	1132
..	..	@@ -1159,10 +1220,11 @@
1159	1220	request = container_of(ref, struct rga_request, refcount);
1160	1221
1161	1222	if (rga_dma_fence_get_status(request->release_fence) == 0)
1162		- rga_dma_fence_signal(request->release_fence, -EEXIST);
	1223	+ rga_dma_fence_signal(request->release_fence, -EFAULT);
1163	1224
1164	1225	spin_lock_irqsave(&request->lock, flags);
1165	1226
	1227	+ rga_request_put_current_mm(request);
1166	1228	rga_dma_fence_put(request->release_fence);
1167	1229
1168	1230	if (!request->is_running \|\| request->is_done) {
..	..	@@ -1188,6 +1250,7 @@
1188	1250
1189	1251	int rga_request_alloc(uint32_t flags, struct rga_session *session)
1190	1252	{
	1253	+ int new_id;
1191	1254	struct rga_pending_request_manager *request_manager;
1192	1255	struct rga_request *request;
1193	1256
..	..	@@ -1218,17 +1281,17 @@
1218	1281	mutex_lock(&request_manager->lock);
1219	1282
1220	1283	idr_preload(GFP_KERNEL);
1221		- request->id = idr_alloc(&request_manager->request_idr, request, 1, 0, GFP_KERNEL);
	1284	+ new_id = idr_alloc_cyclic(&request_manager->request_idr, request, 1, 0, GFP_NOWAIT);
1222	1285	idr_preload_end();
1223		-
1224		- if (request->id <= 0) {
1225		- pr_err("alloc request_id failed!\n");
	1286	+ if (new_id < 0) {
	1287	+ pr_err("request alloc id failed!\n");
1226	1288
1227	1289	mutex_unlock(&request_manager->lock);
1228	1290	kfree(request);
1229		- return -EFAULT;
	1291	+ return new_id;
1230	1292	}
1231	1293
	1294	+ request->id = new_id;
1232	1295	request_manager->request_count++;
1233	1296
1234	1297	mutex_unlock(&request_manager->lock);