1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
| /* SPDX-License-Identifier: GPL-2.0 */
| /* NGbzero.S: Niagara optimized memset/clear_user.
| *
| * Copyright (C) 2006 David S. Miller (davem@davemloft.net)
| */
| #include <asm/asi.h>
|
| #define EX_ST(x,y) \
| 98: x,y; \
| .section __ex_table,"a";\
| .align 4; \
| .word 98b, __retl_o1_asi;\
| .text; \
| .align 4;
|
| .text
|
| .globl NGmemset
| .type NGmemset, #function
| NGmemset: /* %o0=buf, %o1=pat, %o2=len */
| and %o1, 0xff, %o3
| mov %o2, %o1
| sllx %o3, 8, %g1
| or %g1, %o3, %o2
| sllx %o2, 16, %g1
| or %g1, %o2, %o2
| sllx %o2, 32, %g1
| ba,pt %xcc, 1f
| or %g1, %o2, %o2
|
| .globl NGbzero
| .type NGbzero, #function
| NGbzero:
| clr %o2
| 1: brz,pn %o1, NGbzero_return
| mov %o0, %o3
|
| /* %o5: saved %asi, restored at NGbzero_done
| * %g7: store-init %asi to use
| * %o4: non-store-init %asi to use
| */
| rd %asi, %o5
| mov ASI_BLK_INIT_QUAD_LDD_P, %g7
| mov ASI_P, %o4
| wr %o4, 0x0, %asi
|
| NGbzero_from_clear_user:
| cmp %o1, 15
| bl,pn %icc, NGbzero_tiny
| andcc %o0, 0x7, %g1
| be,pt %xcc, 2f
| mov 8, %g2
| sub %g2, %g1, %g1
| sub %o1, %g1, %o1
| 1: EX_ST(stba %o2, [%o0 + 0x00] %asi)
| subcc %g1, 1, %g1
| bne,pt %xcc, 1b
| add %o0, 1, %o0
| 2: cmp %o1, 128
| bl,pn %icc, NGbzero_medium
| andcc %o0, (64 - 1), %g1
| be,pt %xcc, NGbzero_pre_loop
| mov 64, %g2
| sub %g2, %g1, %g1
| sub %o1, %g1, %o1
| 1: EX_ST(stxa %o2, [%o0 + 0x00] %asi)
| subcc %g1, 8, %g1
| bne,pt %xcc, 1b
| add %o0, 8, %o0
|
| NGbzero_pre_loop:
| wr %g7, 0x0, %asi
| andn %o1, (64 - 1), %g1
| sub %o1, %g1, %o1
| NGbzero_loop:
| EX_ST(stxa %o2, [%o0 + 0x00] %asi)
| EX_ST(stxa %o2, [%o0 + 0x08] %asi)
| EX_ST(stxa %o2, [%o0 + 0x10] %asi)
| EX_ST(stxa %o2, [%o0 + 0x18] %asi)
| EX_ST(stxa %o2, [%o0 + 0x20] %asi)
| EX_ST(stxa %o2, [%o0 + 0x28] %asi)
| EX_ST(stxa %o2, [%o0 + 0x30] %asi)
| EX_ST(stxa %o2, [%o0 + 0x38] %asi)
| subcc %g1, 64, %g1
| bne,pt %xcc, NGbzero_loop
| add %o0, 64, %o0
|
| membar #Sync
| wr %o4, 0x0, %asi
| brz,pn %o1, NGbzero_done
| NGbzero_medium:
| andncc %o1, 0x7, %g1
| be,pn %xcc, 2f
| sub %o1, %g1, %o1
| 1: EX_ST(stxa %o2, [%o0 + 0x00] %asi)
| subcc %g1, 8, %g1
| bne,pt %xcc, 1b
| add %o0, 8, %o0
| 2: brz,pt %o1, NGbzero_done
| nop
|
| NGbzero_tiny:
| 1: EX_ST(stba %o2, [%o0 + 0x00] %asi)
| subcc %o1, 1, %o1
| bne,pt %icc, 1b
| add %o0, 1, %o0
|
| /* fallthrough */
|
| NGbzero_done:
| wr %o5, 0x0, %asi
|
| NGbzero_return:
| retl
| mov %o3, %o0
| .size NGbzero, .-NGbzero
| .size NGmemset, .-NGmemset
|
| .globl NGclear_user
| .type NGclear_user, #function
| NGclear_user: /* %o0=buf, %o1=len */
| rd %asi, %o5
| brz,pn %o1, NGbzero_done
| clr %o3
| cmp %o5, ASI_AIUS
| bne,pn %icc, NGbzero
| clr %o2
| mov ASI_BLK_INIT_QUAD_LDD_AIUS, %g7
| ba,pt %xcc, NGbzero_from_clear_user
| mov ASI_AIUS, %o4
| .size NGclear_user, .-NGclear_user
|
| #define BRANCH_ALWAYS 0x10680000
| #define NOP 0x01000000
| #define NG_DO_PATCH(OLD, NEW) \
| sethi %hi(NEW), %g1; \
| or %g1, %lo(NEW), %g1; \
| sethi %hi(OLD), %g2; \
| or %g2, %lo(OLD), %g2; \
| sub %g1, %g2, %g1; \
| sethi %hi(BRANCH_ALWAYS), %g3; \
| sll %g1, 11, %g1; \
| srl %g1, 11 + 2, %g1; \
| or %g3, %lo(BRANCH_ALWAYS), %g3; \
| or %g3, %g1, %g3; \
| stw %g3, [%g2]; \
| sethi %hi(NOP), %g3; \
| or %g3, %lo(NOP), %g3; \
| stw %g3, [%g2 + 0x4]; \
| flush %g2;
|
| .globl niagara_patch_bzero
| .type niagara_patch_bzero,#function
| niagara_patch_bzero:
| NG_DO_PATCH(memset, NGmemset)
| NG_DO_PATCH(__bzero, NGbzero)
| NG_DO_PATCH(__clear_user, NGclear_user)
| NG_DO_PATCH(tsb_init, NGtsb_init)
| retl
| nop
| .size niagara_patch_bzero,.-niagara_patch_bzero
|
|