hc
2025-02-14 bbb9540dc49f70f6b703d1c8d1b85fa5f602d86e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
/* SPDX-License-Identifier: GPL-2.0 */
/* NGbzero.S: Niagara optimized memset/clear_user.
 *
 * Copyright (C) 2006 David S. Miller (davem@davemloft.net)
 */
#include <asm/asi.h>
 
#define EX_ST(x,y)        \
98:    x,y;            \
   .section __ex_table,"a";\
   .align 4;        \
   .word 98b, __retl_o1_asi;\
   .text;            \
   .align 4;
 
   .text
 
   .globl        NGmemset
   .type        NGmemset, #function
NGmemset:        /* %o0=buf, %o1=pat, %o2=len */
   and        %o1, 0xff, %o3
   mov        %o2, %o1
   sllx        %o3, 8, %g1
   or        %g1, %o3, %o2
   sllx        %o2, 16, %g1
   or        %g1, %o2, %o2
   sllx        %o2, 32, %g1
   ba,pt        %xcc, 1f
    or        %g1, %o2, %o2
 
   .globl        NGbzero
   .type        NGbzero, #function
NGbzero:
   clr        %o2
1:    brz,pn        %o1, NGbzero_return
    mov        %o0, %o3
 
   /* %o5: saved %asi, restored at NGbzero_done
    * %g7: store-init %asi to use
    * %o4:    non-store-init %asi to use
    */
   rd        %asi, %o5
   mov        ASI_BLK_INIT_QUAD_LDD_P, %g7
   mov        ASI_P, %o4
   wr        %o4, 0x0, %asi
 
NGbzero_from_clear_user:
   cmp        %o1, 15
   bl,pn        %icc, NGbzero_tiny
    andcc        %o0, 0x7, %g1
   be,pt        %xcc, 2f
    mov        8, %g2
   sub        %g2, %g1, %g1
   sub        %o1, %g1, %o1
1:    EX_ST(stba %o2, [%o0 + 0x00] %asi)
   subcc        %g1, 1, %g1
   bne,pt        %xcc, 1b
    add        %o0, 1, %o0
2:    cmp        %o1, 128
   bl,pn        %icc, NGbzero_medium
    andcc        %o0, (64 - 1), %g1
   be,pt        %xcc, NGbzero_pre_loop
    mov        64, %g2
   sub        %g2, %g1, %g1
   sub        %o1, %g1, %o1
1:    EX_ST(stxa %o2, [%o0 + 0x00] %asi)
   subcc        %g1, 8, %g1
   bne,pt        %xcc, 1b
    add        %o0, 8, %o0
 
NGbzero_pre_loop:
   wr        %g7, 0x0, %asi
   andn        %o1, (64 - 1), %g1
   sub        %o1, %g1, %o1
NGbzero_loop:
   EX_ST(stxa %o2, [%o0 + 0x00] %asi)
   EX_ST(stxa %o2, [%o0 + 0x08] %asi)
   EX_ST(stxa %o2, [%o0 + 0x10] %asi)
   EX_ST(stxa %o2, [%o0 + 0x18] %asi)
   EX_ST(stxa %o2, [%o0 + 0x20] %asi)
   EX_ST(stxa %o2, [%o0 + 0x28] %asi)
   EX_ST(stxa %o2, [%o0 + 0x30] %asi)
   EX_ST(stxa %o2, [%o0 + 0x38] %asi)
   subcc        %g1, 64, %g1
   bne,pt        %xcc, NGbzero_loop
    add        %o0, 64, %o0
 
   membar        #Sync
   wr        %o4, 0x0, %asi
   brz,pn        %o1, NGbzero_done
NGbzero_medium:
    andncc        %o1, 0x7, %g1
   be,pn        %xcc, 2f
    sub        %o1, %g1, %o1
1:    EX_ST(stxa %o2, [%o0 + 0x00] %asi)
   subcc        %g1, 8, %g1
   bne,pt        %xcc, 1b
    add        %o0, 8, %o0
2:    brz,pt        %o1, NGbzero_done
    nop
 
NGbzero_tiny:
1:    EX_ST(stba %o2, [%o0 + 0x00] %asi)
   subcc        %o1, 1, %o1
   bne,pt        %icc, 1b
    add        %o0, 1, %o0
 
   /* fallthrough */
 
NGbzero_done:
   wr        %o5, 0x0, %asi
 
NGbzero_return:
   retl
    mov        %o3, %o0
   .size        NGbzero, .-NGbzero
   .size        NGmemset, .-NGmemset
 
   .globl        NGclear_user
   .type        NGclear_user, #function
NGclear_user:        /* %o0=buf, %o1=len */
   rd        %asi, %o5
   brz,pn        %o1, NGbzero_done
    clr        %o3
   cmp        %o5, ASI_AIUS
   bne,pn        %icc, NGbzero
    clr        %o2
   mov        ASI_BLK_INIT_QUAD_LDD_AIUS, %g7
   ba,pt        %xcc, NGbzero_from_clear_user
    mov        ASI_AIUS, %o4
   .size        NGclear_user, .-NGclear_user
 
#define BRANCH_ALWAYS    0x10680000
#define NOP        0x01000000
#define NG_DO_PATCH(OLD, NEW)    \
   sethi    %hi(NEW), %g1; \
   or    %g1, %lo(NEW), %g1; \
   sethi    %hi(OLD), %g2; \
   or    %g2, %lo(OLD), %g2; \
   sub    %g1, %g2, %g1; \
   sethi    %hi(BRANCH_ALWAYS), %g3; \
   sll    %g1, 11, %g1; \
   srl    %g1, 11 + 2, %g1; \
   or    %g3, %lo(BRANCH_ALWAYS), %g3; \
   or    %g3, %g1, %g3; \
   stw    %g3, [%g2]; \
   sethi    %hi(NOP), %g3; \
   or    %g3, %lo(NOP), %g3; \
   stw    %g3, [%g2 + 0x4]; \
   flush    %g2;
 
   .globl    niagara_patch_bzero
   .type    niagara_patch_bzero,#function
niagara_patch_bzero:
   NG_DO_PATCH(memset, NGmemset)
   NG_DO_PATCH(__bzero, NGbzero)
   NG_DO_PATCH(__clear_user, NGclear_user)
   NG_DO_PATCH(tsb_init, NGtsb_init)
   retl
    nop
   .size    niagara_patch_bzero,.-niagara_patch_bzero