hc
2024-01-05 071106ecf68c401173c58808b1cf5f68cc50d390
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
/* SPDX-License-Identifier: GPL-2.0-only */
/*
 * arch/arm64/kernel/entry-ftrace.S
 *
 * Copyright (C) 2013 Linaro Limited
 * Author: AKASHI Takahiro <takahiro.akashi@linaro.org>
 */
 
#include <linux/linkage.h>
#include <asm/asm-offsets.h>
#include <asm/assembler.h>
#include <asm/ftrace.h>
#include <asm/insn.h>
 
#ifdef CONFIG_DYNAMIC_FTRACE_WITH_REGS
/*
 * Due to -fpatchable-function-entry=2, the compiler has placed two NOPs before
 * the regular function prologue. For an enabled callsite, ftrace_init_nop() and
 * ftrace_make_call() have patched those NOPs to:
 *
 *     MOV    X9, LR
 *     BL    <entry>
 *
 * ... where <entry> is either ftrace_caller or ftrace_regs_caller.
 *
 * Each instrumented function follows the AAPCS, so here x0-x8 and x18-x30 are
 * live (x18 holds the Shadow Call Stack pointer), and x9-x17 are safe to
 * clobber.
 *
 * We save the callsite's context into a pt_regs before invoking any ftrace
 * callbacks. So that we can get a sensible backtrace, we create a stack record
 * for the callsite and the ftrace entry assembly. This is not sufficient for
 * reliable stacktrace: until we create the callsite stack record, its caller
 * is missing from the LR and existing chain of frame records.
 */
   .macro  ftrace_regs_entry, allregs=0
   /* Make room for pt_regs, plus a callee frame */
   sub    sp, sp, #(S_FRAME_SIZE + 16)
 
   /* Save function arguments (and x9 for simplicity) */
   stp    x0, x1, [sp, #S_X0]
   stp    x2, x3, [sp, #S_X2]
   stp    x4, x5, [sp, #S_X4]
   stp    x6, x7, [sp, #S_X6]
   stp    x8, x9, [sp, #S_X8]
 
   /* Optionally save the callee-saved registers, always save the FP */
   .if \allregs == 1
   stp    x10, x11, [sp, #S_X10]
   stp    x12, x13, [sp, #S_X12]
   stp    x14, x15, [sp, #S_X14]
   stp    x16, x17, [sp, #S_X16]
   stp    x18, x19, [sp, #S_X18]
   stp    x20, x21, [sp, #S_X20]
   stp    x22, x23, [sp, #S_X22]
   stp    x24, x25, [sp, #S_X24]
   stp    x26, x27, [sp, #S_X26]
   stp    x28, x29, [sp, #S_X28]
   .else
   str    x29, [sp, #S_FP]
   .endif
 
   /* Save the callsite's SP and LR */
   add    x10, sp, #(S_FRAME_SIZE + 16)
   stp    x9, x10, [sp, #S_LR]
 
   /* Save the PC after the ftrace callsite */
   str    x30, [sp, #S_PC]
 
   /* Create a frame record for the callsite above pt_regs */
   stp    x29, x9, [sp, #S_FRAME_SIZE]
   add    x29, sp, #S_FRAME_SIZE
 
   /* Create our frame record within pt_regs. */
   stp    x29, x30, [sp, #S_STACKFRAME]
   add    x29, sp, #S_STACKFRAME
   .endm
 
SYM_CODE_START(ftrace_regs_caller)
#ifdef BTI_C
   BTI_C
#endif
   ftrace_regs_entry    1
   b    ftrace_common
SYM_CODE_END(ftrace_regs_caller)
 
SYM_CODE_START(ftrace_caller)
#ifdef BTI_C
   BTI_C
#endif
   ftrace_regs_entry    0
   b    ftrace_common
SYM_CODE_END(ftrace_caller)
 
SYM_CODE_START(ftrace_common)
   sub    x0, x30, #AARCH64_INSN_SIZE    // ip (callsite's BL insn)
   mov    x1, x9                // parent_ip (callsite's LR)
   ldr_l    x2, function_trace_op        // op
   mov    x3, sp                // regs
 
SYM_INNER_LABEL(ftrace_call, SYM_L_GLOBAL)
   bl    ftrace_stub
 
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
SYM_INNER_LABEL(ftrace_graph_call, SYM_L_GLOBAL) // ftrace_graph_caller();
   nop                // If enabled, this will be replaced
                   // "b ftrace_graph_caller"
#endif
 
/*
 * At the callsite x0-x8 and x19-x30 were live. Any C code will have preserved
 * x19-x29 per the AAPCS, and we created frame records upon entry, so we need
 * to restore x0-x8, x29, and x30.
 */
ftrace_common_return:
   /* Restore function arguments */
   ldp    x0, x1, [sp]
   ldp    x2, x3, [sp, #S_X2]
   ldp    x4, x5, [sp, #S_X4]
   ldp    x6, x7, [sp, #S_X6]
   ldr    x8, [sp, #S_X8]
 
   /* Restore the callsite's FP, LR, PC */
   ldr    x29, [sp, #S_FP]
   ldr    x30, [sp, #S_LR]
   ldr    x9, [sp, #S_PC]
 
   /* Restore the callsite's SP */
   add    sp, sp, #S_FRAME_SIZE + 16
 
   ret    x9
SYM_CODE_END(ftrace_common)
 
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
SYM_CODE_START(ftrace_graph_caller)
   ldr    x0, [sp, #S_PC]
   sub    x0, x0, #AARCH64_INSN_SIZE    // ip (callsite's BL insn)
   add    x1, sp, #S_LR            // parent_ip (callsite's LR)
   ldr    x2, [sp, #S_FRAME_SIZE]           // parent fp (callsite's FP)
   bl    prepare_ftrace_return
   b    ftrace_common_return
SYM_CODE_END(ftrace_graph_caller)
#endif
 
#else /* CONFIG_DYNAMIC_FTRACE_WITH_REGS */
 
/*
 * Gcc with -pg will put the following code in the beginning of each function:
 *      mov x0, x30
 *      bl _mcount
 *    [function's body ...]
 * "bl _mcount" may be replaced to "bl ftrace_caller" or NOP if dynamic
 * ftrace is enabled.
 *
 * Please note that x0 as an argument will not be used here because we can
 * get lr(x30) of instrumented function at any time by winding up call stack
 * as long as the kernel is compiled without -fomit-frame-pointer.
 * (or CONFIG_FRAME_POINTER, this is forced on arm64)
 *
 * stack layout after mcount_enter in _mcount():
 *
 * current sp/fp =>  0:+-----+
 * in _mcount()        | x29 | -> instrumented function's fp
 *                     +-----+
 *                     | x30 | -> _mcount()'s lr (= instrumented function's pc)
 * old sp       => +16:+-----+
 * when instrumented   |     |
 * function calls      | ... |
 * _mcount()           |     |
 *                     |     |
 * instrumented => +xx:+-----+
 * function's fp       | x29 | -> parent's fp
 *                     +-----+
 *                     | x30 | -> instrumented function's lr (= parent's pc)
 *                     +-----+
 *                     | ... |
 */
 
   .macro mcount_enter
   stp    x29, x30, [sp, #-16]!
   mov    x29, sp
   .endm
 
   .macro mcount_exit
   ldp    x29, x30, [sp], #16
   ret
   .endm
 
   .macro mcount_adjust_addr rd, rn
   sub    \rd, \rn, #AARCH64_INSN_SIZE
   .endm
 
   /* for instrumented function's parent */
   .macro mcount_get_parent_fp reg
   ldr    \reg, [x29]
   ldr    \reg, [\reg]
   .endm
 
   /* for instrumented function */
   .macro mcount_get_pc0 reg
   mcount_adjust_addr    \reg, x30
   .endm
 
   .macro mcount_get_pc reg
   ldr    \reg, [x29, #8]
   mcount_adjust_addr    \reg, \reg
   .endm
 
   .macro mcount_get_lr reg
   ldr    \reg, [x29]
   ldr    \reg, [\reg, #8]
   .endm
 
   .macro mcount_get_lr_addr reg
   ldr    \reg, [x29]
   add    \reg, \reg, #8
   .endm
 
#ifndef CONFIG_DYNAMIC_FTRACE
/*
 * void _mcount(unsigned long return_address)
 * @return_address: return address to instrumented function
 *
 * This function makes calls, if enabled, to:
 *     - tracer function to probe instrumented function's entry,
 *     - ftrace_graph_caller to set up an exit hook
 */
SYM_FUNC_START(_mcount)
   mcount_enter
 
   ldr_l    x2, ftrace_trace_function
   adr    x0, ftrace_stub
   cmp    x0, x2            // if (ftrace_trace_function
   b.eq    skip_ftrace_call    //     != ftrace_stub) {
 
   mcount_get_pc    x0        //       function's pc
   mcount_get_lr    x1        //       function's lr (= parent's pc)
   blr    x2            //   (*ftrace_trace_function)(pc, lr);
 
skip_ftrace_call:            // }
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
   ldr_l    x2, ftrace_graph_return
   cmp    x0, x2            //   if ((ftrace_graph_return
   b.ne    ftrace_graph_caller    //        != ftrace_stub)
 
   ldr_l    x2, ftrace_graph_entry    //     || (ftrace_graph_entry
   adr_l    x0, ftrace_graph_entry_stub //     != ftrace_graph_entry_stub))
   cmp    x0, x2
   b.ne    ftrace_graph_caller    //     ftrace_graph_caller();
#endif /* CONFIG_FUNCTION_GRAPH_TRACER */
   mcount_exit
SYM_FUNC_END(_mcount)
EXPORT_SYMBOL(_mcount)
NOKPROBE(_mcount)
 
#else /* CONFIG_DYNAMIC_FTRACE */
/*
 * _mcount() is used to build the kernel with -pg option, but all the branch
 * instructions to _mcount() are replaced to NOP initially at kernel start up,
 * and later on, NOP to branch to ftrace_caller() when enabled or branch to
 * NOP when disabled per-function base.
 */
SYM_FUNC_START(_mcount)
   ret
SYM_FUNC_END(_mcount)
EXPORT_SYMBOL(_mcount)
NOKPROBE(_mcount)
 
/*
 * void ftrace_caller(unsigned long return_address)
 * @return_address: return address to instrumented function
 *
 * This function is a counterpart of _mcount() in 'static' ftrace, and
 * makes calls to:
 *     - tracer function to probe instrumented function's entry,
 *     - ftrace_graph_caller to set up an exit hook
 */
SYM_FUNC_START(ftrace_caller)
   mcount_enter
 
   mcount_get_pc0    x0        //     function's pc
   mcount_get_lr    x1        //     function's lr
 
SYM_INNER_LABEL(ftrace_call, SYM_L_GLOBAL)    // tracer(pc, lr);
   nop                // This will be replaced with "bl xxx"
                   // where xxx can be any kind of tracer.
 
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
SYM_INNER_LABEL(ftrace_graph_call, SYM_L_GLOBAL) // ftrace_graph_caller();
   nop                // If enabled, this will be replaced
                   // "b ftrace_graph_caller"
#endif
 
   mcount_exit
SYM_FUNC_END(ftrace_caller)
#endif /* CONFIG_DYNAMIC_FTRACE */
 
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
/*
 * void ftrace_graph_caller(void)
 *
 * Called from _mcount() or ftrace_caller() when function_graph tracer is
 * selected.
 * This function w/ prepare_ftrace_return() fakes link register's value on
 * the call stack in order to intercept instrumented function's return path
 * and run return_to_handler() later on its exit.
 */
SYM_FUNC_START(ftrace_graph_caller)
   mcount_get_pc          x0    //     function's pc
   mcount_get_lr_addr      x1    //     pointer to function's saved lr
   mcount_get_parent_fp      x2    //     parent's fp
   bl    prepare_ftrace_return    // prepare_ftrace_return(pc, &lr, fp)
 
   mcount_exit
SYM_FUNC_END(ftrace_graph_caller)
#endif /* CONFIG_FUNCTION_GRAPH_TRACER */
#endif /* CONFIG_DYNAMIC_FTRACE_WITH_REGS */
 
SYM_FUNC_START(ftrace_stub)
   ret
SYM_FUNC_END(ftrace_stub)
 
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
/*
 * void return_to_handler(void)
 *
 * Run ftrace_return_to_handler() before going back to parent.
 * @fp is checked against the value passed by ftrace_graph_caller().
 */
SYM_CODE_START(return_to_handler)
   /* save return value regs */
   sub sp, sp, #64
   stp x0, x1, [sp]
   stp x2, x3, [sp, #16]
   stp x4, x5, [sp, #32]
   stp x6, x7, [sp, #48]
 
   mov    x0, x29            //     parent's fp
   bl    ftrace_return_to_handler// addr = ftrace_return_to_hander(fp);
   mov    x30, x0            // restore the original return address
 
   /* restore return value regs */
   ldp x0, x1, [sp]
   ldp x2, x3, [sp, #16]
   ldp x4, x5, [sp, #32]
   ldp x6, x7, [sp, #48]
   add sp, sp, #64
 
   ret
SYM_CODE_END(return_to_handler)
#endif /* CONFIG_FUNCTION_GRAPH_TRACER */