hc
2024-08-16 a24a44ff9ca902811b99aa9663d697cf452e08ef
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
// SPDX-License-Identifier: GPL-2.0
#include "tests/tests.h"
#include "cloexec.h"
#include "debug.h"
#include "evlist.h"
#include "evsel.h"
#include "arch-tests.h"
#include <internal/lib.h> // page_size
 
#include <signal.h>
#include <sys/mman.h>
#include <sys/wait.h>
#include <errno.h>
#include <string.h>
 
static pid_t spawn(void)
{
   pid_t pid;
 
   pid = fork();
   if (pid)
       return pid;
 
   while(1)
       sleep(5);
   return 0;
}
 
/*
 * Create an event group that contains both a sampled hardware
 * (cpu-cycles) and software (intel_cqm/llc_occupancy/) event. We then
 * wait for the hardware perf counter to overflow and generate a PMI,
 * which triggers an event read for both of the events in the group.
 *
 * Since reading Intel CQM event counters requires sending SMP IPIs, the
 * CQM pmu needs to handle the above situation gracefully, and return
 * the last read counter value to avoid triggering a WARN_ON_ONCE() in
 * smp_call_function_many() caused by sending IPIs from NMI context.
 */
int test__intel_cqm_count_nmi_context(struct test *test __maybe_unused, int subtest __maybe_unused)
{
   struct evlist *evlist = NULL;
   struct evsel *evsel = NULL;
   struct perf_event_attr pe;
   int i, fd[2], flag, ret;
   size_t mmap_len;
   void *event;
   pid_t pid;
   int err = TEST_FAIL;
 
   flag = perf_event_open_cloexec_flag();
 
   evlist = evlist__new();
   if (!evlist) {
       pr_debug("perf_evlist__new failed\n");
       return TEST_FAIL;
   }
 
   ret = parse_events(evlist, "intel_cqm/llc_occupancy/", NULL);
   if (ret) {
       pr_debug("parse_events failed, is \"intel_cqm/llc_occupancy/\" available?\n");
       err = TEST_SKIP;
       goto out;
   }
 
   evsel = evlist__first(evlist);
   if (!evsel) {
       pr_debug("evlist__first failed\n");
       goto out;
   }
 
   memset(&pe, 0, sizeof(pe));
   pe.size = sizeof(pe);
 
   pe.type = PERF_TYPE_HARDWARE;
   pe.config = PERF_COUNT_HW_CPU_CYCLES;
   pe.read_format = PERF_FORMAT_GROUP;
 
   pe.sample_period = 128;
   pe.sample_type = PERF_SAMPLE_IP | PERF_SAMPLE_READ;
 
   pid = spawn();
 
   fd[0] = sys_perf_event_open(&pe, pid, -1, -1, flag);
   if (fd[0] < 0) {
       pr_debug("failed to open event\n");
       goto out;
   }
 
   memset(&pe, 0, sizeof(pe));
   pe.size = sizeof(pe);
 
   pe.type = evsel->attr.type;
   pe.config = evsel->attr.config;
 
   fd[1] = sys_perf_event_open(&pe, pid, -1, fd[0], flag);
   if (fd[1] < 0) {
       pr_debug("failed to open event\n");
       goto out;
   }
 
   /*
    * Pick a power-of-two number of pages + 1 for the meta-data
    * page (struct perf_event_mmap_page). See tools/perf/design.txt.
    */
   mmap_len = page_size * 65;
 
   event = mmap(NULL, mmap_len, PROT_READ, MAP_SHARED, fd[0], 0);
   if (event == (void *)(-1)) {
       pr_debug("failed to mmap %d\n", errno);
       goto out;
   }
 
   sleep(1);
 
   err = TEST_OK;
 
   munmap(event, mmap_len);
 
   for (i = 0; i < 2; i++)
       close(fd[i]);
 
   kill(pid, SIGKILL);
   wait(NULL);
out:
   evlist__delete(evlist);
   return err;
}