hc
2023-12-11 6778948f9de86c3cfaf36725a7c87dcff9ba247f
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
/* SPDX-License-Identifier: GPL-2.0 */
#ifndef _ASM_WORD_AT_A_TIME_H
#define _ASM_WORD_AT_A_TIME_H
 
#include <linux/kernel.h>
 
/*
 * This is largely generic for little-endian machines, but the
 * optimal byte mask counting is probably going to be something
 * that is architecture-specific. If you have a reliably fast
 * bit count instruction, that might be better than the multiply
 * and shift, for example.
 */
struct word_at_a_time {
   const unsigned long one_bits, high_bits;
};
 
#define WORD_AT_A_TIME_CONSTANTS { REPEAT_BYTE(0x01), REPEAT_BYTE(0x80) }
 
#ifdef CONFIG_64BIT
 
/*
 * Jan Achrenius on G+: microoptimized version of
 * the simpler "(mask & ONEBYTES) * ONEBYTES >> 56"
 * that works for the bytemasks without having to
 * mask them first.
 */
static inline long count_masked_bytes(unsigned long mask)
{
   return mask*0x0001020304050608ul >> 56;
}
 
#else    /* 32-bit case */
 
/* Carl Chatfield / Jan Achrenius G+ version for 32-bit */
static inline long count_masked_bytes(long mask)
{
   /* (000000 0000ff 00ffff ffffff) -> ( 1 1 2 3 ) */
   long a = (0x0ff0001+mask) >> 23;
   /* Fix the 1 for 00 case */
   return a & mask;
}
 
#endif
 
/* Return nonzero if it has a zero */
static inline unsigned long has_zero(unsigned long a, unsigned long *bits, const struct word_at_a_time *c)
{
   unsigned long mask = ((a - c->one_bits) & ~a) & c->high_bits;
   *bits = mask;
   return mask;
}
 
static inline unsigned long prep_zero_mask(unsigned long a, unsigned long bits, const struct word_at_a_time *c)
{
   return bits;
}
 
static inline unsigned long create_zero_mask(unsigned long bits)
{
   bits = (bits - 1) & ~bits;
   return bits >> 7;
}
 
/* The mask we created is directly usable as a bytemask */
#define zero_bytemask(mask) (mask)
 
static inline unsigned long find_zero(unsigned long mask)
{
   return count_masked_bytes(mask);
}
 
/*
 * Load an unaligned word from kernel space.
 *
 * In the (very unlikely) case of the word being a page-crosser
 * and the next page not being mapped, take the exception and
 * return zeroes in the non-existing part.
 */
static inline unsigned long load_unaligned_zeropad(const void *addr)
{
   unsigned long ret, dummy;
 
   asm(
       "1:\tmov %2,%0\n"
       "2:\n"
       ".section .fixup,\"ax\"\n"
       "3:\t"
       "lea %2,%1\n\t"
       "and %3,%1\n\t"
       "mov (%1),%0\n\t"
       "leal %2,%%ecx\n\t"
       "andl %4,%%ecx\n\t"
       "shll $3,%%ecx\n\t"
       "shr %%cl,%0\n\t"
       "jmp 2b\n"
       ".previous\n"
       _ASM_EXTABLE(1b, 3b)
       :"=&r" (ret),"=&c" (dummy)
       :"m" (*(unsigned long *)addr),
        "i" (-sizeof(unsigned long)),
        "i" (sizeof(unsigned long)-1));
   return ret;
}
 
#endif /* _ASM_WORD_AT_A_TIME_H */