#include "../../../include/lammp/impl/ele_mul.h"
#include "../../../include/lammp/impl/mparam.h"
#include "../../../include/lammp/impl/prime_table.h"
#include "../../../include/lammp/impl/longlong.h"

nPr.c 的引用(Include)关系图:

宏定义
#define	mul_1(dst, rn, v)

函数
static uint	count_factors (fac_ptr fac, uint nfactors, uint n, uint r, uint p)

mp_size_t	lmmp_nPr_ (mp_ptr restrict dst, mp_bitcnt_t bits, mp_size_t rn, ulong n, ulong r)

mp_size_t	lmmp_nPr_size_ (ulong n, ulong r, mp_bitcnt_t *restrict bits)

static mp_size_t	lmmp_odd_nPr_product_ (mp_ptr restrict dst, mp_size_t rn, uint n, uint r)
	使用累乘函数计算nPr（奇数部分）

mp_size_t	lmmp_odd_nPr_uint_ (mp_ptr restrict dst, mp_size_t rn, ulong n, ulong r)

mp_size_t	lmmp_odd_nPr_ulong_ (mp_ptr restrict dst, mp_size_t rn, ulong n, ulong r)

mp_size_t	lmmp_odd_nPr_ushort_ (mp_ptr restrict dst, mp_size_t rn, ulong n, ulong r)

变量
static const ulong	odd_factorial [25]

宏定义说明

◆ mul_1

#define mul_1	(	dst,
		rn,
		v
	)

值:

    dst[rn] = lmmp_mul_1_(dst, dst, rn, v); \
    ++rn;                                   \
    rn -= dst[rn - 1] == 0 ? 1 : 0

在文件 nPr.c 第 12 行定义.

15 : 0

函数说明

◆ count_factors()

static uint count_factors	(	fac_ptr	fac,
		uint	nfactors,
		uint	n,
		uint	r,
		uint	p
	)

inlinestatic

在文件 nPr.c 第 40 行定义.

                                                                                     {
    uint pn = n;
    uint e = 0;
    ulong inv = MP_ULONG_MAX / p + 1;
    while (pn > 0) {
        _udiv32by32_q_preinv(pn, pn, inv);
        e += pn;
    }
    pn = r;
    while (pn > 0) {
        _udiv32by32_q_preinv(pn, pn, inv);
        e -= pn;
    }
    if (e > 0) {
        fac[nfactors].f = p;
        fac[nfactors++].j = e;
    }
    return nfactors;
}

引用了 _udiv32by32_q_preinv, fac_t::f, fac_t::j , 以及 MP_ULONG_MAX.

被这些函数引用 lmmp_odd_nPr_uint_() , 以及 lmmp_odd_nPr_ushort_().

这是这个函数的调用关系图:

◆ lmmp_nPr_()

mp_size_t lmmp_nPr_	(	mp_ptr restrict	dst,
		mp_bitcnt_t	bits,
		mp_size_t	rn,
		ulong	n,
		ulong	r
	)

在文件 nPr.c 第 255 行定义.

                                                                                           {
    lmmp_debug_assert(n >= r);
    mp_size_t shw = bits / LIMB_BITS;
    bits %= LIMB_BITS;
    lmmp_zero(dst, shw);
    if (n <= NPR_SHORT_LIMIT)
        rn = lmmp_odd_nPr_ushort_(dst + shw, rn - shw, n, r);
    else if (n <= NPR_INT_LIMIT)
        rn = lmmp_odd_nPr_uint_(dst + shw, rn - shw, n, r);
    else
        rn = lmmp_odd_nPr_ulong_(dst + shw, rn - shw, n, r);
 
    if (bits > 0) {
        dst[shw + rn] = lmmp_shl_(dst + shw, dst + shw, rn, bits);
        rn += shw + 1;
        rn -= dst[rn - 1] == 0;
    } else {
        rn += shw;
    }
    return rn;
}

引用了 LIMB_BITS, lmmp_debug_assert, lmmp_odd_nPr_uint_(), lmmp_odd_nPr_ulong_(), lmmp_odd_nPr_ushort_(), lmmp_shl_(), lmmp_zero, NPR_INT_LIMIT , 以及 NPR_SHORT_LIMIT.

函数调用图:

◆ lmmp_nPr_size_()

mp_size_t lmmp_nPr_size_	(	ulong	n,
		ulong	r,
		mp_bitcnt_t *restrict	bits
	)

在文件 nPr.c 第 25 行定义.

                                                                       {
    mp_size_t shl = n - lmmp_limb_popcnt_(n);
    shl -= (n - r) - lmmp_limb_popcnt_(n - r);
    *bits = shl;
    if (n < DBL_2POW_MANT_DIG_) {
        double ln_perm = lgamma(n + 1.0) - lgamma(n - r + 1.0);
        double log2_perm = ln_perm / LOG2_;
        mp_size_t rn = ceil(log2_perm / LIMB_BITS) + 2; /* more two limbs */
        return rn;
    } else {
        // nPr = n! / (n-r)! < n^r
        return lmmp_pow_1_size_(n, r);
    }
}

引用了 DBL_2POW_MANT_DIG_, LIMB_BITS, lmmp_limb_popcnt_(), lmmp_pow_1_size_() , 以及 LOG2_.

函数调用图:

◆ lmmp_odd_nPr_product_()

static mp_size_t lmmp_odd_nPr_product_	(	mp_ptr restrict	dst,
		mp_size_t	rn,
		uint	n,
		uint	r
	)

static

使用累乘函数计算nPr（奇数部分）

在文件 nPr.c 第 63 行定义.

                                                                                          {
    TEMP_DECL;
    ulongp restrict limbs = TALLOC_TYPE(r / 2 + 1, ulong);
    mp_size_t limbn = 0;
    ulong t = 1, v;
    mp_bitcnt_t cnt = 0;
    for (ulong i = n - r + 1; i <= n; ++i) {
        ctz_shl(v, i, cnt);
        t *= v;
        if (t > MP_UINT_MAX) {
            limbs[limbn++] = t;
            t = 1;
        }
    }
    if (t != 1)
        limbs[limbn++] = t;
 
    mp_ptr restrict tp = TALLOC_TYPE(limbn * 2, mp_limb_t);
    // 这里不能直接乘入dst，因为dst的大小可能小于limbn，导致溢出
    rn = lmmp_elem_mul_ulong_(tp, limbs, limbn, tp + limbn);
    lmmp_copy(dst, tp, rn);
    TEMP_FREE;
    return rn;
}

引用了 ctz_shl, lmmp_copy, lmmp_elem_mul_ulong_(), MP_UINT_MAX, TALLOC_TYPE, TEMP_DECL, TEMP_FREE , 以及 tp.

被这些函数引用 lmmp_odd_nPr_uint_() , 以及 lmmp_odd_nPr_ushort_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_odd_nPr_uint_()

mp_size_t lmmp_odd_nPr_uint_	(	mp_ptr restrict	dst,
		mp_size_t	rn,
		ulong	n,
		ulong	r
	)

在文件 nPr.c 第 190 行定义.

                                                                                  {
    lmmp_param_assert(n >= r);
    lmmp_param_assert(n <= NPR_INT_LIMIT);
    if (r <= 10) {
        dst[0] = 1;
        rn = 1;
        ulong v;
        mp_bitcnt_t cnt;
        for (ulong i = n - r + 1; i <= n; ++i) {
            ctz_shl(v, i, cnt);
            mul_1(dst, rn, v);
        }
        return rn;
    } else if (rn < PERMUTATION_UINT_MUL_THRESHOLD || n >= (PERMUTATION_UINT_TIMES_THRESHOLD * r)) {
        return lmmp_odd_nPr_product_(dst, rn, n, r);
    } else{
        TEMP_B_DECL;
        
        lmmp_prime_int_table_init_(n);
        uint nfactors = lmmp_prime_size_(n);
        fac_ptr restrict fac = BALLOC_TYPE(nfactors, fac_t);
        r = n - r;
        nfactors = 0;
 
        prime_cache_t cache;
        lmmp_prime_cache_init_(&cache, n);
        while(cache.is_end == 0) {
            lmmp_prime_cache_next_(&cache);
            for (uint i = 0; i < cache.size; ++i) {
                nfactors = count_factors(fac, nfactors, n, r, cache.pp[i]);
            }
        }
        lmmp_prime_cache_free_(&cache);
 
        rn = lmmp_factors_mul_(dst, rn, fac, nfactors);
 
        TEMP_B_FREE;
        return rn;
    }
}

引用了 BALLOC_TYPE, count_factors(), ctz_shl, prime_cache_t::is_end, lmmp_factors_mul_(), lmmp_odd_nPr_product_(), lmmp_param_assert, lmmp_prime_cache_free_(), lmmp_prime_cache_init_(), lmmp_prime_cache_next_(), lmmp_prime_int_table_init_(), lmmp_prime_size_(), mul_1, NPR_INT_LIMIT, PERMUTATION_UINT_TIMES_THRESHOLD, prime_cache_t::pp, prime_cache_t::size, TEMP_B_DECL , 以及 TEMP_B_FREE.

被这些函数引用 lmmp_nPr_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_odd_nPr_ulong_()

mp_size_t lmmp_odd_nPr_ulong_	(	mp_ptr restrict	dst,
		mp_size_t	rn,
		ulong	n,
		ulong	r
	)

在文件 nPr.c 第 231 行定义.

                                                                                   {
    lmmp_param_assert(n >= r);
    TEMP_DECL;
    ulongp restrict limbs = TALLOC_TYPE(r + 1, ulong);
    mp_size_t limbn = 0;
    ulong t, v, m = 1;
    mp_bitcnt_t cnt;
    for (ulong i = 1; i <= r; ++i) {
        t = n - r + i;
        ctz_shl(v, t, cnt);
        if (v != 1)
            limbs[limbn++] = v;
    }
    if (m != 1)
        limbs[limbn++] = m;
 
    mp_ptr restrict tp = TALLOC_TYPE(limbn * 2, mp_limb_t);
    // 这里不能直接乘入dst，因为dst的大小可能小于limbn，导致溢出
    rn = lmmp_elem_mul_ulong_(tp, limbs, limbn, tp + limbn);
    lmmp_copy(dst, tp, rn);
    TEMP_FREE;
    return rn;
}

引用了 ctz_shl, lmmp_copy, lmmp_elem_mul_ulong_(), lmmp_param_assert, TALLOC_TYPE, TEMP_DECL, TEMP_FREE , 以及 tp.

被这些函数引用 lmmp_nPr_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_odd_nPr_ushort_()

mp_size_t lmmp_odd_nPr_ushort_	(	mp_ptr restrict	dst,
		mp_size_t	rn,
		ulong	n,
		ulong	r
	)

在文件 nPr.c 第 88 行定义.

                                                                                    {
    lmmp_param_assert(n >= r);
    lmmp_param_assert(n <= NPR_SHORT_LIMIT);
    if (n < ODD_FACTORIAL_SIZE) {
        if (n == 0) {
            dst[0] = 1;
        } else if (n == r) {
            dst[0] = odd_factorial[n - 1];
        } else {
            dst[0] = odd_factorial[n - 1] / odd_factorial[n - r - 1];
        }
        return 1;
    } else if (r <= 10) {
        dst[0] = 1;
        rn = 1;
        ulong t = 1, v;
        ulong i = n - r + 1;
        mp_bitcnt_t cnt = 0;
        lmmp_debug_assert(n >= 3);
        for (; i <= (ulong)n - 3; i += 3) {
            t = i * (i + 1) * (i + 2);
            ctz_shl(v, t, cnt);
            mul_1(dst, rn, v);
        }
        t = 1;
        for (; i <= n; ++i) {
            t *= i;
        }
        ctz_shl(v, t, cnt);
        if (v != 1) {
            mul_1(dst, rn, v);
        }
        return rn;
    } else if (n <= MP_UCHAR_MAX) {
        lmmp_debug_assert(n >= 7);
        lmmp_debug_assert(r >= 2);
        dst[0] = 1;
        rn = 1;
        ulong t = 0, v;
        ulong i = n - r + 1;
        mp_bitcnt_t cnt;
        for (; i <= (ulong)n - 7; i += 7) {
            t = i * (i + 1) * (i + 2) * (i + 3) * (i + 4) * (i + 5) * (i + 6);
            ctz_shl(v, t, cnt);
            mul_1(dst, rn, v);
        }
        t = 1;
        for (; i <= n; ++i) {
            t *= i;
        }
        ctz_shl(v, t, cnt);
        if (v != 1) {
            mul_1(dst, rn, v);
        }
        return rn;
    } else if (n <= 0xfff) {
        TEMP_S_DECL;
        ulongp restrict limbs = SALLOC_TYPE(r / 5 + 1, ulong);
        mp_size_t limbn = 0;
        ulong t, v;
        ulong i = n - r + 1;
        mp_bitcnt_t cnt;
        lmmp_debug_assert(n >= 5);
        for (; i <= (ulong)n - 5; i += 5) {
            t = i * (i + 1) * (i + 2) * (i + 3) * (i + 4);
            ctz_shl(v, t, cnt);
            limbs[limbn++] = v;
        }
        t = 1;
        for (; i <= n; ++i) {
            t *= i;
        }
        ctz_shl(v, t, cnt);
        if (v != 1)
            limbs[limbn++] = v;
        mp_ptr restrict tp = SALLOC_TYPE(limbn * 2, mp_limb_t);
        // 这里不能直接乘入dst，因为dst的大小可能小于limbn，导致溢出
        rn = lmmp_elem_mul_ulong_(tp, limbs, limbn, tp + limbn);
        lmmp_copy(dst, tp, rn);
        TEMP_S_FREE;
        return rn;
    } else if (rn < PERMUTATION_USHORT_MUL_THRESHOLD || n >= (PERMUTATION_USHORT_TIMES_THRESHOLD * r)) {
        return lmmp_odd_nPr_product_(dst, rn, n, r);
    } else {
        TEMP_DECL;
        uint primen = lmmp_prime_cnt16_(n);
        uint nfactors = primen;
        fac_ptr restrict fac = TALLOC_TYPE(nfactors, fac_t);
        r = n - r;
        nfactors = 0;
        for (uint i = 1; i < primen; ++i) {
            uint p = prime_short_table[i];
            nfactors = count_factors(fac, nfactors, n, r, p);
        }
 
        rn = lmmp_factors_mul_(dst, rn, fac, nfactors);
 
        TEMP_FREE;
        return rn;
    }
}

引用了 count_factors(), ctz_shl, lmmp_copy, lmmp_debug_assert, lmmp_elem_mul_ulong_(), lmmp_factors_mul_(), lmmp_odd_nPr_product_(), lmmp_param_assert, lmmp_prime_cnt16_(), MP_UCHAR_MAX, mul_1, NPR_SHORT_LIMIT, odd_factorial, ODD_FACTORIAL_SIZE, PERMUTATION_USHORT_TIMES_THRESHOLD, prime_short_table, SALLOC_TYPE, TALLOC_TYPE, TEMP_DECL, TEMP_FREE, TEMP_S_DECL, TEMP_S_FREE , 以及 tp.

被这些函数引用 lmmp_nPr_().

函数调用图:

这是这个函数的调用关系图:

变量说明

◆ odd_factorial

const ulong odd_factorial[25]

static

初始值:

= {1, 1, 3, 3, 15, 45, 315, 315,
                                        2835, 14175, 155925,
                                        467775, 6081075, 42567525,
                                        638512875, 638512875, 10854718875, 97692469875,
                                        1856156927625, 9280784638125, 194896477400625,
                                        2143861251406875, 49308808782358125,
                                        147926426347074375ull, 3698160658676859375ull}

在文件 nPr.c 第 17 行定义.

                                       {1, 1, 3, 3, 15, 45, 315, 315,
                                        2835, 14175, 155925,
                                        467775, 6081075, 42567525,
                                        638512875, 638512875, 10854718875, 97692469875,
                                        1856156927625, 9280784638125, 194896477400625,
                                        2143861251406875, 49308808782358125,
                                        147926426347074375ull, 3698160658676859375ull};

被这些函数引用 lmmp_odd_nPr_ushort_().