d6/d50/pow__basecase_8c_source.html

/*

 * LAMMP - Copyright (C) 2025-2026 HJimmyK(Jericho Knox)

 * This file is part of lammp, under the GNU LGPL v2 license.

 * See LICENSE in the project root for the full license text.

 */


#include "../../../include/lammp/impl/mparam.h"

#include "../../../include/lammp/impl/tmp_alloc.h"

#include "../../../include/lammp/lmmpn.h"

#include "../../../include/lammp/numth.h"


#define mul_b(_i_)                                 \

    lmmp_mul_(dst, sq, rn, b##_i_, b##_i_##n);     \

    rn += b##_i_##n;                               \

    rn -= (dst[rn - 1] == 0) ? 1 : 0


mp_size_t lmmp_pow_basecase_(mp_ptr restrict dst, mp_size_t rn, mp_srcptr restrict base, mp_size_t n, ulong exp) {

    lmmp_param_assert(exp >= 3);

    lmmp_param_assert(exp % 2 == 1);

    TEMP_DECL;


#define b1 base

#define b1n n

    mp_ptr restrict sq = TALLOC_TYPE(rn, mp_limb_t);

    rn = n;

    lmmp_copy(dst, base, n);

    lmmp_sqr_(sq, dst, rn);

    rn <<= 1;

    rn -= (sq[rn - 1] == 0) ? 1 : 0;

    int lz = lmmp_leading_zeros_(exp);

    int i = 62 - lz;

    exp <<= lz + 1;

/*

    For the intermediate 0, we will skip it entirely until the next 1,

    and then perform a multiplication. This can reduce the extra copying

    caused by sparse 1s and improve efficiency.

 */

    for ( ; i > 0; ) {

        lz = lmmp_leading_zeros_(exp);

        if (lz == 0) {

            mul_b(1);


            lmmp_sqr_(sq, dst, rn);

            rn <<= 1;

            rn -= (sq[rn - 1] == 0) ? 1 : 0;

            --i;

            exp <<= 1;

        } else {

            int j = 2;

            if (lz & 1) {

                lmmp_copy(dst, sq, rn);

                lmmp_sqr_(sq, dst, rn);

                rn <<= 1;

                rn -= (sq[rn - 1] == 0);

                ++j;

                for (; j <= lz; j += 2) {

                    lmmp_sqr_(dst, sq, rn);

                    rn <<= 1;

                    rn -= (dst[rn - 1] == 0);

                    lmmp_sqr_(sq, dst, rn);

                    rn <<= 1;

                    rn -= (sq[rn - 1] == 0);

                }

            } else {

                for (; j <= lz; j += 2) {

                    lmmp_sqr_(dst, sq, rn);

                    rn <<= 1;

                    rn -= (dst[rn - 1] == 0);

                    lmmp_sqr_(sq, dst, rn);

                    rn <<= 1;

                    rn -= (sq[rn - 1] == 0);

                }

            }


            i -= lz;

            exp <<= lz;

        }

    }

    lmmp_debug_assert(exp == LIMB_B_2);


    mul_b(1);


    TEMP_FREE;

    return rn;


#undef b1

#undef b1n

#undef new_b

}


mp_ptr
mp_limb_t * mp_ptr
Definition lmmp.h:215

lmmp_copy
#define lmmp_copy(dst, src, n)
Definition lmmp.h:364

mp_size_t
uint64_t mp_size_t
Definition lmmp.h:212

lmmp_debug_assert
#define lmmp_debug_assert(x)
Definition lmmp.h:387

mp_srcptr
const mp_limb_t * mp_srcptr
Definition lmmp.h:216

mp_limb_t
uint64_t mp_limb_t
Definition lmmp.h:211

lmmp_param_assert
#define lmmp_param_assert(x)
Definition lmmp.h:398

lmmp_leading_zeros_
int lmmp_leading_zeros_(mp_limb_t x)
计算一个单精度数(limb)中前导零的个数
Definition tiny.c:35

lmmp_sqr_
void lmmp_sqr_(mp_ptr dst, mp_srcptr numa, mp_size_t na)
大数平方操作 [dst,2*na] = [numa,na]^2
Definition sqr.c:10

LIMB_B_2
#define LIMB_B_2
Definition mparam.h:160

ulong
uint64_t ulong
Definition numth.h:36

lmmp_pow_basecase_
mp_size_t lmmp_pow_basecase_(mp_ptr restrict dst, mp_size_t rn, mp_srcptr restrict base, mp_size_t n, ulong exp)
Definition pow_basecase.c:17

mul_b
#define mul_b(_i_)
Definition pow_basecase.c:12

TEMP_DECL
#define TEMP_DECL
Definition tmp_alloc.h:72

TEMP_FREE
#define TEMP_FREE
Definition tmp_alloc.h:93

TALLOC_TYPE
#define TALLOC_TYPE(n, type)
Definition tmp_alloc.h:91