d3/db2/div_8c_source.html

/*

 * LAMMP - Copyright (C) 2025-2026 HJimmyK(Jericho Knox)

 * This file is part of lammp, under the GNU LGPL v2 license.

 * See LICENSE in the project root for the full license text.

 */


#include "../../include/lammp/impl/tmp_alloc.h"

#include "../../include/lammp/lmmpn.h"

#include "../../include/lammp/impl/mparam.h"


mp_limb_t lmmp_div_s_(mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb) {

    TEMP_DECL;

    mp_limb_t nq = na - nb;

    mp_limb_t qh;

    if (nq == 0) {

        qh = lmmp_cmp_(numa, numb, nb) >= 0;

        if (qh)

            lmmp_sub_n_(numa, numa, numb, nb);

    } else if (nb == 1) {

        qh = lmmp_div_1_s_(dstq, numa, na, *numb);

    } else if (nb == 2) {

        qh = lmmp_div_2_s_(dstq, numa, na, numb);

    } else if (nq < nb) {

        qh = lmmp_div_s_(dstq, numa + na - 2 * nq, 2 * nq, numb + nb - nq, nq);


        mp_ptr tp = TALLOC_TYPE(nb, mp_limb_t);

        if (nq > nb - nq)

            lmmp_mul_(tp, dstq, nq, numb, nb - nq);

        else

            lmmp_mul_(tp, numb, nb - nq, dstq, nq);


        mp_limb_t cy = lmmp_sub_n_(numa, numa, tp, nb);

        if (qh)

            cy += lmmp_sub_n_(numa + nq, numa + nq, numb, nb - nq);


        while (cy) {

            qh -= lmmp_sub_1_(dstq, dstq, nq, 1);

            cy -= lmmp_add_n_(numa, numa, numb, nb);

        }

    } else {

        mp_limb_t inv21 = lmmp_inv_2_1_(numb[nb - 1], numb[nb - 2]);

        if (nb < DIV_DIVIDE_THRESHOLD)

            qh = lmmp_div_basecase_(dstq, numa, na, numb, nb, inv21);

        else if (nb < DIV_MULINV_L_THRESHOLD || na < 2 * DIV_MULINV_N_THRESHOLD)

            qh = lmmp_div_divide_(dstq, numa, na, numb, nb, inv21);

        else {

            mp_limb_t ni = lmmp_div_inv_size_(nq, nb);

            mp_ptr invappr = TALLOC_TYPE(ni, mp_limb_t);

            lmmp_inv_prediv_(invappr, numb, nb, ni);

            qh = lmmp_div_mulinv_(dstq, numa, na, numb, nb, invappr, ni);

        }

    }

    TEMP_FREE;

    return qh;

}


void lmmp_div_(mp_ptr dstq, mp_ptr dstr, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb) {

    if (nb == 1) {

        mp_limb_t rem = lmmp_div_1_(dstq, numa, na, *numb);

        if (dstr)

            *dstr = rem;

    } else if (nb == 2) {

        mp_limb_t brem[2];

        brem[0] = numb[0];

        brem[1] = numb[1];

        lmmp_div_2_(dstq, numa, na, brem);

        if (dstr) {

            dstr[0] = brem[0];

            dstr[1] = brem[1];

        }

    } else {

        int adjust = numa[na - 1] >= numb[nb - 1];

        int cnt = lmmp_leading_zeros_(numb[nb - 1]);

        mp_size_t nq = na + adjust - nb;

        if (nq == 0) {

            if (dstr && dstr != numa)

                lmmp_copy(dstr, numa, nb);

            if (dstq)

                dstq[0] = 0;

            return;

        }

        TEMP_DECL;


        if (!dstq)

            dstq = TALLOC_TYPE(na - nb + 1, mp_limb_t);

        dstq[na - nb] = 0;


        if (nq >= nb) {

            mp_ptr numa2 = TALLOC_TYPE(na + 1, mp_limb_t);

            mp_ptr numb2;

            if (cnt) {

                numa2[na] = lmmp_shl_(numa2, numa, na, cnt);

                numb2 = TALLOC_TYPE(nb, mp_limb_t);

                lmmp_shl_(numb2, numb, nb, cnt);

            } else {

                numa2[na] = 0;

                lmmp_copy(numa2, numa, na);

                numb2 = (mp_ptr)numb;

            }


            mp_limb_t inv21 = lmmp_inv_2_1_(numb2[nb - 1], numb2[nb - 2]);

            na += adjust;


            if (nb < DIV_DIVIDE_THRESHOLD)

                lmmp_div_basecase_(dstq, numa2, na, numb2, nb, inv21);

            else if (nb < DIV_MULINV_L_THRESHOLD || na < 2 * DIV_MULINV_N_THRESHOLD)

                lmmp_div_divide_(dstq, numa2, na, numb2, nb, inv21);

            else {

                mp_limb_t ni = lmmp_div_inv_size_(nq, nb);

                mp_ptr invappr = TALLOC_TYPE(ni, mp_limb_t);

                lmmp_inv_prediv_(invappr, numb2, nb, ni);

                lmmp_div_mulinv_(dstq, numa2, na, numb2, nb, invappr, ni);

            }


            if (dstr) {

                if (cnt)

                    lmmp_shr_(dstr, numa2, nb, cnt);

                else

                    lmmp_copy(dstr, numa2, nb);

            }

        } else {

            // nq=na-nb+adj<nb

            //-> na+adj>=2nq+1

            mp_size_t ni = nb - nq;

            mp_ptr numa2, numb2;

            mp_ptr tp = TALLOC_TYPE(nb, mp_limb_t);

            mp_limb_t cy;


            numa2 = TALLOC_TYPE(nq * 2 + 1, mp_limb_t);

            if (cnt) {

                numb2 = TALLOC_TYPE(nq, mp_limb_t);

                lmmp_shl_(numb2, numb + ni, nq, cnt);

                numb2[0] |= numb[ni - 1] >> (LIMB_BITS - cnt);

                cy = lmmp_shl_(numa2, numa + na - 2 * nq, 2 * nq, cnt);

                if (adjust) {

                    numa2[2 * nq] = cy;

                    ++numa2;  // numa2[0] is as significant as numa[ni=na-2nq+adjust]

                } else

                    numa2[0] |= numa[na - 2 * nq - 1] >> (LIMB_BITS - cnt);

            } else {

                numb2 = (mp_ptr)numb + ni;

                lmmp_copy(numa2, numa + na - 2 * nq, 2 * nq);

                if (adjust) {

                    numa2[2 * nq] = 0;

                    ++numa2;

                }

            }


            // now: 0<=numa2<B^2nq, B^nq/2<=numb2<B^nq, and 0<=numa2/numb2<B^nq

            // ignored bits could be seen as fraction part of numa and numb

            // we can prove:  Q<=Qh<=Q+2

            // where Q=floor(numa/numb) is the real quotient

            // Qh=floor(floor(numa)/floor(numb)) as below


            if (nq == 1) {

                lmmp_div_1_s_(dstq, numa2, 2, *numb2);

            } else if (nq == 2) {

                lmmp_div_2_s_(dstq, numa2, 4, numb2);

            } else {

                mp_limb_t inv21 = lmmp_inv_2_1_(numb2[nq - 1], numb2[nq - 2]);


                if (nq < DIV_DIVIDE_THRESHOLD)

                    lmmp_div_basecase_(dstq, numa2, 2 * nq, numb2, nq, inv21);

                else if (nq < DIV_MULINV_N_THRESHOLD)

                    lmmp_div_divide_(dstq, numa2, 2 * nq, numb2, nq, inv21);

                else {

                    mp_limb_t ni = lmmp_div_inv_size_(nq, nq);

                    mp_ptr invappr = tp;

                    lmmp_inv_prediv_(invappr, numb2, nq, ni);

                    lmmp_div_mulinv_(dstq, numa2, 2 * nq, numb2, nq, invappr, ni);

                }

            }

            /*

            true remainder = partial remainder - quotient * ignored divisor limbs


            Multiply the first ignored divisor limb by the most significant

            quotient limb.  If that product is > the partial remainder's

            most significant limb, we know the quotient is too large.  This

            test quickly catches most cases where the quotient is too large;

            it catches all cases where the quotient is 2 too large.*/


            mp_limb_t x;

            if (cnt) {

                mp_limb_t dl;

                if (ni < 2)

                    dl = 0;

                else

                    dl = numb[ni - 2];

                x = (numb[ni - 1] << cnt) | (dl >> (LIMB_BITS - cnt));

            } else

                x = numb[ni - 1];

            mp_limb_t h = (x >> LIMB_BITS / 2) * (dstq[nq - 1] >> LIMB_BITS / 2);

            mp_limb_t rnb = 0;  // remainder[nb]

            mp_size_t nr = nq;  // remainder=rnb:[numa2,nr]:[...,ni]


            if (h > numa2[nq - 1]) {

                lmmp_dec(dstq);

                rnb = lmmp_add_n_(numa2, numa2, numb2, nq);

            }


            // if cnt, recover the shift of partial remainder

            // and remove the effect of the partial-ignored numa[ni-1] and numb[ni-1]

            if (cnt) {

                numa2[nq] = rnb;

                ++nr;

                --ni;

                lmmp_shl_(numa2, numa2, nr, LIMB_BITS - cnt);

                numa2[0] |= numa[ni] & (LIMB_MAX >> cnt);

                cy = lmmp_submul_1_(numa2, dstq, nq, numb[ni] & (LIMB_MAX >> cnt));

                rnb = -(numa2[nq] < cy);

                numa2[nq] -= cy;

            }


            if (ni == 0) {

                if (dstr) {

                    if (rnb)

                        lmmp_add_n_(dstr, numa2, numb, nr);

                    else

                        lmmp_copy(dstr, numa2, nr);

                }

            } else {

                tp[nb - 1] = 0;

                if (ni < nq)

                    lmmp_mul_(tp, dstq, nq, numb, ni);

                else

                    lmmp_mul_(tp, numb, ni, dstq, nq);


                if (dstr) {

                    mp_ptr remptr = dstr == numb ? tp : dstr;

                    cy = lmmp_sub_n_(remptr, numa, tp, ni);

                    rnb -= lmmp_sub_nc_(remptr + ni, numa2, tp + ni, nr, cy);

                    if (rnb)

                        lmmp_add_n_(dstr, remptr, numb, nb);

                    else if (dstr != remptr)

                        lmmp_copy(dstr, remptr, nb);

                } else {

                    int hcmp = lmmp_cmp_(numa2, tp + ni, nr);

                    if (hcmp < 0)

                        --rnb;

                    else if (hcmp == 0)

                        rnb -= (lmmp_cmp_(numa, tp, ni) < 0);

                }

            }


            if (rnb)

                lmmp_dec(dstq);

        }


        TEMP_FREE;

    }

}


lmmp_div_s_
mp_limb_t lmmp_div_s_(mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
除法运算
Definition div.c:11

lmmp_div_
void lmmp_div_(mp_ptr dstq, mp_ptr dstr, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
大数除法和取模操作
Definition div.c:57

mp_ptr
mp_limb_t * mp_ptr
Definition lmmp.h:215

lmmp_copy
#define lmmp_copy(dst, src, n)
Definition lmmp.h:364

mp_size_t
uint64_t mp_size_t
Definition lmmp.h:212

mp_srcptr
const mp_limb_t * mp_srcptr
Definition lmmp.h:216

LIMB_MAX
#define LIMB_MAX
Definition lmmp.h:224

mp_limb_t
uint64_t mp_limb_t
Definition lmmp.h:211

LIMB_BITS
#define LIMB_BITS
Definition lmmp.h:221

lmmp_div_inv_size_
static mp_size_t lmmp_div_inv_size_(mp_size_t nq, mp_size_t nb)
计算预计算逆元的尺寸
Definition lmmpn.h:812

lmmp_div_1_s_
mp_limb_t lmmp_div_1_s_(mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_limb_t x)
单精度数除法（除数为1个limb）

lmmp_div_1_
mp_limb_t lmmp_div_1_(mp_ptr dstq, mp_srcptr numa, mp_size_t na, mp_limb_t x)
单精度数除法
Definition div.c:66

lmmp_leading_zeros_
int lmmp_leading_zeros_(mp_limb_t x)
计算一个单精度数(limb)中前导零的个数
Definition tiny.c:35

lmmp_cmp_
static int lmmp_cmp_(mp_srcptr numa, mp_srcptr numb, mp_size_t n)
大数比较函数（内联）
Definition lmmpn.h:1004

lmmp_dec
#define lmmp_dec(p)
大数减1宏（预期无借位）
Definition lmmpn.h:973

lmmp_inv_prediv_
void lmmp_inv_prediv_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t ni)
除法前的逆元预计算，[dst,ni] = invappr( (ni+1 MSLs of numa) + 1 ) / B
Definition div_mulinv.c:11

lmmp_div_2_
void lmmp_div_2_(mp_ptr dstq, mp_srcptr numa, mp_size_t na, mp_ptr numb)
双精度数除法 (除数为2个limb)
Definition div.c:223

lmmp_shr_
mp_limb_t lmmp_shr_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shr)
大数右移操作 [dst,na] = [numa,na] >> shr，dst的高shr位填充0
Definition shr.c:9

lmmp_mul_
void lmmp_mul_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
不等长大数乘法操作 [dst,na+nb] = [numa,na] * [numb,nb]

lmmp_shl_
mp_limb_t lmmp_shl_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shl)
大数左移操作 [dst,na] = [numa,na]<<shl，dst的低shl位填充0
Definition shl.c:9

lmmp_div_mulinv_
mp_limb_t lmmp_div_mulinv_(mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb, mp_srcptr invappr, mp_size_t ni)
乘法逆元除法
Definition div_mulinv.c:36

lmmp_sub_1_
static mp_limb_t lmmp_sub_1_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_limb_t x)
大数减单精度数静态内联函数 [dst,na]=[numa,na]-x
Definition lmmpn.h:1122

lmmp_div_2_s_
mp_limb_t lmmp_div_2_s_(mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb)
双精度数除法（除数为2个limb）

lmmp_submul_1_
mp_limb_t lmmp_submul_1_(mp_ptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t b)
大数乘以单limb并累减操作 [numa,n] -= [numb,n] * b

lmmp_sub_n_
mp_limb_t lmmp_sub_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无借位的n位减法 [dst,n] = [numa,n] - [numb,n]
Definition sub_n.c:70

lmmp_inv_2_1_
mp_limb_t lmmp_inv_2_1_(mp_limb_t xh, mp_limb_t xl)
2-1阶逆元计算 (inv21)
Definition inv.c:10

lmmp_div_basecase_
mp_limb_t lmmp_div_basecase_(mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb, mp_limb_t inv21)
基础除法运算
Definition div_basecase.c:10

lmmp_sub_nc_
mp_limb_t lmmp_sub_nc_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t c)
带借位的n位减法 [dst,n] = [numa,n] - [numb,n] - c
Definition sub_n.c:9

lmmp_div_divide_
mp_limb_t lmmp_div_divide_(mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb, mp_limb_t inv21)
分治除法运算
Definition div_divide.c:53

lmmp_add_n_
mp_limb_t lmmp_add_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无进位的n位加法 [dst,n] = [numa,n] + [numb,n]
Definition add_n.c:71

DIV_DIVIDE_THRESHOLD
#define DIV_DIVIDE_THRESHOLD
Definition mparam.h:26

DIV_MULINV_N_THRESHOLD
#define DIV_MULINV_N_THRESHOLD
Definition mparam.h:30

DIV_MULINV_L_THRESHOLD
#define DIV_MULINV_L_THRESHOLD
Definition mparam.h:28

tp
#define tp

TEMP_DECL
#define TEMP_DECL
Definition tmp_alloc.h:72

TEMP_FREE
#define TEMP_FREE
Definition tmp_alloc.h:93

TALLOC_TYPE
#define TALLOC_TYPE(n, type)
Definition tmp_alloc.h:91