de/d10/mul__toom22_8c_source.html

/*

 * LAMMP - Copyright (C) 2025-2026 HJimmyK(Jericho Knox)

 * This file is part of lammp, under the GNU LGPL v2 license.

 * See LICENSE in the project root for the full license text.

 */


#include "../../include/lammp/impl/tmp_alloc.h"

#include "../../include/lammp/lmmpn.h"


/*

Evaluate in: -1, 0, +inf


   <-s--><--n-->

   |-a1-|--a0--|

    |b1-|--b0--|

    <-t-><--n-->


v0  =  a0    * b0      #   A(0)*B(0)

vm1 = (a0-a1)*(b0-b1)  #  A(-1)*B(-1)

vinf=     a1 *    b1   # A(inf)*B(inf)

*/


void lmmp_mul_toom22_(mp_ptr restrict dst, mp_srcptr restrict numa, mp_size_t na, mp_srcptr restrict numb, mp_size_t nb) {

    lmmp_param_assert(nb >= 5);

    lmmp_param_assert(na >= nb);

    lmmp_param_assert(4 * na <= 5 * nb);

    TEMP_S_DECL;

    mp_size_t s = na >> 1, n = na - s, t = nb - n;

    mp_limb_t* restrict vm1 = SALLOC_TYPE(2 * n, mp_limb_t);

    int vm1_neg = 0;

    mp_slimb_t cy, cy2;


#define a0 numa

#define a1 (numa + n)

#define b0 numb

#define b1 (numb + n)

#define asm1 dst

#define bsm1 (dst + n)


    if (s == n) {

        if (lmmp_cmp_(a0, a1, n) < 0) {

            lmmp_sub_n_(asm1, a1, a0, n);

            vm1_neg = 1;

        } else

            lmmp_sub_n_(asm1, a0, a1, n);

    } else {  // s==n-1

        if (a0[s] == 0 && lmmp_cmp_(a0, a1, s) < 0) {

            lmmp_sub_n_(asm1, a1, a0, s);

            asm1[s] = 0;

            vm1_neg = 1;

        } else

            asm1[s] = a0[s] - lmmp_sub_n_(asm1, a0, a1, s);

    }


    if (t == n) {

        if (lmmp_cmp_(b0, b1, n) < 0) {

            lmmp_sub_n_(bsm1, b1, b0, n);

            vm1_neg ^= 1;

        } else

            lmmp_sub_n_(bsm1, b0, b1, n);

    } else {

        if (lmmp_zero_q_(b0 + t, n - t) && lmmp_cmp_(b0, b1, t) < 0) {

            lmmp_sub_n_(bsm1, b1, b0, t);

            lmmp_zero(bsm1 + t, n - t);

            vm1_neg ^= 1;

        } else

            lmmp_sub_(bsm1, b0, n, b1, t);

    }


    lmmp_mul_n_(vm1, asm1, bsm1, n);


#undef asm1

#undef bsm1

#define v0 dst

#define vinf (dst + 2 * n)


    lmmp_mul_n_(v0, a0, b0, n);


    lmmp_mul_(vinf, a1, s, b1, t);


    cy = lmmp_add_n_(dst + 2 * n, v0 + n, vinf, n);

    cy2 = cy + lmmp_add_n_(dst + n, dst + 2 * n, v0, n);

    cy += lmmp_add_(dst + 2 * n, dst + 2 * n, n, vinf + n, s + t - n);


    if (vm1_neg)

        cy += lmmp_add_n_(dst + n, dst + n, vm1, 2 * n);

    else

        cy -= lmmp_sub_n_(dst + n, dst + n, vm1, 2 * n);


    // no overflow, if s+t>n. proved.

    lmmp_inc_1(dst + 2 * n, cy2);


    if (cy < 0)

        lmmp_dec(dst + 3 * n);

    else

        lmmp_inc_1(dst + 3 * n, cy);

    TEMP_S_FREE;

}


mp_ptr
mp_limb_t * mp_ptr
Definition lmmp.h:215

lmmp_zero
#define lmmp_zero(dst, n)
Definition lmmp.h:366

mp_size_t
uint64_t mp_size_t
Definition lmmp.h:212

mp_slimb_t
int64_t mp_slimb_t
Definition lmmp.h:213

mp_srcptr
const mp_limb_t * mp_srcptr
Definition lmmp.h:216

mp_limb_t
uint64_t mp_limb_t
Definition lmmp.h:211

lmmp_param_assert
#define lmmp_param_assert(x)
Definition lmmp.h:398

lmmp_add_
static mp_limb_t lmmp_add_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
大数加法静态内联函数 [dst,na]=[numa,na]+[numb,nb]
Definition lmmpn.h:1058

lmmp_cmp_
static int lmmp_cmp_(mp_srcptr numa, mp_srcptr numb, mp_size_t n)
大数比较函数（内联）
Definition lmmpn.h:1004

lmmp_dec
#define lmmp_dec(p)
大数减1宏（预期无借位）
Definition lmmpn.h:973

lmmp_mul_
void lmmp_mul_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
不等长大数乘法操作 [dst,na+nb] = [numa,na] * [numb,nb]

lmmp_mul_n_
void lmmp_mul_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
等长大数乘法操作 [dst,2*n] = [numa,n] * [numb,n]
Definition mul.c:99

lmmp_sub_
static mp_limb_t lmmp_sub_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
大数减法静态内联函数 [dst,na]=[numa,na]-[numb,nb]
Definition lmmpn.h:1072

lmmp_sub_n_
mp_limb_t lmmp_sub_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无借位的n位减法 [dst,n] = [numa,n] - [numb,n]
Definition sub_n.c:70

lmmp_inc_1
#define lmmp_inc_1(p, inc)
大数加指定值宏（预期无进位）
Definition lmmpn.h:958

lmmp_add_n_
mp_limb_t lmmp_add_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无进位的n位加法 [dst,n] = [numa,n] + [numb,n]
Definition add_n.c:71

lmmp_zero_q_
static int lmmp_zero_q_(mp_srcptr p, mp_size_t n)
大数判零函数（内联）
Definition lmmpn.h:1027

lmmp_mul_toom22_
void lmmp_mul_toom22_(mp_ptr restrict dst, mp_srcptr restrict numa, mp_size_t na, mp_srcptr restrict numb, mp_size_t nb)
Definition mul_toom22.c:23

b0
#define b0

v0
#define v0

b1
#define b1

bsm1
#define bsm1

a0
#define a0

a1
#define a1

asm1
#define asm1

vinf
#define vinf

vm1
#define vm1

SALLOC_TYPE
#define SALLOC_TYPE(n, type)
Definition tmp_alloc.h:87

TEMP_S_DECL
#define TEMP_S_DECL
Definition tmp_alloc.h:76

TEMP_S_FREE
#define TEMP_S_FREE
Definition tmp_alloc.h:105