d0/de3/sqr__toom3_8c_source.html

/*

 * LAMMP - Copyright (C) 2025-2026 HJimmyK(Jericho Knox)

 * This file is part of lammp, under the GNU LGPL v2 license.

 * See LICENSE in the project root for the full license text.

 */


#include "../../include/lammp/lmmpn.h"

#include "../../include/lammp/impl/toom_interp.h"


/*

Evaluate in: -1, 0, +1, +2, +inf


  <-s--><--n--><--n-->

  |-a2-|--a1--|--a0--|


v0  =  a0         *^2 #   A(0)^2

v1  = (a0+ a1+ a2)*^2 #   A(1)^2    ah  <= 2

vm1 = (a0- a1+ a2)*^2 #  A(-1)^2   |ah| <= 1

v2  = (a0+2a1+4a2)*^2 #   A(2)^2    ah  <= 6

vinf=          a2 *^2 # A(inf)^2

*/


void lmmp_sqr_toom3_(mp_ptr restrict dst, mp_srcptr restrict numa, mp_size_t na) {

    lmmp_param_assert(na > 0);

    lmmp_param_assert(numa != NULL);

    lmmp_param_assert(dst != NULL);

    TEMP_S_DECL;

    mp_size_t n = (na + 2) / 3, s = na - 2 * n;

    mp_limb_t cy, cy2, vinf0, am1h;

    mp_limb_t* restrict tp = SALLOC_TYPE(4 * n + 4, mp_limb_t);


#define a0 numa

#define a1 (numa + n)

#define a2 (numa + 2 * n)


#define v0 dst               //[dst,2*n]

#define v1 (dst + 2 * n)     //[dst+2*n,2*n+1]

#define vinf (dst + 4 * n)   //[dst+4*n,s+t]

#define vm1 tp               //[tp,2*n+1]

#define v2 (tp + 2 * n + 2)  //[tp+2*n+2,2*n+1]


#define am1 (dst)  //[dst,n]

#define ap1 tp     //[tp,n+1]

#define ap2 ap1    // same space


    // ap1, am1

    cy = lmmp_add_(ap1, a0, n, a2, s);

    if (cy == 0 && lmmp_cmp_(ap1, a1, n) < 0) {

        cy = lmmp_add_n_sub_n_(ap1, am1, a1, ap1, n);

        ap1[n] = cy >> 1;

        am1h = 0;

    } else {

        cy2 = lmmp_add_n_sub_n_(ap1, am1, ap1, a1, n);

        ap1[n] = cy + (cy2 >> 1);

        am1h = cy - (cy2 & 1);

    }


    // vinf

    lmmp_sqr_(vinf, a2, s);

    vinf0 = vinf[0];  // overlap with v1

    cy = vinf[1];     // overlap with v1


    // v1

    lmmp_sqr_(v1, ap1, n + 1);

    vinf[1] = cy;  // restore, since v1[2*n+1]==0.


    // ap2

    cy = lmmp_addshl1_n_(ap2, a1, a2, s);

    if (s != n)

        cy = lmmp_add_1_(ap2 + s, a1 + s, n - s, cy);

    cy = 2 * cy + lmmp_addshl1_n_(ap2, a0, ap2, n);

    ap2[n] = cy;


    // v2

    lmmp_sqr_(v2, ap2, n + 1);


    // vm1

    lmmp_sqr_(vm1, am1, n);

    if (am1h)

        am1h += lmmp_addshl1_n_(vm1 + n, vm1 + n, am1, n);

    vm1[2 * n] = am1h;


    // v0

    lmmp_sqr_(v0, a0, n);


    lmmp_toom_interp5_(dst, v2, vm1, n, s + s, 0, vinf0);

    TEMP_S_FREE;

}


mp_ptr
mp_limb_t * mp_ptr
Definition lmmp.h:215

mp_size_t
uint64_t mp_size_t
Definition lmmp.h:212

mp_srcptr
const mp_limb_t * mp_srcptr
Definition lmmp.h:216

mp_limb_t
uint64_t mp_limb_t
Definition lmmp.h:211

lmmp_param_assert
#define lmmp_param_assert(x)
Definition lmmp.h:398

lmmp_add_
static mp_limb_t lmmp_add_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
大数加法静态内联函数 [dst,na]=[numa,na]+[numb,nb]
Definition lmmpn.h:1058

lmmp_cmp_
static int lmmp_cmp_(mp_srcptr numa, mp_srcptr numb, mp_size_t n)
大数比较函数（内联）
Definition lmmpn.h:1004

lmmp_add_1_
static mp_limb_t lmmp_add_1_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_limb_t x)
大数加单精度数静态内联函数 [dst,na]=[numa,na]+x
Definition lmmpn.h:1111

lmmp_sqr_
void lmmp_sqr_(mp_ptr dst, mp_srcptr numa, mp_size_t na)
大数平方操作 [dst,2*na] = [numa,na]^2
Definition sqr.c:10

lmmp_addshl1_n_
mp_limb_t lmmp_addshl1_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
加法结合左移1位操作 [dst,n] = [numa,n] + ([numb,n] << 1)
Definition shl.c:56

lmmp_add_n_sub_n_
mp_limb_t lmmp_add_n_sub_n_(mp_ptr dsta, mp_ptr dstb, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
同时执行n位加法和减法 ([dsta,n],[dstb,n]) = ([numa,n]+[numb,n],[numa,n]-[numb,n])
Definition add_n_sub_n.c:10

tp
#define tp

ap2
#define ap2

v0
#define v0

am1
#define am1

ap1
#define ap1

v2
#define v2

vm1
#define vm1

a2
#define a2

a0
#define a0

a1
#define a1

vinf
#define vinf

v1
#define v1

lmmp_sqr_toom3_
void lmmp_sqr_toom3_(mp_ptr restrict dst, mp_srcptr restrict numa, mp_size_t na)
Definition sqr_toom3.c:23

SALLOC_TYPE
#define SALLOC_TYPE(n, type)
Definition tmp_alloc.h:87

TEMP_S_DECL
#define TEMP_S_DECL
Definition tmp_alloc.h:76

TEMP_S_FREE
#define TEMP_S_FREE
Definition tmp_alloc.h:105

lmmp_toom_interp5_
void lmmp_toom_interp5_(mp_ptr dst, mp_ptr v2, mp_ptr vm1, mp_size_t n, mp_size_t spt, int vm1_neg, mp_limb_t vinf0)
Toom插值计算（5点插值），用于Toom-33和Toom-42乘法算法
Definition mul_toom_interp5.c:10