df/d9a/sqr__toom2_8c_source.html

/*

 * LAMMP - Copyright (C) 2025-2026 HJimmyK(Jericho Knox)

 * This file is part of lammp, under the GNU LGPL v2 license.

 * See LICENSE in the project root for the full license text.

 */


#include "../../include/lammp/impl/tmp_alloc.h"

#include "../../include/lammp/lmmpn.h"


/*

Evaluate in: -1, 0, +inf


   <-s--><--n-->

   |-a1-|--a0--|


v0  =  a0    ^2  #   A(0)^2

vm1 = (a0-a1)^2  #  A(-1)^2

vinf=     a1 ^2  # A(inf)^2

*/


void lmmp_sqr_toom2_(mp_ptr restrict dst, mp_srcptr restrict numa, mp_size_t na) {

    lmmp_param_assert(na > 0);

    lmmp_param_assert(dst != NULL);

    lmmp_param_assert(numa!= NULL);

    TEMP_S_DECL;

    mp_size_t s = na >> 1, n = na - s;

    mp_limb_t* vm1 = SALLOC_TYPE(2 * n, mp_limb_t);

    mp_slimb_t cy, cy2;


#define a0 numa

#define a1 (numa + n)

#define asm1 dst


    if (s == n) {

        if (lmmp_cmp_(a0, a1, n) < 0)

            lmmp_sub_n_(asm1, a1, a0, n);

        else

            lmmp_sub_n_(asm1, a0, a1, n);

    } else {  // s==n-1

        if (a0[s] == 0 && lmmp_cmp_(a0, a1, s) < 0) {

            lmmp_sub_n_(asm1, a1, a0, s);

            asm1[s] = 0;

        } else

            asm1[s] = a0[s] - lmmp_sub_n_(asm1, a0, a1, s);

    }


    lmmp_sqr_(vm1, asm1, n);


#undef asm1

#define v0 dst

#define vinf (dst + 2 * n)


    lmmp_sqr_(v0, a0, n);


    lmmp_sqr_(vinf, a1, s);


    cy = lmmp_add_n_(dst + 2 * n, v0 + n, vinf, n);

    cy2 = cy + lmmp_add_n_(dst + n, dst + 2 * n, v0, n);

    cy += lmmp_add_(dst + 2 * n, dst + 2 * n, n, vinf + n, s + s - n);


    cy -= lmmp_sub_n_(dst + n, dst + n, vm1, 2 * n);


    // no overflow.

    lmmp_inc_1(dst + 2 * n, cy2);


    if (cy < 0)

        lmmp_dec(dst + 3 * n);

    else

        lmmp_inc_1(dst + 3 * n, cy);

    TEMP_S_FREE;

}


mp_ptr
mp_limb_t * mp_ptr
Definition lmmp.h:215

mp_size_t
uint64_t mp_size_t
Definition lmmp.h:212

mp_slimb_t
int64_t mp_slimb_t
Definition lmmp.h:213

mp_srcptr
const mp_limb_t * mp_srcptr
Definition lmmp.h:216

mp_limb_t
uint64_t mp_limb_t
Definition lmmp.h:211

lmmp_param_assert
#define lmmp_param_assert(x)
Definition lmmp.h:398

lmmp_add_
static mp_limb_t lmmp_add_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
大数加法静态内联函数 [dst,na]=[numa,na]+[numb,nb]
Definition lmmpn.h:1058

lmmp_cmp_
static int lmmp_cmp_(mp_srcptr numa, mp_srcptr numb, mp_size_t n)
大数比较函数（内联）
Definition lmmpn.h:1004

lmmp_dec
#define lmmp_dec(p)
大数减1宏（预期无借位）
Definition lmmpn.h:973

lmmp_sqr_
void lmmp_sqr_(mp_ptr dst, mp_srcptr numa, mp_size_t na)
大数平方操作 [dst,2*na] = [numa,na]^2
Definition sqr.c:10

lmmp_sub_n_
mp_limb_t lmmp_sub_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无借位的n位减法 [dst,n] = [numa,n] - [numb,n]
Definition sub_n.c:70

lmmp_inc_1
#define lmmp_inc_1(p, inc)
大数加指定值宏（预期无进位）
Definition lmmpn.h:958

lmmp_add_n_
mp_limb_t lmmp_add_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无进位的n位加法 [dst,n] = [numa,n] + [numb,n]
Definition add_n.c:71

vm1
#define vm1

v0
#define v0

a0
#define a0

a1
#define a1

asm1
#define asm1

vinf
#define vinf

lmmp_sqr_toom2_
void lmmp_sqr_toom2_(mp_ptr restrict dst, mp_srcptr restrict numa, mp_size_t na)
Definition sqr_toom2.c:21

SALLOC_TYPE
#define SALLOC_TYPE(n, type)
Definition tmp_alloc.h:87

TEMP_S_DECL
#define TEMP_S_DECL
Definition tmp_alloc.h:76

TEMP_S_FREE
#define TEMP_S_FREE
Definition tmp_alloc.h:105