#include "../../include/lammp/impl/mparam.h"
#include "../../include/lammp/lmmpn.h"

add_n_sub_n.c 的引用(Include)关系图:

函数
mp_limb_t	lmmp_add_n_sub_n_ (mp_ptr dsta, mp_ptr dstb, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	同时执行n位加法和减法 ([dsta,n],[dstb,n]) = ([numa,n]+[numb,n],[numa,n]-[numb,n])

函数说明

◆ lmmp_add_n_sub_n_()

mp_limb_t lmmp_add_n_sub_n_	(	mp_ptr	dsta,
		mp_ptr	dstb,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

同时执行n位加法和减法 ([dsta,n],[dstb,n]) = ([numa,n]+[numb,n],[numa,n]-[numb,n])

参数

dsta	加法结果输出指针
dstb	减法结果输出指针
numa	第一个操作数指针（被加数/被减数）
numb	第二个操作数指针（加数/减数）
n	limb长度

警告: n>0, eqsep(dsta,[numa|numb]), eqsep(dstb,[numa|numb])

返回: 组合返回值 cb = 2*c + b (c为加法进位, b为减法借位) 返回值范围: 0(无进位无借位),1(无进位有借位),2(有进位无借位),3(有进位有借位)

在文件 add_n_sub_n.c 第 10 行定义.

                                                                                                   {
    /*
    这段代码看起来有点奇怪的原因是，对于使用x64汇编时，我们会使用带进位的加法和减法，而x64中
    只能使用同一个进位寄存器，所以我们需要将两条指令分开执行。
    而不使用汇编时，编译器通常不会使用进位寄存器。因此我们可以同时读取两路内存，以减少读写次数。
    */
#ifdef USE_ASM
    mp_limb_t acyo = 0, scyo = 0;
    mp_size_t off, this_n;
 
    if (dsta != numa && dsta != numb) {
        for (off = 0; off < n; off += PART_SIZE) {
            this_n = LMMP_MIN(n - off, PART_SIZE);
            acyo = lmmp_add_nc_(dsta + off, numa + off, numb + off, this_n, acyo);
            scyo = lmmp_sub_nc_(dstb + off, numa + off, numb + off, this_n, scyo);
        }
    } else if (dstb != numa && dstb != numb) {
        for (off = 0; off < n; off += PART_SIZE) {
            this_n = LMMP_MIN(n - off, PART_SIZE);
            scyo = lmmp_sub_nc_(dstb + off, numa + off, numb + off, this_n, scyo);
            acyo = lmmp_add_nc_(dsta + off, numa + off, numb + off, this_n, acyo);
        }
    } else {
        mp_limb_t tp[PART_SIZE];
        for (off = 0; off < n; off += PART_SIZE) {
            this_n = LMMP_MIN(n - off, PART_SIZE);
            acyo = lmmp_add_nc_(tp, numa + off, numb + off, this_n, acyo);
            scyo = lmmp_sub_nc_(dstb + off, numa + off, numb + off, this_n, scyo);
            lmmp_copy(dsta + off, tp, this_n);
        }
    }
    return 2 * acyo + scyo;
#else
    mp_size_t i;
    mp_limb_t acyo, scyo;
 
    for (i = 0, acyo = 0, scyo = 0; i < n; i++) {
        mp_limb_t a, b, r;
        a = numa[i];
        b = numb[i];
        r = a + acyo;
        acyo = (r < acyo);
        r += b;
        acyo += (r < b);
        dsta[i] = r;
 
        b += scyo;
        scyo = (b < scyo);
        scyo += (a < b);
        dstb[i] = a - b;
    }
    return 2 * acyo + scyo;
#endif
}

引用了 lmmp_add_nc_(), lmmp_copy, LMMP_MIN, lmmp_sub_nc_(), PART_SIZE , 以及 tp.

被这些函数引用 lmmp_mul_toom32_(), lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom43_(), lmmp_mul_toom52_(), lmmp_mul_toom53_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_init_(), lmmp_sqr_toom3_(), lmmp_toom_eval_dgr3_pm1_(), lmmp_toom_eval_dgr3_pm2_(), lmmp_toom_eval_pm1_() , 以及 lmmp_toom_eval_pm2_().

函数调用图:

这是这个函数的调用关系图: