( hg2ecz | 2021. 06. 15., k – 21:33 )

1 félösszeadó + 7 teljes összeadó.
Félösszeadó: xor az érték and a carry.

LD    IN_A0
XNOR  IN_B0
STOC  OUT_0

LD   IN_A0
AND  IN_B0
STO  CARRYREG

És készen van az alsó bit. De ebből lehet hogy egyik load megspórolható. Még nem vagyok benne biztos.
A teljes összeadó legrosszabb esetben 13 órajel, többet nem tudtam optimalizálni.

Összesen egy 8 bites szám összeadása 97 órajel. Ha 1 MHz-en jár, akkor 10.000 darabot megcsinál másodpercenként.
A CPLD-s vagy TTL IC-kből összerakott verziót ha 7 MHz-es órajelen járatjuk, akkor 70.000 darab ... ahogy a C64 esetén.
clc; lda $RAM1; adc $RAM2; sta $RAM3 ... 70.000 összeadás/másodperc @ 980 kHz.