Nguyên lý và Thiết kế của Prefix adder

Thứ Sáu, 19 tháng 04, 2024

Prefix adder là một biến thể của bộ cộng (adder), có chung chức năng là cộng 2 số A và B (rộng N bit), kèm theo nhớ vào Cin (1 bit), và trả về tổng S (rộng N bit) và nhớ ra Cout (1 bit). So với bộ cộng đơn giản (ripple-carry adder), prefix adder có delay theo hàm log, nhanh hơn so với delay tuyến tính (linear) của ripple-carry adder, đặc biệt khi N càng lớn.

I. Ripple-carry adder

Ripple-carry adder là dạng bộ cộng đơn giản nhất, được tạo ra bằng cách nối N full adder (FA) lại với nhau, Cout của FA trước nối Cin của FA sau.

Khi cộng, bit nhớ C[0] đầu tiên phải đi qua FA thứ nhất biến thành C[1], rồi đi qua FA thứ hai để biến thành C[2],… Sau khi bit nhớ đó đi qua tất cả các FA, chúng ta mới có kết quả cuối cùng. Do số lượng FA cần phải đi qua là N, delay của bộ cộng này là tuyến tính. Nếu N tăng thêm 2 lần, delay cũng sẽ tăng thêm 2 lần.

II. Sinh nhớ (Generate) và Truyền nhớ (Propagate)

Chúng ta có thể thấy rằng việc tính toán các bit nhớ C[i] là trở ngại lớn nhất trong bộ cộng. Nếu chúng ta biết được hết các bit nhớ C[0],C[1],C[2],..., chúng ta có thể cộng mỗi bit một cách riêng lẻ bằng cổng XOR:

S[i] = A[i] ^ B[i] ^ C[i]

Tuy nhiên, làm thế nào để có thể biết được hết các bit nhớ cùng một lúc? Chúng ta sẽ tạo ra một logic riêng để tính toán các bit nhớ này một cách nhanh nhất.

Với mỗi bit i (từ 0 tới N-1), ta tạo ra 2 biến:

  • G[i]: bằng 1 nếu bit i sinh nhớ (generate), khi mà Cout = C[i+1] của bit này luôn bằng 1, bất kể giá trị của Cin = C[i]. Đơn giản là G[i] = Cout khi Cin = 0.
  • P[i]: bằng 1 nếu bit i truyền nhớ (propagate), khi mà Cout của bit này có thể bằng 1, tùy vào Cin. Đơn giản là P[i] = Cout khi Cin = 1.

Hai biến G[i] và P[i] chỉ phụ thuộc vào A[i] và B[i] mà không phụ thuộc vào C[i] (xem bảng). Do đó, chúng có thể được tính ngay khi ta nhận được A và B mà không cần phải chờ vào các bit nhớ C[i].

A[i]B[i]G[i] = Cout khi Cin = 0P[i] = Cout khi Cin = 1
0000
0101
1001
1111
G[i] = A[i] & B[i]
P[i] = A[i] | B[i]

Với G[i] và P[i], ta có thể tính bit nhớ bằng công thức:

C[i+1] = G[i] | P[i] & C[i]

Công thức này nghĩa là C[i+1] = 1 nếu bit nhớ được sinh ra ngay tại đây (G[i] = 1), hoặc là nó được truyền từ bit trước (P[i] = 1) và bit trước có nhớ (C[i] = 1). Sử dụng công thức này, ta có thể vẽ lại mạch như sau:

Mặc dù G[i] và P[i] được tính toán một cách song song ở mỗi bit, chúng ta vẫn phải chờ C[0] để tính C[1], chờ C[1] để tính C[2],… Như vậy, C[i] vẫn phải đi qua N cụm AND-OR (màu đỏ trong hình), và delay của mạch này vẫn là tuyến tính.

III. Generate và Propagate trên khoảng

Ngoài G[i] và P[i] cho từng bit, chúng ta cũng có G[j:i] và P[j:i] cho một khoảng bit từ bit j đến bit i:

  • G[j:i] = 1 nếu C[j+1] luôn bằng 1, tức G[j:i] = C[j+1] khi C[i] = 0.
  • P[j:i] = 1 nếu C[j+1] có thể bằng 1, tức P[j:i] = C[j+1] khi C[i] = 1.

Tương tự với trường hợp 1 bit, ta có:

C[j+1] = G[j:i] | P[j:i] & C[i]

Bằng cách khai triển công thức ở trên, ta có thể tính được G[j:i] và P[j:i] dựa trên G[j],...,G[i] và P[j],...,P[i]. Ví dụ:

C[i+2] = G[i+1] | P[i+1] & C[i+1]
       = G[i+1] | P[i+1] & (G[i] | P[i] & C[i])
       = (G[i+1] | P[i+1] & G[i]) | (P[i+1] & P[i]) & C[i]

Do đó,

G[i+1:i] = G[i+1] | P[i+1] & G[i]
P[i+1:i] = P[i+1] & P[i]
C[i+2]   = G[i+1:i] | P[i+1:i] & C[i]

Tương tự, ta có thể tách G[j:i] thành 2 phần G[j:k] và G[k-1:i] sử dụng chung công thức:

G[j:i] = G[j:k] | P[j:k] & G[k-1:i]
P[j:i] = P[j:k] & P[k-1:i]

Ta sẽ sử dụng lại công thức này rất nhiều, do đó ta sẽ tạo ra một module merge như sau:

module merge(input logic ga, pa, gb, pb,
             output logic go, po);
    assign go = ga | pa & gb;
    assign po = pa & pb;
endmodule

IV. Prefix adder

Chúng ta trở lại mục tiêu ban đầu là tính mọi bit nhớ C[i] nhanh nhất có thể cùng một lúc. Thay vì tính C[i+1], chúng ta sẽ tính G[i:0] và P[i:0]. Lưu ý rằng:

C[i+1] = G[i:0] | P[i:0] & C[0]

Trong thực tế thì chúng ta muốn tính thẳng G[i:-1] bởi vì C[i+1] = G[i:-1] (nếu ta đặt G[-1] = C[0]). Tuy nhiên, việc sử dụng G[i:0] sẽ giúp giải thích nguyên lý dễ hơn.

Điều sáng tạo ở prefix adder là cách mà chúng ta tính G[i:0] và P[i:0]. Ví dụ, nếu ta có N = 8. Ở bước đầu tiên, ta sẽ tính song song:

G[7:6] = G[7] | P[7] & G[6];    P[7:6] = P[7] & P[6];
G[6:6] = G[6];                  P[6:6] = P[6];

G[5:4] = G[5] | P[5] & G[4];    P[5:4] = P[5] & P[4];
G[4:4] = G[4];                  P[4:4] = P[4];

G[3:2] = G[3] | P[3] & G[2];    P[3:2] = P[3] & P[2];
G[2:2] = G[2];                  P[2:2] = P[2];

G[1:0] = G[1] | P[1] & G[0];    P[1:0] = P[1] & P[0];
G[0:0] = G[0];                  P[0:0] = P[0];

Lưu ý rằng các bước tính đều sử dụng module merge ở trên. Ở bước thứ hai, ta sẽ tính song song:

G[7:4] = G[7:6] | P[7:6] & G[5:4];      P[7:4] = P[7:6] & P[5:4];
G[6:4] = G[6:6] | P[6:6] & G[5:4];      P[6:4] = P[6:6] & P[5:4];
// G[5:4], P[5:4] đã tính ở bước trước
// G[4:4], P[4:4] đã tính ở bước trước

G[3:0] = G[3:2] | P[3:2] & G[1:0];      P[3:0] = P[3:2] & P[1:0];
G[2:0] = G[2:2] | P[2:2] & G[1:0];      P[2:0] = P[2:2] & P[1:0];
// G[1:0], P[1:0] đã tính ở bước trước
// G[0:0], P[0:0] đã tính ở bước trước

Cuối cùng, ở bước thứ ba, chúng ta sẽ tính:

G[7:0] = G[7:4] | P[7:4] & G[3:0];      P[7:0] = P[7:4] & P[3:0];
G[6:0] = G[6:4] | P[6:4] & G[3:0];      P[6:0] = P[6:4] & P[3:0];
G[5:0] = G[5:4] | P[5:4] & G[3:0];      P[5:0] = P[5:4] & P[3:0];
G[4:0] = G[4:4] | P[4:4] & G[3:0];      P[4:0] = P[4:4] & P[3:0];
// G[3:0], P[3:0] đã tính ở bước trước
// G[2:0], P[2:0] đã tính ở bước trước
// G[1:0], P[1:0] đã tính ở bước trước
// G[0:0], P[0:0] đã tính ở bước trước

Ba bước trên có thể được tóm tắt lại bằng biểu đồ:

Mỗi dây trên biểu đồ bao gồm 2 bit cho G[j:i] và P[j:i]. Ô đen biểu thị cho module merge ở phần trước. Khi chúng ta merge 2 nhánh j:k và k-1:i, ta sẽ có j:i. Ví dụ, merge 2 nhánh 5:4 và 3:0 sẽ sinh ra 5:0. Biểu đồ này được gọi là cây prefix (prefix tree).

Có nhiều dạng cây prefix khác nhau. Cây vừa được mô tả là được gọi là cây Sklansky.

Như vậy, chỉ sau 3 bước tính, ta đã có được G[i:0] và P[i:0] cho mọi i. Nếu N = 16 thì chúng ta chỉ cần thêm 1 bước, tổng cộng 4 bước. Nếu N = 32 thì ta cần 5 bước, nếu N = 64 thì cần 6 bước,… Như vậy, số bước cần thực hiện chỉ là log N chứ không phải tuyến tính. Đây là ví dụ cho một cây prefix rộng 32 bit:

Sau khi G[i:0] và P[i:0] được tính, bước cuối cùng là tính C[i] và tổng S[i] cho từng bit:

C[i] = G[i-1:0] | P[i-1:0] & C[0]
S[i] = A[i] ^ B[i] ^ C[i]

Tổng hợp lại, prefix adder có thể cộng 2 số A và B qua các bước:

  1. Tính G[i] và P[i] cho từng bit dựa vào A và B.
  2. Tính G[i:0] và P[i:0] từ G[i] và P[i] sử dụng cây prefix trong log N bước.
  3. Tính C[i] từ G[i:0]P[i:0], và C[0].
  4. Tính tổng S[i] cho mỗi bit.

Như vậy, prefix adder đã giải quyết được vấn đề chờ C[i] để tính C[i+1] bằng cách thu thập rất nhiều dữ liệu từ A và B để tính C[i+1] trực tiếp từ C[0] mà không cần phải qua trung gian C[i],...,C[1]. Bằng cách này, delay của prefix adder chỉ tỉ lệ với log N. Với N lớn, delay của prefix adder sẽ nhỏ hơn đáng kể so với ripple-carry adder.

V. Code bằng SystemVerilog

Trong phần này chúng ta sẽ code một module prefix_adder để cộng 2 số 8-bit. Ta mô tả module prefix_adder qua 4 bước:

module prefix_adder(
    input logic[7:0] a, b,
    input logic cin,
    output logic [7:0] s,
    output logic cout
);

    // g[i] = G[i], trong khi gg[i] = G[i:0]
    logic[7:0] g, p, gg, pp;
    logic[8:0] c;

    // Buoc 1: Tinh G[i] va P[i]
    assign g = a & b;
    assign p = a | b;

    // Buoc 2: Tinh G[i:0] va P[i:0] su dung module prefix
    prefix #(8) pref(g, p, gg, pp);

    // Buoc 3: Tinh C[i]
    assign c[0] = cin;
    assign cout = c[8];
    assign c[8:1] = gg | pp & {8{c[0]}};

    // Buoc 4: Tinh S[i]
    assign s = a ^ b ^ c[7:0];
endmodule

Module prefix sẽ mô tả cây prefix trong phần trước. Thoạt nhìn thì cây này khá rắc rối. Tuy nhiên, chúng ta sẽ tận dụng cấu trúc đệ quy (recursive structure) của cây này bao gồm:

  • Hai cây prefix có độ rộng 4 bit (màu xanh lá trong hình dưới), một cho 4 bit cao và một cho 4 bit thấp.
  • Một loạt các module merge (màu xanh dương) để kết hợp 4 bit cao với G[3:0] và P[3:0].

Trong 2 cây prefix có độ rộng 4 bit, cấu trúc đệ quy này lại xuất hiện, mỗi cây lại có thêm 2 cây prefix có độ rộng 2 bit (màu đỏ). Chúng ta có thể khai triển cho đến khi chúng ta còn 1 bit. Khi này, ta chỉ cần nối dây trực tiếp (vì G[i:i] = G[i] và P[i:i] = P[i]). Chúng ta dùng parameter N để chỉ ra độ rộng của cây prefix.

module prefix #(parameter N = 8)(
    input logic[N-1:0] g, p,
    output logic[N-1:0] gg, pp
);
    localparam M = N/2;

    genvar i;
    generate
        if (N === 1) begin
            // Base case: chi con 1 bit, noi truc tiep
            assign gg = g;
            assign pp = p;
        end
        else begin
            // Recursive case: tao 2 cay prefix co do rong M
            logic[M-1:0] ghigh, phigh, glow, plow;
            prefix #(M) highpref(g[N-1:M], p[N-1:M], ghigh, phigh);
            prefix #(M) lowpref(g[M-1:0], p[M-1:0], glow, plow);
            // Merge
            assign gg[M-1:0] = glow;
            assign pp[M-1:0] = plow;
            for (i = 0; i < M; i++)
                merge m(ghigh[i], phigh[i], glow[M-1], plow[M-1], gg[M+i], pp[M+i]);
        end
    endgenerate
endmodule

Testbench sau đây có thể được dùng để kiểm tra code trên:

module testbench();
    logic[7:0] a, b, s;
    logic cin, cout;

    int unsigned expected;
    int num_errors = 0;

    prefix_adder dut(a, b, cin, s, cout);

    initial begin
        for (int i = 0; i < 256; i++) begin
            a = $urandom;
            b = $urandom;
            cin = $urandom;
            expected = a + b + cin;
            #1;
            if (expected !== {cout, s}) begin
                $display("Error: a = %b, b = %b, cin = %b, result = %b, expected = %b",
                        a, b, cin, {cout, s}, expected[8:0]);
                num_errors++;
            end
            #1;
        end
        $display("Test finished with %3d errors.", num_errors);
    end
endmodule

Code cho bài viết này có thể được tìm thấy ở prefix_adder.sv và testbench.sv.

Link Github của bài viết: https://github.com/minhcly95/ChipDesignArticles/blob/main/PrefixAdder/PrefixAdder.md

Cảm ơn các bạn đã theo dõi.

——————————————————

Tìm hiểu lộ trình cho người mới bắt đầu để hiểu thêm về công việc, ngành nghề, đãi ngộ và những kiến thức cần thiết để học thiết kế vi mạch và tham gia vào thị trường vi mạch.
Lộ Trình Bắt Đầu Ngành Thiết Kế Vi Mạch Bán Dẫn

Truy cập Server EDA Miễn Phí của ICTC để thực hành thiết kế vi mạch:
Truy cập Server EDA Miễn Phí

Hiện tại ICTC đang mở các khóa học thiết kế vi mạch từ cơ bản đến nâng cao, các bạn có thể tìm hiểu tại các bài viết sau nhé:

Thứ Sáu, 19 tháng 04, 2024
Bùi Quang Minh

Bùi Quang Minh

Đam mê và tự học đủ mọi thứ liên quan đến máy tính từ phần mềm, driver, nhúng, điện tử. Hiện tại mình đang nghiên cứu thêm vi mạch cho đủ bộ. Đang tìm kiếm một công việc trong ngành để thỏa mãn đam mê.

Đội Ngũ Giảng Viên Đến Từ Các Công ty vi mạch hàng đầu với NHiều năm kinh nghiệm

Khóa học thiết kế vi mạch ICTC giảng viên từ Ampere
Khóa học thiết kế vi mạch ICTC giảng viên từ Renesas
Khóa học thiết kế vi mạch ICTC giảng viên từ MediaTek Singapore
Khóa học thiết kế vi mạch ICTC giảng viên từ BOS
Khóa học thiết kế vi mạch ICTC giảng viên từ Marvell
Khóa học thiết kế vi mạch ICTC giảng viên từ Renesas
Khóa học thiết kế vi mạch ICTC giảng viên từ NSING

Nổi Bật

Tổng Kết Khóa Học Thiết Kế Vi Mạch Cơ Bản Tháng 6 2024

Tổng Kết Khóa Học Thiết Kế Vi Mạch Cơ Bản Tháng 6 2024

Hôm nay, khóa học Thiết kế Vi mạch Cơ bản tại Trung tâm ICTC đã chính thức khép lại với buổi lễ tổng kết ý nghĩa. Đây là dịp để giảng viên và học viên cùng nhau nhìn lại hành trình học tập, những thành quả đạt được, và chia sẻ cảm nghĩ sau khóa học. Cảm Nghĩ Của Học...

TỔNG KẾT OFFLINE VI MẠCH 07/2024

TỔNG KẾT OFFLINE VI MẠCH 07/2024

Vậy là sau hơn 4 tiếng đồng hồ giao lưu và chia sẻ các kiến thức về tổng quan ngành vi mạch, các vị trí việc làm, tuyển dụng, các kinh nghiệm học tập, phỏng vấn, ... buổi offline ngày hôm nay đã kết thúc thành công tốt đẹp.Rất cảm ơn các bạn đã không ngại đường xá xa...

Bài Viết Mới

Chứng Chỉ – Giá Trị Từ Nỗ Lực Thực Sự

Chứng Chỉ – Giá Trị Từ Nỗ Lực Thực Sự

Chứng Chỉ Có Quan Trọng Khi Xin Việc? Nhiều người cho rằng chứng chỉ chỉ là “tờ giấy”, nhưng thực tế, nó phản ánh quá trình học tập nghiêm túc, sự nỗ lực không ngừng và khả năng ứng dụng kiến thức vào thực tế. Một chứng chỉ không thể đảm bảo 100% cơ hội việc làm,...

KỈ NIỆM KHÓA HỌC ICTC

KỈ NIỆM KHÓA HỌC ICTC

Còn nhớ thời điểm này năm ngoái là lúc bắt đầu IC1, 2 gì đó mà giờ đã là 19 rồi, thời gian trôi qua nhanh thiệt ^^.Trong buổi khai giảng, tụi mình luôn dành thời gian trao đổi để hiểu rõ mục tiêu của từng bạn khi tham gia. Thông thường, mọi người đến với hành trình...

Toàn Cảnh Ngành Công Nghiệp Bán Dẫn Toàn Cầu

Toàn Cảnh Ngành Công Nghiệp Bán Dẫn Toàn Cầu

Ngành công nghiệp bán dẫn đóng vai trò quan trọng trong nền kinh tế toàn cầu, với sự thống trị của một số tập đoàn lớn. Vốn hóa thị trường và sự phân chia theo khu vực cho thấy sự chênh lệch đáng kể giữa các công ty hàng đầu và phần còn lại của ngành. Nhóm Dẫn Đầu:...

BẠN CHƯA BIẾT BẮT ĐẦU TỪ ĐÂU?

Sau nhiều năm tư vấn và đào tạo vi mạch cho hàng trăm bạn sinh viên, học sinh và phụ huynh, kết hợp với kinh nghiệm từ các anh chị kỹ sư vi mạch có nhiều năm kinh nghiệm, đây là tất cả những kinh nghiệm và tài liệu mà mình đúc kết, tổng hợp lại được thành một quy trình tìm hiểu ngành vi mạch để các bạn mình mới tham gia vào ngành có thể bắt đầu một cách hiệu quả nhất.

 

Bấm nút bên dưới để tìm hiểu về ngành, về nghề nghiệp cũng như những thứ bản thân cần chuẩn bị để tham gia vào hành trình trở thành kỹ sư vi mạch tuy có phần gian nan nhưng vô cùng thú vị bạn nhé!

LỘ TRÌNH TỰ HỌC VI MẠCHGROUP CHAT HỌC TẬP VI MẠCH