CÔNG NGHỆ BỘ NHỚ THẾ HỆ MỚI: RE-RAM, MRAM VÀ FE-RAM - GIẢI PHÁP CHO KỶ NGUYÊN TRÍ TUỆ NHÂN TẠO

Thứ năm - 04/06/2026 09:33

Trong nhiều thập kỷ, DRAM là nền tảng của hầu hết máy tính, máy chủ và trung tâm dữ liệu trên thế giới. Tuy nhiên, khi trí tuệ nhân tạo (AI) ngày càng phát triển với các mô hình hàng chục đến hàng trăm tỷ tham số, kiến trúc bộ nhớ truyền thống đang dần bộc lộ những giới hạn về tốc độ, điện năng và khả năng mở rộng.
Các nhà sản xuất bán dẫn lớn như Samsung, SK Hynix, Micron cùng nhiều viện nghiên cứu hàng đầu đang hướng tới một thế hệ bộ nhớ hoàn toàn mới dựa trên kiến trúc 3D Stacking kết hợp với các công nghệ tiên tiến như ReRAM, MRAM và FeRAM.

Từ RAM 2D đến RAM 3D

Trong kiến trúc bộ nhớ truyền thống, các ô nhớ được bố trí trên cùng một mặt phẳng silicon.

Điều này giống như xây dựng một thành phố chỉ có nhà cấp 4 trải rộng trên mặt đất. Muốn tăng dung lượng, người ta buộc phải mở rộng diện tích chip hoặc tiếp tục thu nhỏ kích thước transistor.

Tuy nhiên việc thu nhỏ đang tiến gần tới giới hạn vật lý của vật liệu bán dẫn.

Kiến trúc 3D Stacking giải quyết bài toán này bằng cách xếp chồng nhiều lớp bộ nhớ theo chiều dọc.

Thay vì chỉ sử dụng một mặt phẳng, các lớp nhớ được liên kết bằng công nghệ TSV (Through-Silicon Via), tạo thành một khối bộ nhớ nhiều tầng tương tự các tòa nhà cao tầng.

Lợi ích mang lại rất rõ ràng:

Tăng mật độ lưu trữ gấp nhiều lần.
Rút ngắn khoảng cách truyền dữ liệu.
Giảm điện năng tiêu thụ.
Tăng đáng kể băng thông bộ nhớ.

Đây chính là nền tảng của các dòng bộ nhớ HBM (High Bandwidth Memory) đang được sử dụng trong các GPU AI hiện nay.

Vì sao AI cần bộ nhớ mới?

Một mô hình AI hiện đại không chỉ yêu cầu năng lực tính toán mạnh mà còn cần khả năng truy xuất dữ liệu cực nhanh.

Trên thực tế, phần lớn năng lượng trong hệ thống AI không được dùng để tính toán mà để di chuyển dữ liệu giữa CPU, GPU và RAM.

Các nghiên cứu cho thấy việc truyền dữ liệu có thể chiếm tới 60–90% tổng điện năng tiêu thụ của hệ thống AI.

Đây được gọi là "Nút thắt cổ chai Von Neumann" (Von Neumann Bottleneck).

Muốn AI mạnh hơn, ngành công nghiệp không chỉ cần GPU nhanh hơn mà còn cần bộ nhớ thông minh hơn.

ReRAM – Bộ nhớ biết tính toán

Trong số các công nghệ mới nổi, ReRAM được đánh giá là ứng cử viên sáng giá nhất cho AI.

Khác với DRAM lưu dữ liệu bằng điện tích, ReRAM lưu dữ liệu thông qua trạng thái điện trở của vật liệu.

Điểm đặc biệt là ReRAM có thể vừa lưu trữ vừa thực hiện tính toán ngay bên trong mảng bộ nhớ.

Khái niệm này được gọi là Compute-in-Memory.

Thay vì:

CPU/GPU → đọc dữ liệu → tính toán → ghi dữ liệu

ReRAM có thể:

Lưu dữ liệu + thực hiện phép nhân ma trận trực tiếp trong ô nhớ.

Điều này giúp:

Giảm tới 90% điện năng.
Tăng tốc độ xử lý AI từ 100 đến 1000 lần.
Loại bỏ phần lớn hiện tượng nghẽn băng thông bộ nhớ.

Nhiều chuyên gia nhận định ReRAM có thể trở thành nền tảng cho thế hệ AI Edge tiếp theo, nơi các thiết bị nhỏ gọn vẫn có thể chạy các mô hình AI mạnh mẽ ngay tại chỗ.

MRAM – Bộ nhớ nhanh gần như SRAM

Nếu ReRAM nổi bật về khả năng tính toán trong bộ nhớ thì MRAM lại gây ấn tượng bởi tốc độ cực cao.

MRAM lưu dữ liệu bằng trạng thái từ tính thay vì điện tích.

Ưu điểm lớn nhất:

Không mất dữ liệu khi mất điện.
Tốc độ gần tương đương SRAM.
Độ bền lên tới hơn 10¹⁵ lần ghi.

Phiên bản tiên tiến nhất hiện nay là SOT-MRAM có tốc độ dưới 1 nano giây.

Điều này khiến MRAM trở thành ứng viên thay thế SRAM Cache trong CPU và GPU tương lai.

Nếu thành công, các bộ xử lý AI sẽ có bộ nhớ đệm lớn hơn nhiều nhưng tiêu thụ ít điện năng hơn.

FeRAM – Sự kết hợp giữa DRAM và Flash

FeRAM sử dụng vật liệu sắt điện (Ferroelectric Material) để lưu dữ liệu.

Công nghệ này mang lại nhiều ưu điểm:

Không mất dữ liệu khi tắt nguồn.
Tiêu thụ điện cực thấp.
Tương thích tốt với dây chuyền sản xuất CMOS hiện tại.

FeRAM được nhiều hãng bán dẫn xem là lựa chọn khả thi nhất để thay thế DRAM hệ thống trong tương lai.

Nếu ReRAM là bộ nhớ dành cho AI và MRAM dành cho cache tốc độ cao thì FeRAM có thể trở thành bộ nhớ chính của máy tính thế hệ mới.

Cuộc đua RAM 3D đã bắt đầu

Hiện nay các GPU AI cao cấp của NVIDIA đã sử dụng bộ nhớ HBM dựa trên công nghệ xếp chồng nhiều lớp.

Các thế hệ HBM4 và HBM5 đang được phát triển với số lớp ngày càng lớn và băng thông vượt xa DDR5.

Trong khi đó, các phòng thí nghiệm bán dẫn đang nghiên cứu:

ReRAM 3D nhiều lớp.
FeRAM 3D tích hợp AI.
MRAM 3D cho bộ nhớ đệm tốc độ cực cao.

Mục tiêu cuối cùng là tạo ra Universal Memory – một loại bộ nhớ duy nhất có thể thay thế cả:

SRAM
DRAM
NAND Flash

Nếu điều này trở thành hiện thực, máy tính tương lai sẽ khởi động gần như tức thì, chạy các mô hình AI hàng trăm tỷ tham số trên thiết bị cá nhân và tiêu thụ ít điện năng hơn rất nhiều so với hiện nay.

Tương lai của AI nằm ở bộ nhớ

Trong nhiều năm qua, sự chú ý thường tập trung vào CPU và GPU. Tuy nhiên, cuộc đua AI hiện nay đang cho thấy bộ nhớ mới là yếu tố quyết định hiệu năng hệ thống.

Kiến trúc RAM 3D kết hợp với ReRAM, MRAM và FeRAM có thể tạo ra bước nhảy vọt tương tự như cách SSD từng thay thế ổ cứng cơ học.

Giai đoạn 2027–2035 được dự báo sẽ là thời kỳ chuyển đổi lớn nhất của ngành công nghiệp bộ nhớ kể từ khi DRAM ra đời.

Và rất có thể trong thập kỷ tới, những chiếc máy tính cá nhân chạy AI cục bộ mạnh mẽ sẽ không còn phụ thuộc vào DRAM như ngày nay nữa.

Tương lai của RAM 3D: Không chỉ nhanh hơn, mà còn thay đổi cách AI hoạt động

Trong nhiều năm qua, mỗi khi nói đến nâng cấp máy tính, người dùng thường nghĩ đến CPU mạnh hơn hoặc GPU nhanh hơn. Tuy nhiên, các chuyên gia bán dẫn đang dần nhận ra rằng giới hạn lớn nhất của AI không nằm ở sức mạnh xử lý mà nằm ở khả năng lưu trữ và di chuyển dữ liệu.

RAM 3D cùng các công nghệ bộ nhớ thế hệ mới được kỳ vọng sẽ giải quyết triệt để bài toán này.

AI mạnh hơn nhưng tiêu thụ ít điện hơn

Hiện nay, các trung tâm dữ liệu AI trên thế giới tiêu thụ lượng điện năng khổng lồ. Một mô hình AI lớn có thể cần hàng nghìn GPU hoạt động liên tục để phục vụ hàng triệu người dùng.

Với ReRAM, MRAM và FeRAM, dữ liệu được xử lý ngay trong bộ nhớ hoặc ở khoảng cách cực ngắn, giúp giảm đáng kể lượng điện năng tiêu hao cho việc truyền dữ liệu.

Các nghiên cứu cho thấy thế hệ bộ nhớ mới có thể giúp giảm từ 50% đến 90% điện năng tiêu thụ cho các tác vụ AI, góp phần xây dựng các trung tâm dữ liệu xanh và bền vững hơn.

AI cá nhân sẽ trở nên phổ biến

Ngày nay, hầu hết các mô hình AI mạnh đều phải chạy trên máy chủ đám mây do yêu cầu phần cứng quá lớn.

Tuy nhiên, khi bộ nhớ 3D đạt dung lượng hàng terabyte với tốc độ cực cao, việc chạy các mô hình AI hàng chục hoặc hàng trăm tỷ tham số trên máy tính cá nhân sẽ trở nên khả thi.

Trong tương lai, mỗi người có thể sở hữu một trợ lý AI riêng hoạt động hoàn toàn ngoại tuyến, không cần gửi dữ liệu lên Internet nhưng vẫn có khả năng xử lý tương đương các dịch vụ AI trực tuyến hiện nay.

Khởi động tức thì như điện thoại

Một trong những ưu điểm lớn của ReRAM, MRAM và FeRAM là khả năng lưu dữ liệu ngay cả khi mất điện.

Điều này đồng nghĩa với việc khái niệm "khởi động hệ điều hành" có thể dần biến mất.

Máy tính tương lai có thể bật lên gần như ngay lập tức, trở lại đúng trạng thái làm việc trước đó mà không cần nạp dữ liệu từ ổ cứng vào RAM như hiện nay.

Máy chủ AI nhỏ hơn nhưng mạnh hơn

Các hệ thống AI hiện đại thường yêu cầu nhiều máy chủ, nhiều GPU và hệ thống làm mát phức tạp.

Khi bộ nhớ 3D và công nghệ Compute-in-Memory trở nên phổ biến, số lượng phần cứng cần thiết có thể giảm đáng kể trong khi hiệu suất vẫn tăng lên.

Điều này mở ra khả năng triển khai AI cục bộ tại doanh nghiệp, trường học, bệnh viện hoặc cơ quan nhà nước mà không cần đầu tư các trung tâm dữ liệu khổng lồ.

Tiến gần đến "Bộ nhớ vạn năng"

Một trong những mục tiêu lớn nhất của ngành bán dẫn là tạo ra Universal Memory – bộ nhớ vạn năng.

Đây là loại bộ nhớ có thể kết hợp những ưu điểm tốt nhất của:

SRAM: siêu nhanh
DRAM: dung lượng lớn
SSD/NAND: lưu trữ lâu dài

Nếu thành công, máy tính tương lai có thể chỉ cần một loại bộ nhớ duy nhất cho toàn bộ hệ thống.

Điều này sẽ giúp giảm độ phức tạp phần cứng, tiết kiệm chi phí sản xuất và mang lại hiệu năng vượt trội so với kiến trúc hiện nay.

Cuộc đua mới của ngành bán dẫn

Sau nhiều năm tập trung vào việc thu nhỏ transistor, các hãng công nghệ lớn đang chuyển hướng sang cuộc đua về kiến trúc bộ nhớ.

Samsung, SK Hynix, Micron, Intel, TSMC và nhiều viện nghiên cứu hàng đầu đều đang đầu tư hàng tỷ USD vào các công nghệ bộ nhớ mới.

Nhiều chuyên gia dự đoán rằng trong giai đoạn 2030–2035, bộ nhớ sẽ trở thành yếu tố quyết định sức mạnh của các hệ thống AI, tương tự vai trò của CPU trong thập niên 1990 hay GPU trong thập niên 2010.

Nói cách khác, cuộc cách mạng AI tiếp theo có thể sẽ không bắt đầu từ bộ xử lý, mà bắt đầu từ bộ nhớ.

"Nếu GPU là động cơ của AI thì bộ nhớ chính là hệ tuần hoàn. Và trong thập kỷ tới, RAM 3D có thể là công nghệ âm thầm tạo nên bước nhảy vọt lớn nhất của ngành trí tuệ nhân tạo

Tác giả: Hoa Tiêu Số