Trong kiến trúc bộ nhớ truyền thống, các ô nhớ được bố trí trên cùng một mặt phẳng silicon.
Điều này giống như xây dựng một thành phố chỉ có nhà cấp 4 trải rộng trên mặt đất. Muốn tăng dung lượng, người ta buộc phải mở rộng diện tích chip hoặc tiếp tục thu nhỏ kích thước transistor.
Tuy nhiên việc thu nhỏ đang tiến gần tới giới hạn vật lý của vật liệu bán dẫn.
Kiến trúc 3D Stacking giải quyết bài toán này bằng cách xếp chồng nhiều lớp bộ nhớ theo chiều dọc.
Thay vì chỉ sử dụng một mặt phẳng, các lớp nhớ được liên kết bằng công nghệ TSV (Through-Silicon Via), tạo thành một khối bộ nhớ nhiều tầng tương tự các tòa nhà cao tầng.

Lợi ích mang lại rất rõ ràng:
Đây chính là nền tảng của các dòng bộ nhớ HBM (High Bandwidth Memory) đang được sử dụng trong các GPU AI hiện nay.
Một mô hình AI hiện đại không chỉ yêu cầu năng lực tính toán mạnh mà còn cần khả năng truy xuất dữ liệu cực nhanh.
Trên thực tế, phần lớn năng lượng trong hệ thống AI không được dùng để tính toán mà để di chuyển dữ liệu giữa CPU, GPU và RAM.
Các nghiên cứu cho thấy việc truyền dữ liệu có thể chiếm tới 60–90% tổng điện năng tiêu thụ của hệ thống AI.
Đây được gọi là "Nút thắt cổ chai Von Neumann" (Von Neumann Bottleneck).
Muốn AI mạnh hơn, ngành công nghiệp không chỉ cần GPU nhanh hơn mà còn cần bộ nhớ thông minh hơn.
Trong số các công nghệ mới nổi, ReRAM được đánh giá là ứng cử viên sáng giá nhất cho AI.
Khác với DRAM lưu dữ liệu bằng điện tích, ReRAM lưu dữ liệu thông qua trạng thái điện trở của vật liệu.
Điểm đặc biệt là ReRAM có thể vừa lưu trữ vừa thực hiện tính toán ngay bên trong mảng bộ nhớ.
Khái niệm này được gọi là Compute-in-Memory.
Thay vì:
CPU/GPU → đọc dữ liệu → tính toán → ghi dữ liệu
ReRAM có thể:
Lưu dữ liệu + thực hiện phép nhân ma trận trực tiếp trong ô nhớ.
Điều này giúp:
Nhiều chuyên gia nhận định ReRAM có thể trở thành nền tảng cho thế hệ AI Edge tiếp theo, nơi các thiết bị nhỏ gọn vẫn có thể chạy các mô hình AI mạnh mẽ ngay tại chỗ.


Nếu ReRAM nổi bật về khả năng tính toán trong bộ nhớ thì MRAM lại gây ấn tượng bởi tốc độ cực cao.
MRAM lưu dữ liệu bằng trạng thái từ tính thay vì điện tích.
Ưu điểm lớn nhất:
Phiên bản tiên tiến nhất hiện nay là SOT-MRAM có tốc độ dưới 1 nano giây.
Điều này khiến MRAM trở thành ứng viên thay thế SRAM Cache trong CPU và GPU tương lai.
Nếu thành công, các bộ xử lý AI sẽ có bộ nhớ đệm lớn hơn nhiều nhưng tiêu thụ ít điện năng hơn.

FeRAM sử dụng vật liệu sắt điện (Ferroelectric Material) để lưu dữ liệu.
Công nghệ này mang lại nhiều ưu điểm:
FeRAM được nhiều hãng bán dẫn xem là lựa chọn khả thi nhất để thay thế DRAM hệ thống trong tương lai.
Nếu ReRAM là bộ nhớ dành cho AI và MRAM dành cho cache tốc độ cao thì FeRAM có thể trở thành bộ nhớ chính của máy tính thế hệ mới.

Hiện nay các GPU AI cao cấp của NVIDIA đã sử dụng bộ nhớ HBM dựa trên công nghệ xếp chồng nhiều lớp.
Các thế hệ HBM4 và HBM5 đang được phát triển với số lớp ngày càng lớn và băng thông vượt xa DDR5.
Trong khi đó, các phòng thí nghiệm bán dẫn đang nghiên cứu:
Mục tiêu cuối cùng là tạo ra Universal Memory – một loại bộ nhớ duy nhất có thể thay thế cả:
Nếu điều này trở thành hiện thực, máy tính tương lai sẽ khởi động gần như tức thì, chạy các mô hình AI hàng trăm tỷ tham số trên thiết bị cá nhân và tiêu thụ ít điện năng hơn rất nhiều so với hiện nay.
Trong nhiều năm qua, sự chú ý thường tập trung vào CPU và GPU. Tuy nhiên, cuộc đua AI hiện nay đang cho thấy bộ nhớ mới là yếu tố quyết định hiệu năng hệ thống.

Kiến trúc RAM 3D kết hợp với ReRAM, MRAM và FeRAM có thể tạo ra bước nhảy vọt tương tự như cách SSD từng thay thế ổ cứng cơ học.
Giai đoạn 2027–2035 được dự báo sẽ là thời kỳ chuyển đổi lớn nhất của ngành công nghiệp bộ nhớ kể từ khi DRAM ra đời.
Và rất có thể trong thập kỷ tới, những chiếc máy tính cá nhân chạy AI cục bộ mạnh mẽ sẽ không còn phụ thuộc vào DRAM như ngày nay nữa.

Trong nhiều năm qua, mỗi khi nói đến nâng cấp máy tính, người dùng thường nghĩ đến CPU mạnh hơn hoặc GPU nhanh hơn. Tuy nhiên, các chuyên gia bán dẫn đang dần nhận ra rằng giới hạn lớn nhất của AI không nằm ở sức mạnh xử lý mà nằm ở khả năng lưu trữ và di chuyển dữ liệu.
RAM 3D cùng các công nghệ bộ nhớ thế hệ mới được kỳ vọng sẽ giải quyết triệt để bài toán này.
Hiện nay, các trung tâm dữ liệu AI trên thế giới tiêu thụ lượng điện năng khổng lồ. Một mô hình AI lớn có thể cần hàng nghìn GPU hoạt động liên tục để phục vụ hàng triệu người dùng.
Với ReRAM, MRAM và FeRAM, dữ liệu được xử lý ngay trong bộ nhớ hoặc ở khoảng cách cực ngắn, giúp giảm đáng kể lượng điện năng tiêu hao cho việc truyền dữ liệu.
Các nghiên cứu cho thấy thế hệ bộ nhớ mới có thể giúp giảm từ 50% đến 90% điện năng tiêu thụ cho các tác vụ AI, góp phần xây dựng các trung tâm dữ liệu xanh và bền vững hơn.
Ngày nay, hầu hết các mô hình AI mạnh đều phải chạy trên máy chủ đám mây do yêu cầu phần cứng quá lớn.
Tuy nhiên, khi bộ nhớ 3D đạt dung lượng hàng terabyte với tốc độ cực cao, việc chạy các mô hình AI hàng chục hoặc hàng trăm tỷ tham số trên máy tính cá nhân sẽ trở nên khả thi.
Trong tương lai, mỗi người có thể sở hữu một trợ lý AI riêng hoạt động hoàn toàn ngoại tuyến, không cần gửi dữ liệu lên Internet nhưng vẫn có khả năng xử lý tương đương các dịch vụ AI trực tuyến hiện nay.
Một trong những ưu điểm lớn của ReRAM, MRAM và FeRAM là khả năng lưu dữ liệu ngay cả khi mất điện.
Điều này đồng nghĩa với việc khái niệm "khởi động hệ điều hành" có thể dần biến mất.
Máy tính tương lai có thể bật lên gần như ngay lập tức, trở lại đúng trạng thái làm việc trước đó mà không cần nạp dữ liệu từ ổ cứng vào RAM như hiện nay.
Các hệ thống AI hiện đại thường yêu cầu nhiều máy chủ, nhiều GPU và hệ thống làm mát phức tạp.
Khi bộ nhớ 3D và công nghệ Compute-in-Memory trở nên phổ biến, số lượng phần cứng cần thiết có thể giảm đáng kể trong khi hiệu suất vẫn tăng lên.
Điều này mở ra khả năng triển khai AI cục bộ tại doanh nghiệp, trường học, bệnh viện hoặc cơ quan nhà nước mà không cần đầu tư các trung tâm dữ liệu khổng lồ.
Một trong những mục tiêu lớn nhất của ngành bán dẫn là tạo ra Universal Memory – bộ nhớ vạn năng.
Đây là loại bộ nhớ có thể kết hợp những ưu điểm tốt nhất của:
Nếu thành công, máy tính tương lai có thể chỉ cần một loại bộ nhớ duy nhất cho toàn bộ hệ thống.
Điều này sẽ giúp giảm độ phức tạp phần cứng, tiết kiệm chi phí sản xuất và mang lại hiệu năng vượt trội so với kiến trúc hiện nay.
Sau nhiều năm tập trung vào việc thu nhỏ transistor, các hãng công nghệ lớn đang chuyển hướng sang cuộc đua về kiến trúc bộ nhớ.
Samsung, SK Hynix, Micron, Intel, TSMC và nhiều viện nghiên cứu hàng đầu đều đang đầu tư hàng tỷ USD vào các công nghệ bộ nhớ mới.
Nhiều chuyên gia dự đoán rằng trong giai đoạn 2030–2035, bộ nhớ sẽ trở thành yếu tố quyết định sức mạnh của các hệ thống AI, tương tự vai trò của CPU trong thập niên 1990 hay GPU trong thập niên 2010.
Nói cách khác, cuộc cách mạng AI tiếp theo có thể sẽ không bắt đầu từ bộ xử lý, mà bắt đầu từ bộ nhớ.
"Nếu GPU là động cơ của AI thì bộ nhớ chính là hệ tuần hoàn. Và trong thập kỷ tới, RAM 3D có thể là công nghệ âm thầm tạo nên bước nhảy vọt lớn nhất của ngành trí tuệ nhân tạo
Tác giả: Hoa Tiêu Số
Ý kiến bạn đọc
Những tin cũ hơn
Kỷ nguyên máy tính lượng tử bắt đầu ngay bây giờ: Chip nhỏ hơn 1.000 lần, hiệu quả hơn 1.000 lần và thuật toán lai
Công nghệ đằng sau siêu máy tính AI NVIDIA của Mark Zuckerberg và Elon Musk: Trung tâm dữ liệu doanh nghiệp mạnh hơn nhiều so với các quốc gia
Giải phóng sức mạnh tiềm ẩn của bộ não bạn: Cung điện trí nhớ với AI và AR để phát triển nhận thức theo cấp số nhân
Hệ điều hành Android tốt nhất cho PC có Play Store
Phần mềm soạn thảo dễ sử dụng deditor v1.0.0
Máy đóng gói và chiết rót tự động: Lợi ích cho ngành thực phẩm
Hướng dẫn toàn diện về hệ thống UPS công nghiệp: Những điều bạn cần biết
Proof of Work (PoW) và Proof of Stake (PoS) là gì? So sánh và đánh giá
Dịch vụ IoT thúc đẩy chuyển đổi số cho hoạt động kinh doanh
Các ngành công nghiệp khác nhau sử dụng trí tuệ nhân tạo như thế nào: Ảnh hưởng đa chiều của AI
AI và GPT-4 thúc đẩy giáo dục hướng tới tính toàn diện và học tập cá nhân hóa như thế nào
Tích hợp tiền điện tử thúc đẩy tương lai của IoT
Dịch vụ CNTT tại địa phương: Chìa khóa để thúc đẩy lợi nhuận kinh doanh
Cuộc đua trí tuệ nhân tạo toàn cầu vượt ra ngoài OpenAI: Gemini, LAUREL, Deepseek R1, Kimi Moonshot, Marco-o1 và nhiều hơn nữa
Nông nghiệp 4.0: Cách mạng hóa nông nghiệp và hỗ trợ thành phố thông minh
ICTSO – Chung tay xây dựng Hệ Sinh Thái Tri Thức Số Cho Tương Lai
Làm thế nào để xây dựng một nhóm cộng tác hiệu quả trong môi trường làm việc kết hợp
Điện thoại thông minh ảnh hưởng đến tâm lý trẻ em, định hình tâm trí và cuộc sống của thế hệ tiếp theo như thế nào
Giao diện não-máy tính hỗ trợ AI trao quyền cho thế giới của chúng ta và xác định lại tiềm năng của con người
Xi măng và bê tông xanh mới bền hơn xi măng và bê tông truyền thống: Những cải tiến đột phá tạo nên các thành phố thông minh không phát thải carbon
Giải phóng cuộc cách mạng iBee: Động cơ không chổi than không nam châm định nghĩa lại tính bền vững và thúc đẩy tương lai của xe điện
CHUYỂN ĐỔI VĂN BẢN TRUYỀN THỐNG SANG LƯU TRỮ TÀI LIỆU SỐ ICTSO SCAN
Xe buýt tự hành có phải là tương lai của dịch vụ thuê xe buýt không?
RPA đang chuyển đổi tương lai của công việc như thế nào?
Công nghệ đang giúp giảm thiểu thời gian chờ đợi tại các ngân hàng như thế nào
Tạo ra các trang trại giảm khí thải Carbon thông qua quản lý tài nguyên thông minh
Bộ nhớ dữ liệu của não người có thể là 2,5 Petabyte: Có khả năng gấp 10 lần so với những gì chúng ta biết
Giải pháp an toàn hiện đại dành cho chủ doanh nghiệp
Ý tưởng nội dung thu hút liên kết ngược tự nhiên
Pin sắt-không khí có làm nên cuộc cách mạng trong lưu trữ năng lượng tái tạo không?
Giải pháp Ảo hóa & Lưu trữ tập trung ICTSO CloudStorage+
Hướng dẫn cách sử dụng các giải pháp phần mềm trong quản trị
Jensen Huang và Vua Đan Mạch kỷ niệm cuộc cách mạng AI: Cái nhìn sâu sắc về công nghệ Gefion, siêu máy tính AI NVIDIA DGX SuperPOD
Trung tâm dữ liệu tại chỗ (On-premises Data Center) từ ICTSO