반응형

개인 공부/논문 12

An Energy- and Performance-Aware DRAM Cache Architecture for Hybrid DRAMPCM Main Memory Systems

2. Background A. Basic of Memory Devices and Systems Increased memory bandwidth and capacity requirement. Typically, Mem chip are integrated and installed as Dual In-line Memory Module(DIMM) DIMM’s energy consumption is significant.(20% ~ 40% of entire system power consumption) PCM Pros, Ability to scale down, Low power consumption(1/3 of DRAM in operating state, zero idle state), Non-volatility..

Revamping Storage Class Memory With Hardware Automated Memory-Over-Storage Solution

Revamping Storage Class Memory With Hardware Automated Memory-Over-Storage Solution 2021 ACM/IEEE 48th Annual International Symposium on Computer Architecture (ISCA) KAIST, University of Illinois Urbana-Champaign, Pennsylvania State University Motivation •최근 위와 같은 Larger Scale Application이 대폭 증가. Related Works HW Solution •NVDIMM-N : Back up data from DRAM to flash during power failure Capacity ..

NVMain An Architectural-Level Main Memory Simulator for Emerging Non-volatile Memories

Abstract NVM 기술이 Main Memory의 대체 가능한 기술로 부상함에 따라, 아키텍쳐 레벨에서의 performance, energy, reliability의 분석이 필요해졌다. NVmain이라고 칭하는 시뮬레이터는 DRAM, NVM 모두를 지원하며 설계를 할 수 있도록 지원한다. 1. Intro 최신 ITRS로드맵에서 현재 DRAM이 직면하고 있는 일부 문제에 대한 솔루션은 아직 존재하지 않는다. 또한 DRAM은 전력 소모량에서 많은 단점을 가지고 있다.(3D Stacked DRAM 개발이유) DRAM의 Refresh, stand-by power는 큰 전력 소모의 두가지 주요 요인이다. NVM의 본질적인 특성은 데이터가 손실(lost)되지 않는다는 점이다. 이는 데이터가 Refresh할 필요..

Basic Performance Measurements of the Intel Optane DC Persistent Memroy Module

Abstract NVM은 마침내 Intel Optane DC Persistent Memory의 출시로 상용화 되었다. Optane DC Memory는 Latency(346ns)이고, DRAM과 SSD 계층 사이에 위치한다. Memory Mode(or Cache Mode)에서 사용될 때 Memory Footprints가 작은 App에 대해서는 영향을 거의 미치지 않는다. 대신 큰 App에 대해서는 DRAM에 비해 속도가 다소 느려질 수 있지만, 더 많은 데이터를 메모리에 저장 할 수 있다. How to Use this Documnet Optane DC Memory에 대한 기본 특성이 필요하다면 Sec 3에 주목. 대량 메모리 사용하는 App 개발자는 Sec 4에 주목 File System, Storage ..

3-D Stacked Image Sensor With Deep Neural Network Computation

Abstract 이미지 센서에 DNN계산을 통합하여 전력 및 성능 절충점을 조사한다. Pixel Array, read-out circuits, memory, computing logic for DNN 의 3D stacked CMOS sensor인 Neurosensor의 설계를 제안한다. 분석에 따르면 DNN을 통합하면 Processing 및 Memory access Latency( 및 Energy)를 희생하여, Transmit Latency (및 Energy)가 감소한다. 따라서 특정 DNN 및 대역폭이 주어지면 Energy 효율을 최대화 하기위해 센서에서 계산해야하는 최적의 레이어 수가 존재한다. 보통 Sensor에 Memory를 통합하거나 Feature extraction layer만 구현하는 것이 ..

Deep Iterative Frame Interpolation for Full-frame Video Stabilization

Abstract Video stabilization is a fundamental and important technique for high quality video. Previously, most of the frame borders were cropped and a moderate level of distortion was introduced. In this paper, frame interpolation is used to reduce jitter between frames. The biggest advantage is that end-to-end training is possible with unsupervised learning. It runs in near real time (15fps). I..

LSP Collective Cross-Page Prefetching for NVM

Abstract -NVM은 DRAM에 비해 Row activation latency가 대략 10x 정도로 매우 크다. -따라서 미리 NVM의 Row를 정확하게 Open 한다음 적은 오버헤드로 Open된 Row에서 데이터 블록을 Prefetch할 수 있는 Collective cross-page prefetching을 제안한다. -Memory Access 패턴을 식별하고 Ladder stream prefetcher(LSP)를 제안한다. -Collective Prefetch Table는 Memory Queue의 상태에 따라 Prefetch를 추측적으로 스케쥴링하여 Prefetch Request로 인한 Demand Request와의 충돌을 피한다. Intro 문제점 -Optane DC PMM가 Memory Mo..

Towards Efficient NVDIMM-based Heterogeneous Storage Hierarchy Management for Big Data Workloads

Abstract -NVDIMM 기반 아키텍처에 비추어 스토리지 데이터 관리의 솔루션을 제공 -특히 NVDIMM을 메모리버스에 배치함으로 발생하는 Bus Contention문제를 해결하기 위함 -Memory Traffic interferences사용으로 인한 부작용을 최소화 하기위해 NVDIMM-based Lazy Migration 을 소개 Intro 문제점 -Big data applications는 memory 와 storage 간의 I/O에 높은 성능을 요구 -보통 VMDK로(Virtual Machine Disks)로 사용되며, 여러 물리적 디바이스에 분산되어 있다. -NVDIMM 장치의 I/O 성능을 예측하기 어렵다.(분리된 I/O 경로가 아닌 DIMM 형식이므로 Memory Traffic도 고려해야..

The gem5 Simulator

Abstract M5 : Simulation frame work multiple ISA GEMS : flexible memory system gme5 : M5 + GEMS (ARM, ALPHA, MIPS, Power, SPARC, x86 1. Intro 기존의 시뮬레이터들은 라이센스 문제 및 코드의 퀄리티 때문에 협업이 힘들었다. GEM5에서는 BSD 라이센스를 사용하고 CPU mode, Execution Mode, Memory systems의 다양한 옵션을 주어 Flexibility, Modular simulation system을 지원한다. 2. Overall Goals Flexible modeling, Broad range of users, Wide avialability and utility 2...

Adaptive Memory Fusion: Towards Transparent, Agile Integration of Persistent Memory

Abstract PM의 필요성 -PM(Persistent Memory)는 시스템 업그레이드를 위한 이상적인 후보 -현재의 Enterprise System에 PM을 사용하는 것은 호환성 및 대규모 수정 측면에 큰 장벽 -DRAM과 같은 방식으로 사용할 수 있도록 Transparent하게 설계 문제점 -Big Data Application이 In Memory Computing을 수행하려면 대용량 메모리 필요 -하지만, 현재 DRAM을 계속 확장하는 것은 비용, 공간, 소모 전력의 벽에 부딪힌다. -ReRAM, STT-RAM 및 3D Xpoint 와 같은 PM모듈의 등장으로 DRAM과 유사한 성능을 제공할 수 있다. (Table 1) -Persistent적 특징을 사용하려면 Memory management, ..

반응형