반응형

개인 공부 38

NVMain An Architectural-Level Main Memory Simulator for Emerging Non-volatile Memories

Abstract NVM 기술이 Main Memory의 대체 가능한 기술로 부상함에 따라, 아키텍쳐 레벨에서의 performance, energy, reliability의 분석이 필요해졌다. NVmain이라고 칭하는 시뮬레이터는 DRAM, NVM 모두를 지원하며 설계를 할 수 있도록 지원한다. 1. Intro 최신 ITRS로드맵에서 현재 DRAM이 직면하고 있는 일부 문제에 대한 솔루션은 아직 존재하지 않는다. 또한 DRAM은 전력 소모량에서 많은 단점을 가지고 있다.(3D Stacked DRAM 개발이유) DRAM의 Refresh, stand-by power는 큰 전력 소모의 두가지 주요 요인이다. NVM의 본질적인 특성은 데이터가 손실(lost)되지 않는다는 점이다. 이는 데이터가 Refresh할 필요..

Basic Performance Measurements of the Intel Optane DC Persistent Memroy Module

Abstract NVM은 마침내 Intel Optane DC Persistent Memory의 출시로 상용화 되었다. Optane DC Memory는 Latency(346ns)이고, DRAM과 SSD 계층 사이에 위치한다. Memory Mode(or Cache Mode)에서 사용될 때 Memory Footprints가 작은 App에 대해서는 영향을 거의 미치지 않는다. 대신 큰 App에 대해서는 DRAM에 비해 속도가 다소 느려질 수 있지만, 더 많은 데이터를 메모리에 저장 할 수 있다. How to Use this Documnet Optane DC Memory에 대한 기본 특성이 필요하다면 Sec 3에 주목. 대량 메모리 사용하는 App 개발자는 Sec 4에 주목 File System, Storage ..

3-D Stacked Image Sensor With Deep Neural Network Computation

Abstract 이미지 센서에 DNN계산을 통합하여 전력 및 성능 절충점을 조사한다. Pixel Array, read-out circuits, memory, computing logic for DNN 의 3D stacked CMOS sensor인 Neurosensor의 설계를 제안한다. 분석에 따르면 DNN을 통합하면 Processing 및 Memory access Latency( 및 Energy)를 희생하여, Transmit Latency (및 Energy)가 감소한다. 따라서 특정 DNN 및 대역폭이 주어지면 Energy 효율을 최대화 하기위해 센서에서 계산해야하는 최적의 레이어 수가 존재한다. 보통 Sensor에 Memory를 통합하거나 Feature extraction layer만 구현하는 것이 ..

Deep Iterative Frame Interpolation for Full-frame Video Stabilization

Abstract Video stabilization is a fundamental and important technique for high quality video. Previously, most of the frame borders were cropped and a moderate level of distortion was introduced. In this paper, frame interpolation is used to reduce jitter between frames. The biggest advantage is that end-to-end training is possible with unsupervised learning. It runs in near real time (15fps). I..

Centos 7, gcc 버전 업데이트

현재 서버의 gcc version 확인[ryotta205@compasslab3 ~]$ gcc --versiongcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-44)Copyright (C) 2015 Free Software Foundation, Inc.This is free software; see the source for copying conditions. There is NOwarranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. 직접 gcc를 업데이트하기위해서는 번거롭고 컴파일, 종속성 문제를 해결해야 할 수 있기 때문에, Developer Toolset을 설치해서 지원하는 gcc version을..

Centos 7, SPEC2006 설치 - 1

sjp38.github.io/ko/post/spec_cpu2006_install/ 블로그 참조 https://github.com/SangJe/spec2006 github 참조 환경 Intel(R) Xeon(R) Gold 6226R CPU @ 2.90GHz x2 CentOS Linux release 7.9.2009 (Core) Linux 3.10.0-1160.el7.x86_64 gcc version 8.3.0 (GCC) (scl enable devtoolset-8) 소스코드 spec_cpu2006.iso를 연구실에서 구매후 설치를 준비한다. 벤치마크 소스와 컴파일, 수행, 검증을 위한 tool 프로그램들의 기본 바이너리 파일 및 소스가 존재하며 벤치마크 실행을 위한 규칙파일, 도큐먼트들이 존재한다. $ m..

LSP Collective Cross-Page Prefetching for NVM

Abstract -NVM은 DRAM에 비해 Row activation latency가 대략 10x 정도로 매우 크다. -따라서 미리 NVM의 Row를 정확하게 Open 한다음 적은 오버헤드로 Open된 Row에서 데이터 블록을 Prefetch할 수 있는 Collective cross-page prefetching을 제안한다. -Memory Access 패턴을 식별하고 Ladder stream prefetcher(LSP)를 제안한다. -Collective Prefetch Table는 Memory Queue의 상태에 따라 Prefetch를 추측적으로 스케쥴링하여 Prefetch Request로 인한 Demand Request와의 충돌을 피한다. Intro 문제점 -Optane DC PMM가 Memory Mo..

메모리 타이밍

Refresh : DRAM이 Idle일때 Memory cell을 이루고있는 Capacitor에서전하가 채워져 있는 상황(논리 1의 상태)을 유지하고 있을 때, 방전에 의하여 채워진 전하가 조금씩 소진되므로, 이를 보상하기 위하여 주기적으로 재충전 시키는 것. Precharge : Refresh가 Idle일때의 전하 방전을 보상하기 위한 주기적인 충전과정이라고 한다면, Precharge는 데이터 read시 감쇄되는 전하(destructive read)를 보상하기 위하여 read후 재충전하는 과정을 의미함. CAS(Columm Assress Strobe) Latency (tCL/tCAS): 줄여서 CAS Latency, 더욱 줄여 "CL" 이라 부르는 값. CAS 대기 시간. 명령이 메모리로 전송 된 후 응..

메모리 기초

SRAM = Static RAM 전원이 공급되면 데이터는 유지 DRAM = Dynamic RAM 만약 아무것도 하지않는다면 데이터 손실 SRAM: 6T per bit 일반적인 고속 CMOS 기술로 구현 DRAM: 1T per bit (+1 capacitor) Density에 최적화된 DRAM process DRAM의 Low-Level Organization은 SRAM과 유사하다. Read의 경우 매우 파괴(Destructive)적이며, Read에 의해 내용이 지워진다. Row buffer는 Read Data를 유지한다. - Row buffer의 Data를 DRAM Row라고 한다 - 종종 Page 라고 불리운다. (Virtual Memory의 Page와 혼동) - Block Read는 항상 Row buf..

Towards Efficient NVDIMM-based Heterogeneous Storage Hierarchy Management for Big Data Workloads

Abstract -NVDIMM 기반 아키텍처에 비추어 스토리지 데이터 관리의 솔루션을 제공 -특히 NVDIMM을 메모리버스에 배치함으로 발생하는 Bus Contention문제를 해결하기 위함 -Memory Traffic interferences사용으로 인한 부작용을 최소화 하기위해 NVDIMM-based Lazy Migration 을 소개 Intro 문제점 -Big data applications는 memory 와 storage 간의 I/O에 높은 성능을 요구 -보통 VMDK로(Virtual Machine Disks)로 사용되며, 여러 물리적 디바이스에 분산되어 있다. -NVDIMM 장치의 I/O 성능을 예측하기 어렵다.(분리된 I/O 경로가 아닌 DIMM 형식이므로 Memory Traffic도 고려해야..

반응형