반응형

공부/NPU 2

Quantization 이해를 위한 기본 개념

진행하는 프로젝트를 위해 양자화에 대한 기본 개념을 이해하고자 다음 글을 작성한다. 목차는 크게 하단과 같은 4가지로 구성하였다.[목차]-. 양자화란? + 사용 방법-. Uniform vs Non-uniform-. Symmetric vs Asymmetric-. PTQ, QAT 등 양자화 방법 양자화큰 집합의 입력값을 작은 집합으로 mapping하는 과정으로, 함수 매핑이 본질Quantization은 float 32 값을 int8 혹은 그보다 작은 집합으로 mapping하는 과정을 말한다. 즉, floating point 숫자를 int8/4형으로 변환한다.위와 같이 양자화를 하게 되면 기존 데이터 대비 정보 손실이 발생하여 기존 모델 대비 정확도가 떨어져, 모델별 정확도와 하드웨어 효율을 위해서는 데이터..

공부/NPU 2025.05.26

[개인 공부] Skid Buffer란?

두 줄 정리.stall 발생시 (수신측이 데이터 받을 준비가 안 된 경우), buffer 내부의 register가 데이터를 잠깐 저장.이후 데이터 받을 준비 됐을 때 전달.  1. 왜 스키드 버퍼인가?AXI 기반 설계에서는 데이터가 빠르게 처리되지만, 파이프라인상의 어느 한 부분에서 스톨(stall) 신호가 발생하면 데이터가 유실될 위험이 있습니다.문제 상황:조합 논리(Combinatorial Logic) vs. 레지스터드(Registered) 신호:파이프라인에서 스톨 신호가 조합 논리로 생성되면 타이밍 여유가 부족할 수 있습니다. 반면, 스톨 신호를 레지스터드 방식으로 처리하면 이전 단계에서는 이미 데이터를 넘겨버려서 데이터가 유실될 가능성이 생깁니다.스키드 버퍼의 역할:데이터 보존: 스톨 상황에서 입..

공부/NPU 2025.04.08
728x90
반응형